立即注册  找回密码
 立即注册
CeraNetworksBGVM服务器主机交流会员请立即修改密码Sharktech防护
查看: 55|回复: 6

deepseek也没说的那么厉害

[复制链接]

deepseek也没说的那么厉害

[复制链接]

4

主题

8

回帖

42

积分

新手上路

积分
42
扛麦郎

4

主题

8

回帖

42

积分

新手上路

积分
42
2025-2-3 10:37:14 | 显示全部楼层 |阅读模式
24点游戏:12 12 11 3
就这个一眼就知道答案的24点,deepseek思考了五分钟,打了一大版的草稿,最后得出结论:无解。
看网上有人测试拿来做2023年高考数学题考了142分,目前看有点水分,各位大佬觉得如何
回复

使用道具 举报

186

主题

2371

回帖

6258

积分

论坛元老

积分
6258
iiii.im

186

主题

2371

回帖

6258

积分

论坛元老

积分
6258
2025-2-3 10:41:37 | 显示全部楼层
我也用了几天,还是不如gpt
回复

使用道具 举报

43

主题

252

回帖

1133

积分

金牌会员

积分
1133
yabs

43

主题

252

回帖

1133

积分

金牌会员

积分
1133
2025-2-3 10:42:22 | 显示全部楼层
人家那么多权威评比不看,自己拿几个案例有啥用
日常用没啥问题,反正我用免费的openai和deepseek没感觉太大区别
付费的没用过
回复

使用道具 举报

3

主题

16

回帖

73

积分

注册会员

积分
73
Google执行董事

3

主题

16

回帖

73

积分

注册会员

积分
73
2025-2-3 10:48:31 | 显示全部楼层
乐了,自己看看你家GPT o1,(12−3)×(12/11)=24
回复

使用道具 举报

3

主题

16

回帖

73

积分

注册会员

积分
73
Google执行董事

3

主题

16

回帖

73

积分

注册会员

积分
73
2025-2-3 10:53:39 | 显示全部楼层
散了吧,这蠢货鉴定为纯黑子,实测R1思考一次107秒就能解出来
回复

使用道具 举报

252

主题

1153

回帖

4514

积分

论坛元老

积分
4514
奧巴马

252

主题

1153

回帖

4514

积分

论坛元老

积分
4514
2025-2-3 10:57:14 | 显示全部楼层
问一些rust 代码问题deep都答不上来的。感觉deep的推理很弱。只要是网上没有的答案!永远答不出来!
回复

使用道具 举报

0

主题

256

回帖

706

积分

高级会员

积分
706
pykane

0

主题

256

回帖

706

积分

高级会员

积分
706
2025-2-3 10:59:38 | 显示全部楼层
这种例子意义不在在。
之前 试4o 和 V3.
4o 连 9.9 和 9.11 谁大都能算错。

所有的AI都不是完美的,他们的答案,都是有一定随机性。
关键在于你在平时使用着,谁帮助你最大。这才是最重要的。
如果你觉得GPT.能帮你,你就用GPT就行了。
AI就是个工具。
DS最大的功破案率是把GPT 价格打下来,这还不够么?
如果真的那么烂。GPT 没必要有啥反应。有反应也说明,打到痛点了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|HS2V主机综合交流论坛

GMT+8, 2025-2-24 07:48 , Processed in 0.020173 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表