论坛风格切换
 
  • 帖子
  • 日志
  • 用户
  • 版块
  • 群组
帖子
购买邀请后未收到邀请联系sdbeta@qq.com
  • 27阅读
  • 1回复

[业界新闻]号称“地球上最聪明的人工智能”,马斯克的 Grok 3 竟答不对 9.11 和 9.9 哪个大 [复制链接]

上一主题 下一主题
 

发帖
7651
今日发帖
最后登录
2025-02-22
只看楼主 倒序阅读 使用道具 楼主  发表于: 2025-02-19 13:30:31
  昨天马斯克及其xAI团队在直播中正式发布了Grok 3,此前马斯克通过持续的预热宣传,将外界对Grok3的期待值推向了前所未有的高度。马斯克称Grok 3为“地球上最聪明的人工智能”,然而其实际表现似乎对不起这个名号。 f}t8V% ^E  
]SmN}Iq1  
  在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。 ictV7)  
f.Y [2b  
  但Grok 3的实际测试表现却让人大跌眼镜。发布后,一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:“9.11与9.9哪个大?”遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为“天才不愿意回答简单问题”。 .%EYof  
r])V6 ^U  
  此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。 SU5O+;{`'  
pft-.1py  
  尽管在官方PPT中,Grok3在大模型竞技场Chatbot Arena中看似“遥遥领先”,但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。 !pZ<{|cH  
|->C I  
  马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。 \^1S:z  
Fs3 :NH  
  值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。 {2)).g  
离线卢一只

发帖
1944
今日发帖
最后登录
2025-02-23
只看该作者 沙发  发表于: 2025-02-19 17:53:50
Grok 3虽智能,也难辨9.11与9.9大小。