[业界新闻]号称“地球上最聪明的人工智能”，马斯克的 Grok 3 竟答不对 9.11 和 9.9 哪个大 [复制链接]

上一主题下一主题查看指定楼层

离线长安一片月

UID: 331538

管理员

发帖: 8518

今日发帖

最后登录: 2025-05-24

只看楼主倒序阅读使用道具楼主发表于: 2025-02-19 13:30:31

自助获取论坛邀请码

　　昨天马斯克及其xAI团队在直播中正式发布了Grok 3，此前马斯克通过持续的预热宣传，将外界对Grok3的期待值推向了前所未有的高度。马斯克称Grok 3为“地球上最聪明的人工智能”，然而其实际表现似乎对不起这个名号。

　　在发布会上，马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型，并计划将其应用于SpaceX的火星任务计算，甚至预测未来三年内将实现诺贝尔奖级别的突破。

　　但Grok 3的实际测试表现却让人大跌眼镜。发布后，一些媒体测试了最新的Beta版Grok 3，并提出了那个经典的用来刁难大模型的问题：“9.11与9.9哪个大？”遗憾的是，号称目前最聪明的Grok 3，仍然无法正确回答这个问题，被网友戏称为“天才不愿意回答简单问题”。

　　此外，在xAI发布会直播中，在分析游戏《流放之路2》的职业与升华效果时，Grok 3也给出了大量错误答案，并且马斯克也没有看出这些明显的错误。

　　尽管在官方PPT中，Grok3在大模型竞技场Chatbot Arena中看似“遥遥领先”，但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。