「地球上最聪明人工智能」Grok 3 答不对 9.11 和 9.9 谁大:马斯克回应
北京时间 2 月 20 日消息,在 xAI 旗下号称「地球上最聪明人工智能」Grok 3 发布后,一些媒体测试了最新的 Beta 版 Grok 3,并提出了经典的用来刁难大模型的问题:「9.11 与 9.9 哪个大?」遗憾的是,号称目前最聪明的 Grok 3,仍然无法正确回答这个问题,被网友戏称为「天才不愿意回答简单问题」。
不过对此马斯克并不以为然,其公开回应称,当前的 Grok 3 仅是测试版,这个阶段错误越多越好,而完整版将在未来几个月推出,并邀请用户反馈使用问题。
也有舆论认为,尽管在官方 PPT 中,Grok3 在大模型竞技场 Chatbot Arena 中看似「遥遥领先」,但实际上其与 DeepSeek R1 和 GPT4.0 的差距仅为 1% 到 2%。
发布会上,马斯克宣称 Grok 3 在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于 SpaceX 的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。(来源:cnBeta)