如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

时间：2025-06-22 00:50:16来源：当前位置：当前位置：首页 >

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果，突出了一个政治正确，6款大模型，OpenAI的o3倒数第一，我当时看到的时候就觉得很奇怪，o3好歹也是曾经的一代王者，高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下，因为这道题除了o3，其他的国产模型都答对了。

这是第五题的原题，正确答案是A. - 1/2。

这是之前的第三方的测试结果，6个模型…。

如何看待机器之心重测高考数学全卷，Gemini夺冠，豆包DeepSeek并列第二？

上一篇 : 外国女生味道真的很大毛发很硬吗?

下一篇 : 如何看待继长城举报比亚迪之后，吉利首次公开支持长城，广汽也力挺吉利发言，奇瑞说价格战是饮鸩止渴？

相关文章：

{dede:myad name='右侧广告位'/}

如何评价首个女性友好的编程语言HerCode?

还是太复杂了，感觉不如Herlang ***s://gith...
2025-06-21阅读全文 >>
为什么中国很少有人使用linux？

秀一张桌面。从2006年fedora core 3开始，...
2025-06-21阅读全文 >>
新垣结衣怎么突然就老了？

88年的她其实2015年27岁就老了。非常符合27定律。 ...
2025-06-21阅读全文 >>
如何评价网传那尔那茜高考179分(含加分)考入上海戏剧学院***？

一举解决最近老在知乎飘的两个问题：①为什么现在的电影电视剧越...
2025-06-21阅读全文 >>
谁是对Mac有成见然后用完Mac后真香的？

我刚好相反，现在用的m4max的mbp，以前觉得mac续航很...
2025-06-21阅读全文 >>

养花知识本月排行

1为什么长得漂亮却没什么用?
海贼王为什么现在被全网黑?
ddns，仅ipv6访问，***s 高位端口号，需要ICP备案么？会被运营商封锁么？
如何评价网传那尔那茜高考179分(含加分)考入上海戏剧学院***？
如何评价鸿蒙NEXT的卓易通？
新手想要打好篮球，主要练运球还是投篮？
你为什么对kotlin失去好感?
《葫芦兄弟》中七个葫芦娃谁的能力在现代用处更大？
国内很多男性在非洲和当地女人恋爱是真的吗?
为什么抖音上的姑娘都那么好看，现实中我怎么一个也见不着？

{dede:myad name='右侧广告位'/}

养花知识精选

养花知识推荐