当前位置: 首页 >
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 人气:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-22大家为什么会讨厌缩写?
- 2025-06-22Rust1.86才正式稳定trait的upcast,为什么在rust中这个特性实现如此复杂?
- 2025-06-22写业务的话,go是不是垃圾?
- 2025-06-2263 岁演员马景涛直播时突然晕倒、后脑勺磕地,合作方称其突发低血糖,为什么会这样?如何急救?
- 2025-06-22为什么任天堂在NS2上没有选择使用OLED屏幕以提升续航能力和显示效果?
- 2025-06-22Swift 和同时代的其他语言比起来怎么样?
- 2025-06-22各位都在用Docker跑些什么呢?
- 2025-06-22为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云?
- 2025-06-22请问27寸4K显示器哪个好呀?
- 2025-06-22苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
- 2025-06-22三只羊是不是被人做局了?
- 2025-06-22为什么很多技术都觉得前端很简单?
- 2025-06-22女婿不喜欢去丈母娘家的原因是什么?
- 2025-06-22360 集团周鸿袆努力拼了 4 年,最后反而跌了近 4000 亿,其原因是什么?
- 2025-06-22装了飞牛NAS,除了存资料看电影还能干什么?
- 2025-06-22男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
推荐产品
-
伊朗这次会崩溃灭亡吗?
本人地理控,爱看卫星地图 以色列有几个城市?特拉维夫,耶路撒 -
女生被踢裆也会很疼吗?
会的,6月8日那一天我在楼梯道那边跑,没注意看,小妹妹直接磕 -
为什么我感觉gemini 2.5 pro总是用力过猛?
Gemini写代码太规范了,老是喜欢篡改我的代码,还有喜欢加 -
小白如何理解 Rime 输入法的优秀?
我知道Rime相对出圈,但还是负责任地提一嘴。 Rime的
最新资讯