当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
消息称苹果 macOS 26 将不再支持部分旧款英特尔 CPU 机型,这背后原因有哪些?
不喜欢老婆找健身房男教练私教,是我太狭隘了吗?
柳州的债务,谁来还?用什么还?怎么还?
现在的年轻人为什么跟父母沟通不来了?
42 公里的马拉松已经非常极限了,为什么还会有上百公里的越野跑?
postgresql也很强大,为何在中国大陆,mysql成为主流,postgresql屈居二线呢?
vue + tsx 的开发体验能追得上 react+tsx么?
有人对sse(server sent events)了解的吗?
为什么年轻的肉体让人沉迷?
目前react的生态系统是什么情况,有没有比较公认的成熟的开发技术栈?
为什么现在的年轻人更容易觉得疲惫?
能否对比一下Claude Code和Gemini CLI,你的选择建议是?
为什么抖音上的姑娘都那么好看,现实中我怎么一个也见不着?
Chrome 浏览器设计的神细节有哪些?
公路车超过多少公斤就已经算很沉的了?
为什么中国的英语教育这么失败?
为什么都 2025 年了,还有那么多人宁可双持,也不愿意放弃安卓或非安卓手机?
如何看待 Rust 的应用前景?
在农村建房子的后悔了吗?
为什么广东话连“谁”字都说不出,却认为自己是古汉语?
作为一个腰细腿粗的女生什么感觉?
macOS 会在什么时间停止对 Intel 处理器的支持?
家里想搞个服务器,有什么好的建议方案吗?
冬天也要穿胸罩吗?
男的真的会把所有衣服从上到下都扔洗衣机吗?