当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
Node.js 熄火了吗?
86版西游记的女演员里,你觉得哪些特别漂亮?
Node.js是谁发明的?
国内的银行软件搞所谓的“安全键盘”是不是有什么大病?
都是研制核武器,美国为何只敢动伊朗,对朝鲜却畏首畏尾?
如何评价Electron?
27寸显示器有必要上4K吗?
很好用的压缩***软件有哪些?
买到烂尾楼到底该有多绝望?
为什么一直唱衰的php语言反而日渐活跃?
有哪些BI工具惊艳了你?
PHP和Node.js哪个更爽?
如何评价雷军?
为什么有的人喜欢带着 MacBook 去咖啡店或者书店上网,而不是 ThinkPad 之类的?
如今的Intel为什么连AMD都打不过?
有用 NAS 被联通以安全为由要求停止使用的吗?
为什么 Bun 选择了 Zig 以及 JSCore?
postgresql也很强大,为何在中国大陆,mysql成为主流,postgresql屈居二线呢?
《西西里美丽传说》女主角,在当时打扮这么高调,不觉得带给自己很多不便吗?如何理解她的心态?
电影《碟中谍》系列中哪一部最好?
为什么 WebStorm 这么好用还会有人去用 VSCode?
如何评价韩剧《鱿鱼游戏 3》(最终季》?
如何看待 Rust 的应用前景?
你认为 PC 上最好用的 PDF 阅读器是哪一种?
为什么软件公司很少用python开发web?
***剪辑软件有什么推荐的吗?
有哪些是你用上了mac才知道的事?
桂林米粉为什么走不出桂林?
下一代 Xbox 主机售价可能超过 1000 美元,对此你怎么看?值得入手吗?