当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
代码:
求大神解答,为什么大家都不喜欢用docker?
女生真正的完美身材是什么样子?
为什么有些NAS用户弄那么多硬盘?
U 盘用什么文件系统好?
为什么幼儿园的超前教育被叫停?
170cm女生在日本算啥水平?
每次去国外,别人一眼就看出我是中国人,是中国人身上有什么特质吗?
鱼缸有没有简单的过滤配置搭配方式?
黄一鸣为什么敢承认孩子是王思聪的?
你认为这次伊以冲突,以色列这次干得漂亮吗?
既然C#等开源语言,为啥***le还要弄个基本上一模一样的Swift?
docker 框架项目占用的磁盘空间如何清除?
如何看待日本小学校园餐只有一小块鸡肉?
有个自闭症的孩子,该放弃吗?
你身边身材最好的女生是什么样?
34 岁教授王虹在北京大学开数学讲座,她或将成为首位获得菲尔兹奖的中国籍数学家,有多厉害?
有哪些小众的开源项目养活了一大批人?
你的择偶标准是怎么样的?
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
为什么有的女生喜欢穿紧身牛仔裤?
同事连续几天把孩子带来上班,你们有过这样的经历吗?
如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?
为什么中国防空反导系统才7年就从山寨到全面原创且超越了俄罗斯?
胸大的女孩会自卑 吗?