想象一下这样一个世界: AI不仅能理解人类的推理,还能模仿人类的推理,像人脑一样无缝地解决问题。随着 OpenAI 宣布其最新的突破性 AI 模型O3,这一愿景离现实更近了一步。可以说,这是迈向超级智能领域的一次飞跃。下面就跟着小编来看一下o3模型的非凡之处吧~
12 月 20 日,OpenAI宣布推出 o3 系列模型,引发了行业的强烈震动。o3 是 OpenAI 今年早些时候发布的 o1 模型后续型号,其标语是“更接近 AGI”(通用人工智能)。
【图片来源于网络,侵删】
o3的能力,对比现在所有模型,几乎是降维打击。
首先,o3相比o1最突出的成绩,一是在顶尖程序员竞赛CodeForces中,分数超过2700,人类超过这个分数的目前只有不到200个,而 O1 的评分仅为 1891。o3完全粉碎了满血版o1!
【图片来源于网络,侵删】
在第二项测试 — ARC-AGI 中,o3 分数达到恐怖的 87.5%,超越过去所有模型!o1 的得分在 25% 到 32% 之间,o3 的最低成绩为 75.7%,最高成绩为 87.5%,超过了标志着达到人类水平的门槛 85%。
【图片来源于网络,侵删】
科普一下:ARC-AGI是一个评估人工通用智能抽象推理能力的挑战赛,旨在让AI展示一种具有基本推理能力的通用智能。
另一项测试是号称最难数学测试的EpochAI Frontier Math。在今年11月Epoch AI发布的数学基准Frontier Math上,o3准确率高达25.2%。
【图片来源于网络,侵删】
要知道,此前陶哲轩可认为这项测试能难住AI好几年。
o3这么牛,是不是已经实现了AGI?
尽管o3创造了记录,成为首个突破 ARC-AGI 基准测试的 AI 模型,但仍有不少人表示这并不代表o3实现了AGI。
ARC-AGI挑战赛组织者明确表示,他们不认为超越这个比赛基准是实现 AGI 的指标。
ARC 挑战赛组织者 Mike Knoop 在X社交媒体帖子中表示,即使 OpenAI 投入大量计算能力来计算非正式分数,o3 模型也未能解决 100 多个视觉拼图任务。
虽然 o3 并没有完全实现AGI,但正如它的标语“更接近AGI”,AGI的山顶,o3又向前迈了一大步。
因此,小编认为随着 O3 的发布,2025 年有望成为人工智能具有里程碑意义的一年。
人工智能高速发展将带来算力需求增加
在o3系列模型的发布之前,OpenAI 就曾暗示将开发自主代理“operator”。
这意味着AI能在没有人工干预的情况下管理复杂任务的系统,并有望彻底改变从医疗保健和金融到创意领域的各行各业,实现无数工作流程的自动化并重新定义生产力。
这些进步也将促使更多企业布局智算中心,推动相关产业链发展,以满足日益增长的算力需求。
同时,随着 o3 及 o3-mini 的发布,小编相信未来国内也会有更多的开源计划,而算力也将成为推动关键技术开发的重要支撑。
大家对这个新领域有什么看法?欢迎在评论区交流讨论哦~