OpenAI 宣布推出o3模型， AGI 是否已在眼前？ - BlinkNest-A website that introduces electronic products

想象一下这样一个世界： AI不仅能理解人类的推理，还能模仿人类的推理，像人脑一样无缝地解决问题。随着 OpenAI 宣布其最新的突破性 AI 模型O3，这一愿景离现实更近了一步。可以说，这是迈向超级智能领域的一次飞跃。下面就跟着小编来看一下o3模型的非凡之处吧~

12 月 20 日，OpenAI宣布推出 o3 系列模型，引发了行业的强烈震动。o3 是 OpenAI 今年早些时候发布的 o1 模型后续型号，其标语是“更接近 AGI”（通用人工智能）。

【图片来源于网络，侵删】

o3的能力，对比现在所有模型，几乎是降维打击。

首先，o3相比o1最突出的成绩，一是在顶尖程序员竞赛CodeForces中，分数超过2700，人类超过这个分数的目前只有不到200个，而 O1 的评分仅为 1891。o3完全粉碎了满血版o1！

【图片来源于网络，侵删】

在第二项测试 — ARC-AGI 中，o3 分数达到恐怖的 87.5%，超越过去所有模型！o1 的得分在 25% 到 32% 之间，o3 的最低成绩为 75.7%，最高成绩为 87.5%，超过了标志着达到人类水平的门槛 85%。

【图片来源于网络，侵删】

科普一下：ARC-AGI是一个评估人工通用智能抽象推理能力的挑战赛，旨在让AI展示一种具有基本推理能力的通用智能。

另一项测试是号称最难数学测试的EpochAI Frontier Math。在今年11月Epoch AI发布的数学基准Frontier Math上，o3准确率高达25.2%。

【图片来源于网络，侵删】

要知道，此前陶哲轩可认为这项测试能难住AI好几年。

尽管o3创造了记录，成为首个突破 ARC-AGI 基准测试的 AI 模型，但仍有不少人表示这并不代表o3实现了AGI。

ARC-AGI挑战赛组织者明确表示，他们不认为超越这个比赛基准是实现 AGI 的指标。

ARC 挑战赛组织者 Mike Knoop 在X社交媒体帖子中表示，即使 OpenAI 投入大量计算能力来计算非正式分数，o3 模型也未能解决 100 多个视觉拼图任务。

虽然 o3 并没有完全实现AGI，但正如它的标语“更接近AGI”，AGI的山顶，o3又向前迈了一大步。

因此，小编认为随着 O3 的发布，2025 年有望成为人工智能具有里程碑意义的一年。

在o3系列模型的发布之前，OpenAI 就曾暗示将开发自主代理“operator”。

这意味着AI能在没有人工干预的情况下管理复杂任务的系统，并有望彻底改变从医疗保健和金融到创意领域的各行各业，实现无数工作流程的自动化并重新定义生产力。

这些进步也将促使更多企业布局智算中心，推动相关产业链发展，以满足日益增长的算力需求。

同时，随着 o3 及 o3-mini 的发布，小编相信未来国内也会有更多的开源计划，而算力也将成为推动关键技术开发的重要支撑。

大家对这个新领域有什么看法？欢迎在评论区交流讨论哦~

Latest comments