
OpenAI发布o3-mini模型,回应DeepSeek挑战,或将改变开源策略

OpenAI于1月31日正式发布了全新推理模型o3-mini,并首次向免费用户开放推理模型访问权限。这是OpenAI推理系列中最新、成本效益最高的模型,已在ChatGPT和API中上线。此举被业内解读为对DeepSeek模型的回应,后者凭借其强大的推理能力和开放的思维链输出,对OpenAI构成了挑战。
OpenAI首席执行官Sam Altman在reddit问答中罕见承认OpenAI过去在开源方面的策略存在错误,并表示需要制定新的开源策略。这一表态暗示着OpenAI未来可能更多地拥抱开源,甚至公开其模型的完整思维链。此举与之前OpenAI隐藏模型推理过程的做法形成鲜明对比,这主要是为了防止竞争对手利用其模型的训练数据进行竞争性蒸馏。而DeepSeek的R1模型则对用户开放思维链输出,这或许促使OpenAI改变策略。
Altman对DeepSeek给予了积极评价,称其为“一个很好的模型”,并表示OpenAI将继续开发更好的模型,但领先优势会越来越小。他同时指出,受DeepSeek的启发,OpenAI可能更多地揭示其推理模型的“思考过程”,即展现模型的思维链(CoT)。OpenAI首席产品官Kevin Weil也表示,OpenAI正在努力展示更多模型的内部运作,并找到在公开思维链和防止竞争性蒸馏之间的平衡点。
在AIME 2024测试中,o3-mini在不同努力级别下展现了不同的准确率:低努力下准确率约为60%,与o1-mini相当;中等努力下准确率提升至79.6%,与o1模型相当;最高努力水平下准确率达到87.3%。相比之下,DeepSeek-R1模型在AIME 2024测试中的准确率为79.8%,在GPQA Diamond测试中的准确率为71.5%。
对于付费用户,o3-mini将替代o1-mini,并提升速率限制。ChatGPT Plus和Team用户(每月约20美元)的速率限制从每天50条提升到150条,ChatGPT Pro用户(每月200美元)可以无限制访问o3-mini。OpenAI此举一方面提升了自身模型的性能,另一方面也对竞争对手发出了信号,预示着未来大模型竞争将更加激烈,并可能朝着更加开放和透明的方向发展。 OpenAI此举被认为是其在面对DeepSeek等新兴竞争对手的挑战下,积极调整策略,以保持其在AI领域领先地位的重要一步。 这同时也是对整个AI行业发展趋势的积极回应,表明行业正在朝着更加开放、透明和注重模型可解释性的方向发展。
发表评论