OpenAI正在发布一款名为o1的新模型,这是计划中的一系列"推理"模型中的第一个,这些模型经过训练,可以比人类更快地回答更复杂的问题。它将与o1-mini同时发布,后者是一个更小、更便宜的版本。没错,如果你对人工智能的传言很熟悉的话:这就是被炒得沸沸扬扬的草莓模型。
IEsD= ^d$e^cU 对于OpenAI来说,o1代表着它向类人人工智能的更广泛目标迈进了一步。更实际的是,它在编写代码和解决多步骤问题方面比以前的模型做得更好。但与GPT-4o相比,它的成本更高,速度更慢。OpenAI将这次发布的o1称为"预览版",以强调它的雏形。
?}Ptb&Vk( :<7>-+pa ChatGPT Plus和Team用户从今天开始可以访问o1-preview和o1-mini,而Enterprise和Edu用户将在下周初访问。开发者访问o1的费用非常昂贵:在API中,o1-preview每100万个输入令牌(即模型解析的文本块)收费15美元,每100万个输出令牌收费60美元。相比之下,GPT-4o的价格为每100万个输入词组5美元,每100万个输出词组15美元。
3UtXxL&L` wU3ica&[ OpenAI的研究负责人杰里-特沃瑞克(Jerry Tworek)告诉我,o1背后的训练与前代产品有本质区别,不过公司对具体细节含糊其辞。他说,o1"采用了全新的优化算法和专门为其定制的新训练数据集"。
3bL2fsn5 l#f]KLv4N_ OpenAI正在培训以前的GPT模型模仿训练数据中的模式。在使用o1时,OpenAI利用一种名为"强化学习"的技术训练模型自行解决问题,该技术通过奖惩来教导系统。然后,它使用"思维链"来处理查询,这与人类逐步解决问题的方式类似。
<?@46d?C ~map5@Kd OpenAI表示,由于采用了这种新的训练方法,模型应该会更加准确。"我们注意到,这个模型产生幻觉的情况减少了,"Tworek说。但问题依然存在。"我们不能说我们解决了幻觉问题"。这个新模型与GPT-4o不同之处主要在于,它能比前代模型更好地处理复杂问题,如编码和数学问题,同时还能解释自己的推理。
^aM/BS\ jP6G.aiO OpenAI的首席研究官鲍勃-麦格鲁(Bob McGrew)告诉我:"这个模型在解决AP数学考试方面绝对比我强,而我在大学里辅修的是数学。他说,OpenAI还用国际数学奥林匹克竞赛的资格考试对o1进行了测试,GPT-4o只正确解决了13%的问题,而o1则达到了83%。"
B-p5;h> !Kqj&y5 "我们不能说我们解决了幻觉问题"
?-v?SN# <