12月5号凌晨,OpenAI首席执行官Sam Altman宣布,从太平洋时间明天上午10点开始,将进行为期12天的OpenAI活动。大家都在猜测,但有两个共识,满血o1、Sora是肯定包括在里面的。

在每个工作日,都会有一个直播,包括最新技术或产品演示,有些是重要的发布,有些是小惊喜。

image-20241206161435618

已经有网友预测OpenAI要分享的内容,第一天,发布文生视频模型Sora;第二天,为ChatGPT引入一个圣诞老人风格的语音,增添节日气氛;第三天,增强ChatGPT的高级语音模式,增加视觉功能;

第四天,向免费用户发布o1-preview,扩大高级推理模型的使用范围;第五天,展示将在2025年一月推出的AI Agent;第六天,发布GPT-4o图像;第七天,发布新的开发者工具;

第八天,展示新的文生图模型;第九天,发布下一个GPT模型,更大的上下文窗口;第十天,发布辩论游戏,教机器辩论简单的问题;第十一天,发布Microscope,这是一个神经网络模型的可视化集合;第十二天,将高级语音模式的使用时间增加到每天20小时。

image-20241206161450573

OpenAI确认了稍早一些网传的消息,正式推出名为ChatGPT Pro的套餐,每月订阅收费200美元。OpenAI称,该套餐的订阅用户可以大规模访问OpenAI旗下最佳的模型和工具,包括无限制访问OpenAI最智能的模型 OpenAI o1以及同系列较小模型o1-mini、GPT-4o、类人的ChatGPT高级语音模式Advanced Voice。

此外,ChatGPT Pro的套餐中还可以包括名为o1 pro mode的新o1版本,也是ChatGPT Pro独有的o1版本。OpenAI称,这个新版本使用更多的计算,能更深入地思考,并为最困难的问题提供更好的答案。希望未来为ChatGPT Pro添加更强大的计算密集型生产力功能。

Altman在社交媒体发帖介绍,OpenAI本周四有两个新动作,一是在ChatGPT Plus套餐中纳入了o1,每月收费20美元,二是推出每月收费200美元的ChatGPT Pro,它可以让订阅者无限使用模型、甚至时更智能的o1。

image-20241206161618232

OpenAI认为,ChatGPT Pro为研究人员、工程师和其他每天使用研究级智能的个人提供了一种提高他们生产力的新方式,该方式让他们能处于人工智能(AI)进步的前沿。

OpenAI特别介绍了o1 pro mode,称ChatGPT Pro提供了OpenAI“最智能模型的一个版本”,“该模型可以思考更长时间,从而获得最可靠的回应。”在外部专家测试人员的评估中,o1 pro mode可以产生更可靠、更准确、更全面的回应,尤其是在数据科学、编程和案例法分析等领域。

下图显示,在数学、科学和编码等具有挑战性的机器学习(ML)基准测试中,o1 pro mode的表现均胜过o1 和 o1-preview。在数学方面,o1 pro mode得分86,o1 和 o1-preview分别为78和50,在编码方面,o1 pro mode得分90,o1 和 o1-preview分别为89和62,在问答博士级别的科学问题方面,o1 pro mode得分79,后两者分别为76和74。

img

为了突出o1 pro mode的主要优势——可靠性更高,OpenAI还提高了评估门槛,要求只有在四次尝试中四次全部能够正确回答问题、而不是仅一次答对时,才能算作模型解决了问题。即使在这种高标准要求下,o1 pro mode的表现也明显强于o1 和 o1-preview。

下图可见,在以上四次答问都必须正确的标准下,o1 pro mode相比o1 和 o1-preview的优势更大。数学方面,o1 pro mode得分80,o1 和 o1-preview分别为67和37,在编码方面,o1 pro mode得分75,o1 和 o1-preview分别为64和26,在问答博士级别的科学问题方面,o1 pro mode得分74,后两者分别为67和58。

img