找回密码
 立即注册

微信扫码 , 快速开始

OpenAI o1预览模型推理能力达到理科博士生水准!

2024-9-14 10:38| 发布者: admin| 查看: 16| 评论: 0|来自: 驱动之家

摘要: 8月13日凌晨,OpenAI正式推出了OpenAI o1预览模型。 对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,其特点就是会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。 ... ...



8月13日凌晨,OpenAI正式推出了OpenAI o1预览模型。

对于复杂推理任务而言,新模型代表着人工智能能力的崭新水平,其特点就是会在回答之前花更多时间进行思考,就像人类思考解决问题的过程一样。


OpenAI曾解释过,2023年发布的GPT-4类似于高中生的智能水平,而GPT-5则是完成AI从“高中生跃升至博士”的成长,o1模型就是其中关键的一步。

根据测试,o1模型在国际数学奥林匹克的资格考试中,能够拿到83%的分数,而GPT-4o只能正确解决13%的问题。

而在编程能力比赛Codeforces中,o1模型拿到89%百分位的成绩,而GPT-4o只有11%。


OpenAI表示,根据测试,在下一个更新的版本中,AI在物理、化学和生物学的挑战性基准测试中,表现能够与博士生水平类似。

相较于GPT-4o等现有的大模型,OpenAI o1能够解决更加困难的推理问题,同时改善过往模型中存在的机制性缺陷。

比如在解答编程问题时也会更有条理,在着手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。


o1会花更多时间思考

在o1模型中,AI会不断试错并打磨答案,从而显著提高生成结果的准确率和质量。

OpenAI 宣布,ChatGPT订阅用户从9月12日起可以访问这两个新模型,o1-preview每周消息数量限制为30条,o1-mini则为50条。


【博士驿站】www.boshiyizhan.com为全国性博士人才流动就业服务平台,提供免费、开放的共享信息发布和交流。平台特别声明:线上内容(如有图片或视频亦包括在内)来自网络或会员发布,均已备注来源;本站资讯仅提供信息和存储服务。Notice: The content above (including the pictures and videos if any) is uploaded and posted by user of ASKAI, which is a social media platform focused on technology of CHATGPT and only provides information storage services.


路过

雷人

握手

鲜花

鸡蛋

最新评论

QQ|手机版|小黑屋|博士驿站:连接全球智慧,共创博士人才生态圈 ( 浙ICP备2023018861号-3 )平台提供新鲜、免费、开放、共享的科技前沿资讯、博士人才招聘信息和科技成果交流空间。 平台特别声明:线上内容(如有图片或视频亦包括在内)来自网络或会员发布,均已备注来源;本站资讯仅提供信息和存储服务。Notice: The content above (including the pictures and videos if any) is uploaded and posted by user , which is a social media platform and only provides information storage services.

GMT+8, 2024-9-21 01:43

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

返回顶部