OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-12
瑞银、花旗上调美股目标价:政策风险消退 财报季带来惊喜 传统基金“失血”不止,比特币化身“救星”!过去一年狂揽22%超额收益 荣耀前CEO赵明加盟智界汽车?知情人士:消息不实官方处理结果 卫龙美味午前涨逾6% 此前获中金给予目标价17.50港元是真的吗? 本周31只新基金来袭:锚定科创板、人工智能、医药等热门领域 钱晶、盛震山、李海、林清源、曲少杰等竞技后续反转 网传荣耀前CEO赵明加盟智界,知情人士:假消息 连亏5年,子公司又陷8亿元仲裁案,春兴精工如何化解“双重危机”? 小黄鸭德盈早盘涨超19% 近一个月股价累计涨逾七成记者时时跟进 拥抱“淡定牛”...反转来了 (成都世运会)国际世界运动会协会、成都世运会组委会、国际定向运动联合会的情况通报记者时时跟进 中信建投研报:医疗仪器行业拐点已至官方通报 淘宝闪购:66个非餐品牌月成交破千万是真的吗? 广汽将于8月19日发布星源增程技术后续来了 CRO指数盘中显著回调,成分股普遍走弱 特朗普对英特尔CEO态度软化,不再要求其辞职 CRO指数盘中显著回调,成分股普遍走弱实垂了 高端医疗影像项目,落地苏州 宏微科技20万股限制性股票将于8月14日上市流通实时报道 浙江华业2025年半年度拟每10股派发现金红利4元这么做真的好么? 丰山集团:2025年上半年归属于上市公司股东的净利润同比增长235.40%官方处理结果 博菲电气:2025年上半年归属于上市公司股东的净利润同比增长882.67%秒懂 丰山集团:2025年上半年归属于上市公司股东的净利润同比增长235.40%官方通报 奥比中光:2025年上半年归属于上市公司股东的净利润为60190103.28元官方已经证实 “8·11汇改”十年:人民币汇率弹性增强,双向波动成常态 南微医学上半年实现净利3.63亿元,同比增长17.04%官方通报 丰山集团:8月19日将召开2025年半年度业绩说明会 日久光电:2025年上半年归属于上市公司股东的净利润同比增长37.87% 300542,重大资产重组终止! 【公告汇总】8月11日上市公司股票异常波动一览后续会怎么发展 宏微科技20万股限制性股票将于8月14日上市流通 惠而浦:8月19日将召开2025年半年度业绩说明会又一个里程碑 FXGT:油价波动中的多重因素与市场前景实测是真的 南微医学上半年实现净利3.63亿元,同比增长17.04% 测绘股份:2025年上半年实现营业收入为223681196.54元官方通报 奥比中光:2025年上半年归属于上市公司股东的净利润为60190103.28元最新报道 礼来狂飙,诺华爆发,百济首进,全球畅销药TOP50变天!官方通报来了 东风集团股份前7个月汽车销量为约97.85万辆 同比下降约8.9%实时报道 消息称花旗CEO访问墨西哥,讨论子公司上市可能性是真的吗? 金嗓子发盈警 预期上半年溢利减少约37%反转来了 鼎亿集团投资授出合共4950万份购股权实测是真的 泰达生物附属医数精诚与深算院签署生态合作协议 日本日经225指数升破历史最高收盘水平 投资者对关税的担忧缓解 传默克集团拟发行40亿美元债券 为收购SpringWorks提供资金 银行业2025年8月月报:消费贷迎贴息,关注中报业绩官方处理结果 永安研究丨铂钯专题②:铂金供需透视是真的? Coreweave和Circle,两大美国“IPO妖股”将迎来财报检验,就在今天 百度新CFO兼任爱奇艺董事长!背后资本型财总再推赴港上市? 瑞浦兰钧公布中期业绩 实现毛利约8.29亿元同比增长177.8%反转来了

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章