股票
代码
001266
电话咨询

189-1680-8200

Global
首页 新闻中心 企业动态 详情
2025-12-09
星空游戏官网-OpenAI官方数据:ChatGPT o3瞎编能力比o1高两倍

  【星空游戏官网科技消息】ChatGPT的性能还在持续进化。但用户很快发现这类AI有时会给出错误答案,甚至能一本正经地编造看似合理的内容。

  经过技术迭代,如今ChatGPT及其竞品已能提供部分信息来源,尤其在联网搜索场景中。不过很多人的使用习惯始终未变——坚持要求AI为每个结论标注有效链接,发现错误立即纠正。虽然未来更先进的模型可能解决"幻觉"问题,但当前最新发布的ChatGPT o3和o4-mini反而呈现出更明显的编造倾向,这成为AI发展路上耐人寻味的现象。

OpenAI官方数据:ChatGPT o3瞎编能力比o1高两倍

  OpenAI官方数据显示,在专门检测幻觉的PersonQA测试中,o4-mini准确率低于前代o1和o3,编造频率更是o1的三倍。而性能更强的o3虽然整体准确率提升,其编造概率却比o1高出两倍。研发团队坦言,即便为模型加入图像分析和联网检索能力,仍无法解释为何升级后的产品更容易"信口开河"。

  有趣的是,这些新模型确实展现出惊人潜力:通过照片定位拍摄地点,深度解析网页信息,甚至构建复杂的思维链条。但就像不受控的想象力,它们总会在推理过程中夹杂虚构内容。OpenAI工程师至今未能破解这个技术困局。

  实际使用中,o4-mini有时会过早给出结论,这或许暗示着信息加工过程中存在失真。可以预见的是,在未来相当长时间里,保持对AI输出的审慎核查仍是必要动作。毕竟在追求智能的道路上,真实与幻象往往只有一线之隔。

-星空游戏官网

获取方案
咨询
关注我们

电话咨询

189-1680-8200
在线咨询
获取方案

提交信息后,业务人员将尽快与您联系

* 请选择方案领域
电话咨询 在线咨询 免费方案
联系我们

用微信扫一扫,关注我们取得联系

18916808200 热线
sales@ 合作邮箱
tech@ 售后邮箱
hr@ 简历投递
我们的工作时间是周一至周五上午 9 时至晚上 6 时(不含公共节假日)。我们仅在工作时间接听您的来电。
若您在非工作时间发送微信消息,我们将在工作时间回复您。