2025-04-24 14:45来源:本站
OpenAI周四向付费用户发布了迄今为止最先进的人工智能模型01。这次发布拉开了该公司“12天的OpenAI”活动的序幕,这是为了庆祝节日而连续发布的12个版本。
OpenAI吹捧了o1的“复杂推理”能力,并在周四宣布无限制使用该模型,每月费用为200美元。在该公司发布的展示该模型优势的视频中,一名用户上传了一张木制鸟舍的照片,并向该模型咨询如何建造一个类似的鸟舍。这个模型“思考”了很短的一段时间,然后吐出了表面上看起来是一套全面的指令。
仔细检查发现这些说明几乎毫无用处。人工智能以英寸为单位测量完成任务所需的油漆、胶水和密封剂的数量。它只给出了鸟舍前面板的尺寸,没有其他的。它建议将一张砂纸切割成另一组尺寸,没有明显的原因。在指令列表的单独部分,它说“确切的尺寸如下……”,然后没有给出确切的尺寸。
“你会从图片和文字中了解到建造鸟舍的信息,这有点违背了人工智能工具的全部目的,”英国行业组织木匠协会(Institute of Carpenters)的负责人詹姆斯·菲勒斯(James Filus)在一封电子邮件中说。他指出,材料清单上包括钉子,但所需工具清单上不包括锤子,而且建造一个简单的鸟舍的成本“远不及”2001年估计的20-50美元。“简单地说‘安装一个小铰链’并不能真正涵盖设计中最复杂的部分,”他补充说,他指的是视频的另一部分,该部分旨在解释如何在鸟舍上增加一个开放的屋顶。
OpenAI没有立即回应置评请求。
这只是人工智能产品演示与预期目的背道而驰的最新例子。去年,一个人工智能辅助搜索工具的b谷歌广告错误地说,詹姆斯·韦伯望远镜发现了一个它没有发现的东西,这一失言导致该公司的股价暴跌。最近,一个类似谷歌工具的更新版本告诉早期用户,吃石头是安全的,他们可以用胶水把奶酪粘在披萨上。
OpenAI的o1是迄今为止最强大的模型,根据公开基准,它采用了与ChatGPT不同的方法来回答问题。从本质上讲,它仍然是一个非常先进的下一个单词预测器,使用机器学习对来自互联网和其他地方的数十亿个单词的文本进行训练。但是,它不是根据提示立即吐出单词,而是使用一种称为“思维链”推理的技术,本质上是在幕后“思考”一个答案一段时间,然后才给出答案。这种技术通常比让模型反射性地吐出答案产生更准确的答案,OpenAI吹捧了01的推理能力——尤其是在数学和编码方面。OpenAI在9月份发布了该模型的预览版,同时发布的数据显示,该模型可以准确回答78%的博士级科学问题。
但很明显,一些基本的逻辑错误仍然会被忽略。