OpenAI奥特曼承认站在历史错误一边

jsxw 中评资讯 09-01 15 0

　　中评社香港2月3日电／ChatGPT母公司OpenAI周六（1日）推出全新推理模型o3－mini，并在ChatGPT首次向所有用户免费提供推理模型，虽号称更便宜，但API定价仍高于　DeepSeek－R1，不过OpenAI执行长奥特曼最新坦承错误，要学习　DeepSeek将推理模型的思考过程公开，OpenAI的闭源策略令他们站到历史错误的一边，将重新思考OpenAI的开源策略，并承认自身领先优势已不如之前。

　　奥特曼也称赞DeepSeek是个非常好的模型，并称“我们将保持比往年更少的领先优势”。奥特曼对OpenAI闭源策略也反思并透露OpenAI正在讨论发布一些模型权重等。“我个人认为我们在这里站在了历史错误的一边，必须找出不同的开源策略，但并不是OpenAI的每个人都同意这种观点，这也不是我们目前的首要任务。”

　　奥特曼还说OpenAI将效仿DeepSeek的做法，“我们很快就会展示一个更有用、更详细的版本。感谢R1让我们有所更新”。

　　o3－mini的发布并没有分散DeepSeek的讨论度，半导体研究和谘询公司SemiAnalysis上周五（1月31日）出具最新报告揭开DeepSeek成功的关键因素，并进行推测称DeepSeek拥有至少5万块Hopper架构的GPU，且GPU投资已超过5亿美元，600万美元成本只包含预训练运行的GPU成本，不包括硬体本身研发和总体拥有成本（TCO）等重要部分。

　　半导体研究和谘询公司SemiAnalysis上周五（1月31日）出具最新报告，称DeepSeek拥有至少5万块Hopper架构的　GPU。

　　报告指出，DeepSeek的总伺服器资本支出约16亿美元（约527亿台币），营运此类集群成本高达9.44亿美元（约311亿台币）。DeepSeek用不到600万美元成本的说法有所错误，这类似于将产品物料清单的特定部分并将其归因为全部成本，预训练成本在总成本中只占很小的一部分。

　　报告也提到，DeepSeek在寻找人才方面也投入了大量资金。目前，该公司员工人数在150人左右，且正急速扩张中。该公司职位并没有被预先定义，会根据招聘人员灵活定义，且不考虑先前资历，非常注重能力和好奇心。DeepSeek会定期在北京大学和浙江大学等顶尖大学举办征才活动，许多员工都毕业于浙江大学。

　　DeepSeek　先前也为有前途的候选人提供超过130万美元（约4284万台币）年薪，这一薪资水平远高于国内大型科技公司以及大模型新创企业。