OpenAI奥特曼承认站在历史错误一边

  中评社香港2月3日电/ChatGPT母公司OpenAI周六(1日)推出全新推理模型o3-mini,并在ChatGPT首次向所有用户免费提供推理模型,虽号称更便宜,但API定价仍高于 DeepSeek-R1,不过OpenAI执行长奥特曼最新坦承错误,要学习 DeepSeek将推理模型的思考过程公开,OpenAI的闭源策略令他们站到历史错误的一边,将重新思考OpenAI的开源策略,并承认自身领先优势已不如之前。

  奥特曼也称赞DeepSeek是个非常好的模型,并称“我们将保持比往年更少的领先优势”。奥特曼对OpenAI闭源策略也反思并透露OpenAI正在讨论发布一些模型权重等。“我个人认为我们在这里站在了历史错误的一边,必须找出不同的开源策略,但并不是OpenAI的每个人都同意这种观点,这也不是我们目前的首要任务。”

  奥特曼还说OpenAI将效仿DeepSeek的做法,“我们很快就会展示一个更有用、更详细的版本。感谢R1让我们有所更新”。

  o3-mini的发布并没有分散DeepSeek的讨论度,半导体研究和谘询公司SemiAnalysis上周五(1月31日)出具最新报告揭开DeepSeek成功的关键因素,并进行推测称DeepSeek拥有至少5万块Hopper架构的GPU,且GPU投资已超过5亿美元,600万美元成本只包含预训练运行的GPU成本,不包括硬体本身研发和总体拥有成本(TCO)等重要部分。

  半导体研究和谘询公司SemiAnalysis上周五(1月31日)出具最新报告,称DeepSeek拥有至少5万块Hopper架构的 GPU。

  报告指出,DeepSeek的总伺服器资本支出约16亿美元(约527亿台币),营运此类集群成本高达9.44亿美元(约311亿台币)。DeepSeek用不到600万美元成本的说法有所错误,这类似于将产品物料清单的特定部分并将其归因为全部成本,预训练成本在总成本中只占很小的一部分。

  报告也提到,DeepSeek在寻找人才方面也投入了大量资金。目前,该公司员工人数在150人左右,且正急速扩张中。该公司职位并没有被预先定义,会根据招聘人员灵活定义,且不考虑先前资历,非常注重能力和好奇心。DeepSeek会定期在北京大学和浙江大学等顶尖大学举办征才活动,许多员工都毕业于浙江大学。

  DeepSeek 先前也为有前途的候选人提供超过130万美元(约4284万台币)年薪,这一薪资水平远高于国内大型科技公司以及大模型新创企业。