美智库:DeepSeek带给AI界的影响

  中评社香港2月7日电(记者 郭至君)最近一段时间,中国AI公司推出DeepSeek在全世界掀起了AI风暴,重创美国科技股,让许多研究人员和投资人目瞪口呆,虽然DeepSeek的某些论断仍有许多不确定性,但其最新型号的效能可与ChatGPT媲美,而开发成本却似乎只有它的一小部分。美国市场担心,如果主要使用较不先进的半导体的中国新兴公司能够模仿硅谷巨头的能力,那么不仅Nvidia的价值被高估,整个美国的人工智能产业也会被高估。美国外交关系协会(CFR)的几位研究员日前对此进行了评析。

  驻校技术师Sebastian Elbaum解释了DeepSeek如何能够媲美其他AI模型的表现,而训练成本却低得多的原因。“自相矛盾的是,DeepSeek令人印象深刻的部分成果很可能是由于中国工程师可用的资源有限,他们无法使用最强大的Nvidia硬件进行训练,这种限制促使他们在模型架构、训练程序和硬件管理方面进行了一系列巧妙的优化。其中有两项优化最为突出。首先是硬件的低阶程式设计以解决频宽的限制,其次是让模型自我改善。”

  数字与网路空间政策资深研究员Kat Duffy认为,这些创新方法突显出美国在人工智能方面的弊端:美国创新环境的重点在于发展人工一般智能,并建立越来越大的模型,这与全球多数国家的需求并不一致。对他们来说,最大的兴趣是尽快抓住功能性人工智能的潜力,现有的芯片和开放模型可以在很大程度上实现这一目标。

  美国越是强迫中国开发者在高度受限的环境中进行开发,就越有可能促使中国成为开发具有成本效益、节能的人工智能方法的全球领导者。对于许多政府和企业家来说,这些远比一直推动美国人工智能投资和创新优先顺序的“要么计算,要么破产”思维更有说服力。   国际经济学资深研究员Sebastian Mallaby注意到AI研究人员的热情:DeepSeek模型引起了科学家们的兴奋,它在推理问题上的训练方式也令人振奋,而推理问题本身就是模型产生的。到目前为止,缺乏好的训练素材一直被认为是进步的瓶颈,现在这个瓶颈可能已经解决了。

  新兴科技与国家安全讲座教授兼数字与网路空间政策计划主任Adam Segal说,中国人对DeepSeek的民族自豪感相当高,一些著名的科技高管也赞扬该公司是面对美国的出口管制,达成中国创意和创新的象征。但对于取得晶片和运算能力对中国的科技发展轨迹意味着什么,仍存在长期的疑虑。

  技术与创新高级研究员Michael C.Horowitz认为,DeepSeek的成就表明,美国在人工智能领域的优势难以保证:尽管美国公司与中国同行相比仍处于领先地位,但基于我们目前所知,DeepSeek能够在现有模型(包括开源模型和OpenAI等封闭模型的输出)的基础上发展,说明这一代人工智能模型的先发优势可能有限。作为一种通用技术,全球各地都有强大的经济诱因推动其发展,因此在人工智能领域出现激烈竞争,或者中国人工智能公司试图以创新来绕过对其获取芯片的限制,也就不足为奇了。毕竟,出口管制并非万应灵丹,它们通常只是为某一方争取时间,透过投资扩大技术领导地位。

  美国的出口管制有多脆弱?亚洲研究资深研究员、中国战略倡议主任Rush Doshi列出了这个问题的竞争性答案:有两种观点。第一派是轻描淡写派,他们认为DeepSeek依靠的是无法公开承认的先进图形处理单元(GPU)的秘密供应。这个阵营认为,出口管制已经并将继续产生影响,因为未来的应用将需要更强大的运算能力。第二个群体是高赞者们,他们认为DeepSeek的模式在技术上是创新的,其成就显示了应付稀缺计算能力的能力。他们认为美国的出口管制并不如表面看来那么有效,因为DeepSeek不是罔顾管制取得GPU,就是绕过管制进行创新,也可能两者兼具。在这种观点下,AI是一种没有“护栏”的商品,因此出口管制是一个错误。   说了这么多,我们还有很多事情不知道。DeepSeek的创新非常重要,但现在就说美国的出口管制应该被推翻或削弱,未免言之过早。DeepSeek带来的挑战并非零和竞赛,而是对系统应变能力的考验。   中评社香港2月7日电(记者 郭至君)最近一段时间,中国AI公司推出DeepSeek在全世界掀起了AI风暴,重创美国科技股,让许多研究人员和投资人目瞪口呆,虽然DeepSeek的某些论断仍有许多不确定性,但其最新型号的效能可与ChatGPT媲美,而开发成本却似乎只有它的一小部分。美国市场担心,如果主要使用较不先进的半导体的中国新兴公司能够模仿硅谷巨头的能力,那么不仅Nvidia的价值被高估,整个美国的人工智能产业也会被高估。美国外交关系协会(CFR)的几位研究员日前对此进行了评析。

  驻校技术师Sebastian Elbaum解释了DeepSeek如何能够媲美其他AI模型的表现,而训练成本却低得多的原因。“自相矛盾的是,DeepSeek令人印象深刻的部分成果很可能是由于中国工程师可用的资源有限,他们无法使用最强大的Nvidia硬件进行训练,这种限制促使他们在模型架构、训练程序和硬件管理方面进行了一系列巧妙的优化。其中有两项优化最为突出。首先是硬件的低阶程式设计以解决频宽的限制,其次是让模型自我改善。”

  数字与网路空间政策资深研究员Kat Duffy认为,这些创新方法突显出美国在人工智能方面的弊端:美国创新环境的重点在于发展人工一般智能,并建立越来越大的模型,这与全球多数国家的需求并不一致。对他们来说,最大的兴趣是尽快抓住功能性人工智能的潜力,现有的芯片和开放模型可以在很大程度上实现这一目标。

  美国越是强迫中国开发者在高度受限的环境中进行开发,就越有可能促使中国成为开发具有成本效益、节能的人工智能方法的全球领导者。对于许多政府和企业家来说,这些远比一直推动美国人工智能投资和创新优先顺序的“要么计算,要么破产”思维更有说服力。