美智库:DeepSeek带给AI界的影响

  中评社香港2月7日电(记者 郭至君)最近一段时间,中国AI公司推出DeepSeek在全世界掀起了AI风暴,重创美国科技股,让许多研究人员和投资人目瞪口呆,虽然DeepSeek的某些论断仍有许多不确定性,但其最新型号的效能可与ChatGPT媲美,而开发成本却似乎只有它的一小部分。美国市场担心,如果主要使用较不先进的半导体的中国新兴公司能够模仿硅谷巨头的能力,那么不仅Nvidia的价值被高估,整个美国的人工智能产业也会被高估。美国外交关系协会(CFR)的几位研究员日前对此进行了评析。

  驻校技术师Sebastian Elbaum解释了DeepSeek如何能够媲美其他AI模型的表现,而训练成本却低得多的原因。“自相矛盾的是,DeepSeek令人印象深刻的部分成果很可能是由于中国工程师可用的资源有限,他们无法使用最强大的Nvidia硬件进行训练,这种限制促使他们在模型架构、训练程序和硬件管理方面进行了一系列巧妙的优化。其中有两项优化最为突出。首先是硬件的低阶程式设计以解决频宽的限制,其次是让模型自我改善。”

  数字与网路空间政策资深研究员Kat Duffy认为,这些创新方法突显出美国在人工智能方面的弊端:美国创新环境的重点在于发展人工一般智能,并建立越来越大的模型,这与全球多数国家的需求并不一致。对他们来说,最大的兴趣是尽快抓住功能性人工智能的潜力,现有的芯片和开放模型可以在很大程度上实现这一目标。

  美国越是强迫中国开发者在高度受限的环境中进行开发,就越有可能促使中国成为开发具有成本效益、节能的人工智能方法的全球领导者。对于许多政府和企业家来说,这些远比一直推动美国人工智能投资和创新优先顺序的“要么计算,要么破产”思维更有说服力。