美智库:DeepSeek带给AI界的影响
驻校技术师Sebastian Elbaum解释了DeepSeek如何能够媲美其他AI模型的表现,而训练成本却低得多的原因。“自相矛盾的是,DeepSeek令人印象深刻的部分成果很可能是由于中国工程师可用的资源有限,他们无法使用最强大的Nvidia硬件进行训练,这种限制促使他们在模型架构、训练程序和硬件管理方面进行了一系列巧妙的优化。其中有两项优化最为突出。首先是硬件的低阶程式设计以解决频宽的限制,其次是让模型自我改善。”
数字与网路空间政策资深研究员Kat Duffy认为,这些创新方法突显出美国在人工智能方面的弊端:美国创新环境的重点在于发展人工一般智能,并建立越来越大的模型,这与全球多数国家的需求并不一致。对他们来说,最大的兴趣是尽快抓住功能性人工智能的潜力,现有的芯片和开放模型可以在很大程度上实现这一目标。
美国越是强迫中国开发者在高度受限的环境中进行开发,就越有可能促使中国成为开发具有成本效益、节能的人工智能方法的全球领导者。对于许多政府和企业家来说,这些远比一直推动美国人工智能投资和创新优先顺序的“要么计算,要么破产”思维更有说服力。