美智库:DeepSeek带给AI界的影响
驻校技术师Sebastian Elbaum解释了DeepSeek如何能够媲美其他AI模型的表现,而训练成本却低得多的原因。“自相矛盾的是,DeepSeek令人印象深刻的部分成果很可能是由于中国工程师可用的资源有限,他们无法使用最强大的Nvidia硬件进行训练,这种限制促使他们在模型架构、训练程序和硬件管理方面进行了一系列巧妙的优化。其中有两项优化最为突出。首先是硬件的低阶程式设计以解决频宽的限制,其次是让模型自我改善。”
数字与网路空间政策资深研究员Kat Duffy认为,这些创新方法突显出美国在人工智能方面的弊端:美国创新环境的重点在于发展人工一般智能,并建立越来越大的模型,这与全球多数国家的需求并不一致。对他们来说,最大的兴趣是尽快抓住功能性人工智能的潜力,现有的芯片和开放模型可以在很大程度上实现这一目标。
美国越是强迫中国开发者在高度受限的环境中进行开发,就越有可能促使中国成为开发具有成本效益、节能的人工智能方法的全球领导者。对于许多政府和企业家来说,这些远比一直推动美国人工智能投资和创新优先顺序的“要么计算,要么破产”思维更有说服力。
新兴科技与国家安全讲座教授兼数字与网路空间政策计划主任Adam Segal说,中国人对DeepSeek的民族自豪感相当高,一些著名的科技高管也赞扬该公司是面对美国的出口管制,达成中国创意和创新的象征。但对于取得晶片和运算能力对中国的科技发展轨迹意味着什么,仍存在长期的疑虑。
技术与创新高级研究员Michael C.Horowitz认为,DeepSeek的成就表明,美国在人工智能领域的优势难以保证:尽管美国公司与中国同行相比仍处于领先地位,但基于我们目前所知,DeepSeek能够在现有模型(包括开源模型和OpenAI等封闭模型的输出)的基础上发展,说明这一代人工智能模型的先发优势可能有限。作为一种通用技术,全球各地都有强大的经济诱因推动其发展,因此在人工智能领域出现激烈竞争,或者中国人工智能公司试图以创新来绕过对其获取芯片的限制,也就不足为奇了。毕竟,出口管制并非万应灵丹,它们通常只是为某一方争取时间,透过投资扩大技术领导地位。
美国的出口管制有多脆弱?亚洲研究资深研究员、中国战略倡议主任Rush Doshi列出了这个问题的竞争性答案:有两种观点。第一派是轻描淡写派,他们认为DeepSeek依靠的是无法公开承认的先进图形处理单元(GPU)的秘密供应。这个阵营认为,出口管制已经并将继续产生影响,因为未来的应用将需要更强大的运算能力。第二个群体是高赞者们,他们认为DeepSeek的模式在技术上是创新的,其成就显示了应付稀缺计算能力的能力。他们认为美国的出口管制并不如表面看来那么有效,因为DeepSeek不是罔顾管制取得GPU,就是绕过管制进行创新,也可能两者兼具。在这种观点下,AI是一种没有“护栏”的商品,因此出口管制是一个错误。
驻校技术师Sebastian Elbaum解释了DeepSeek如何能够媲美其他AI模型的表现,而训练成本却低得多的原因。“自相矛盾的是,DeepSeek令人印象深刻的部分成果很可能是由于中国工程师可用的资源有限,他们无法使用最强大的Nvidia硬件进行训练,这种限制促使他们在模型架构、训练程序和硬件管理方面进行了一系列巧妙的优化。其中有两项优化最为突出。首先是硬件的低阶程式设计以解决频宽的限制,其次是让模型自我改善。”
数字与网路空间政策资深研究员Kat Duffy认为,这些创新方法突显出美国在人工智能方面的弊端:美国创新环境的重点在于发展人工一般智能,并建立越来越大的模型,这与全球多数国家的需求并不一致。对他们来说,最大的兴趣是尽快抓住功能性人工智能的潜力,现有的芯片和开放模型可以在很大程度上实现这一目标。
美国越是强迫中国开发者在高度受限的环境中进行开发,就越有可能促使中国成为开发具有成本效益、节能的人工智能方法的全球领导者。对于许多政府和企业家来说,这些远比一直推动美国人工智能投资和创新优先顺序的“要么计算,要么破产”思维更有说服力。