国产大模型:既需向上突破也要向下扎根

  中评社北京3月7日电/据科技日报报导,“请问您用DeepSeek吗?”

  “我用,我本身专业是计算机专业,我对人工智能有偏爱。”在3月4日举行的十四届全国人大三次会议的新闻发布会后,大会发言人娄勤俭面对现场记者采访时的这句回应火了。

  今年春节期间,国产大模型DeepSeek凭借低成本、高效能、强智能的应用体验给人们留下了深刻印象。今年的全国两会上,“国产大模型”“DeepSeek”也是被许多代表委员反复提及的高频词。

  近年来,随着我国人工智能大模型产业加速发展,越来越多的国产大模型表现惊艶。作为数字化时代的核心驱动力,人工智能正加速渗透进入国民经济的多个领域。在不断向上突破性能天花板的同时,国产大模型应如何扎根产业实践,为产业升级赋能,成为代表委员们热议的话题。

  垂直模型扎根产业土壤

  有问必答的快速响应、清晰明了的思考过程、全面翔实的参考资料……通过通用大模型,许多人开启了与人工智能的第一次“亲密接触”。作为人工智能领域的重要突破,通用大模型具备强大的语言理解和生成能力,能够为多个领域提供智能支撑。

  随着我国产业数字化进程不断加速,各行业对人工智能的需求也愈发精细化、专业化。传统的通用大模型在落地产业场景时,往往无法与具体业务精准结合,导致“水土不服”。在此背景下,专为产业细分需求打造的垂直模型应运而生,成为大模型技术落地产业应用的新趋势。

  “我们做大模型第一天就确定了‘1+N’的战略路径,即‘1个底座大模型+N个行业大模型’。我们结合通用底座、工具链和知识工程,拥有了‘建算力、理数据、训模型、落场景、保安全、精运营’的全套解决方案。”科大讯飞股份有限公司董事长刘庆峰代表认为,通用大模型底座的天花板正被不断打破,应用场景落地已进入红利兑现期,需要以更少成本、更低算力、更高效率推动落地。