大模型|从拼参数走向拼应用
大模型“飞入寻常百姓家”,对用户意味着什么?对国产大模型企业又意味着什么?多位专家表示,“多模之战”正从拼参数走向拼应用,能建立起真实用户调用和模型迭代之间的“飞轮效应”,有利于真正服务国人。
首批8家获批,上海占据3席
昨天,首批国产大模型产品获批面向用户开放服务,包括商汤科技“商量”、百度“文心一言”、智谱AI“智谱清言”等。
百度最早于昨天凌晨宣布“文心一言”向全社会开放的消息,意味着用户无需内测邀请码,就能直接体验相关服务。与3月16日最早开启的内测版本相比,目前“文心一言”已迭代到3.5版本。“即使与3.0版本相比,新版本的训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%。”一位百度内部人士透露。
在首批8家通过《生成式人工智能服务管理暂行办法》备案的大模型公司中,记者注意到,上海地区占据3席,分别是MiniMax的“ABAB”、上海人工智能实验室的书生通用大模型、商汤的“商量”。其中,“商量”于今年4月推出,是国内最早的基于千亿参数大语言模型之一,在向C端开放之前,其已在金融、医疗、汽车、地产、能源、传媒、工业制造等B端行业有了不同程度的落地应用。另两家大模型公司也都具备极强的技术实力。书生通用大模型体系由上海人工智能实验室发布,其中“书生·浦语”同样是千亿级参数的大语言模型。而MiniMax则是“新面孔”,是2021年12月在沪成立的一家大模型初创公司,今年6月刚刚获得超2.5亿美元的A轮融资,此次其自研的通用大模型“ABAB”获批面世。
北京地区除了百度外,抖音的“云雀”、百川智能的“百川”、智谱华章旗下的“智谱清言”以及中科院旗下的“紫东太初”也同样获批。有消息称,广东、安徽等省市的3家大模型公司也将很快面世。
“多模大战”将迎来应用层竞争
国产大模型“批量上市”,意味着“多模大战”正从上一阶段的“生出来”,走向“用起来”的新阶段。