大模型｜从拼参数走向拼应用

jsxw 中评资讯 09-01 21 0

　　中评社北京9月1日电／据新华社报导，大模型的落地应用迎来关键节点。首批国产大模型产品昨天获批面向全社会公众开放服务，其中上海3家、北京5家率先上线，这意味着国产大模型从上一阶段的“出生潮”向新一阶段的“应用潮”迈出重要一步。

　　大模型“飞入寻常百姓家”，对用户意味着什么？对国产大模型企业又意味着什么？多位专家表示，“多模之战”正从拼参数走向拼应用，能建立起真实用户调用和模型迭代之间的“飞轮效应”，有利于真正服务国人。

　　首批8家获批，上海占据3席

　　昨天，首批国产大模型产品获批面向用户开放服务，包括商汤科技“商量”、百度“文心一言”、智谱AI“智谱清言”等。

　　百度最早于昨天凌晨宣布“文心一言”向全社会开放的消息，意味着用户无需内测邀请码，就能直接体验相关服务。与3月16日最早开启的内测版本相比，目前“文心一言”已迭代到3.5版本。“即使与3.0版本相比，新版本的训练速度提升了2倍，推理速度提升了17倍，模型效果累计提升超过50%。”一位百度内部人士透露。

　　在首批8家通过《生成式人工智能服务管理暂行办法》备案的大模型公司中，记者注意到，上海地区占据3席，分别是MiniMax的“ABAB”、上海人工智能实验室的书生通用大模型、商汤的“商量”。其中，“商量”于今年4月推出，是国内最早的基于千亿参数大语言模型之一，在向C端开放之前，其已在金融、医疗、汽车、地产、能源、传媒、工业制造等B端行业有了不同程度的落地应用。另两家大模型公司也都具备极强的技术实力。书生通用大模型体系由上海人工智能实验室发布，其中“书生·浦语”同样是千亿级参数的大语言模型。而MiniMax则是“新面孔”，是2021年12月在沪成立的一家大模型初创公司，今年6月刚刚获得超2.5亿美元的A轮融资，此次其自研的通用大模型“ABAB”获批面世。

　　北京地区除了百度外，抖音的“云雀”、百川智能的“百川”、智谱华章旗下的“智谱清言”以及中科院旗下的“紫东太初”也同样获批。有消息称，广东、安徽等省市的3家大模型公司也将很快面世。

　　“多模大战”将迎来应用层竞争

　　国产大模型“批量上市”，意味着“多模大战”正从上一阶段的“生出来”，走向“用起来”的新阶段。

大模型｜从拼参数走向拼应用

热点资讯