AI大模型竞争或激发创新浪潮

  中评社北京2月5日电/据新华社报导,《经济参考报》2月5日刊发记者郭倩采写的文章《AI产业进入新阶段 大模型竞争或激发创新浪潮》。文章称,近段时间,随着深度求索公司(DeepSeek)发布其最新开源模型DeepSeek-R1在国内外引发热烈关注,百度智能云、腾讯云、阿里云、华为云等多平台宣布上线DeepSeek旗下模型。业内人士认为,DeepSeek的新进展透露出2025年大模型竞争的新动向,有望激发一波创新浪潮,各家企业将探索具有成本效益的AI开发和部署方法,推动全球AI继续进步。

  据深度求索公司官网介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学、代码、自然语言推理等任务上,测评性能与美国开放人工智能研究中心(OpenAI)开发的GPT-o1模型正式版接近。

  赛智产业研究院人工智能研究所副所长安赟在接受记者采访时表示,DeepSeek-R1通过开源策略、低成本高效推理及强化学习结合混合专家架构(MoE)等创新,实现了突破性的技术进展。“开源打破了大企业的技术垄断,促进了AI技术的普惠化。其低成本的算法优化模式改变了长期以来对算力堆砌的依赖,推动了效率导向的竞争格局。”

  “DeepSeek将开启全球大模型开发和应用的新阶段。”北京前沿未来科技产业发展研究院院长陆峰认为,DeepSeek的高性价比和低训练成本极大地降低了大模型的投资、开发、运营成本,开放开源性降低了融合应用的技术门槛,为大模型的千行百业广泛落地普及应用提供了更多可能。

  记者注意到,DeepSeek凭借其强大的语言处理能力和技术优势吸引了众多国内外企业的关注。连日来,百度智能云、华为云、阿里云、腾讯云、360数字安全集团等多个平台宣布上线DeepSeek旗下大模型。此外,在1月31日,英伟达、亚马逊和微软这三家美国科技巨头在同一天宣布接入DeepSeek-R1。

  例如,腾讯云方面表示,腾讯云TI平台全面支持DeepSeek系列模型的一键部署。作为企业级机器学习平台,TI平台还提供模型服务管理、监控运营、资源伸缩等能力,帮助企业和开发者将DeepSeek模型高效、稳定地接入实际业务中。