当前位置:河南热线 > 科技 > 正文
大模型|从拼参数走向拼应用
2023-09-01 08:20:14 来源: 文汇报
关注河南热线

大模型的落地应用迎来关键节点。首批国产大模型产品昨天获批面向全社会公众开放服务,其中上海3家、北京5家率先上线,这意味着国产大模型从上一阶段的“出生潮”向新一阶段的“应用潮”迈出重要一步。

大模型“飞入寻常百姓家”,对用户意味着什么?对国产大模型企业又意味着什么?多位专家表示,“多模之战”正从拼参数走向拼应用,能建立起真实用户调用和模型迭代之间的“飞轮效应”,有利于真正服务国人。

首批8家获批,上海占据3席


(相关资料图)

昨天,首批国产大模型产品获批面向用户开放服务,包括商汤科技“商量”、百度“文心一言”、智谱AI“智谱清言”等。

百度最早于昨天凌晨宣布“文心一言”向全社会开放的消息,意味着用户无需内测邀请码,就能直接体验相关服务。与3月16日最早开启的内测版本相比,目前“文心一言”已迭代到3.5版本。“即使与3.0版本相比,新版本的训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%。”一位百度内部人士透露。

在首批8家通过《生成式人工智能服务管理暂行办法》备案的大模型公司中,记者注意到,上海地区占据3席,分别是MiniMax的“ABAB”、上海人工智能实验室的书生通用大模型、商汤的“商量”。其中,“商量”于今年4月推出,是国内最早的基于千亿参数大语言模型之一,在向C端开放之前,其已在金融、医疗、汽车、地产、能源、传媒、工业制造等B端行业有了不同程度的落地应用。另两家大模型公司也都具备极强的技术实力。书生通用大模型体系由上海人工智能实验室发布,其中“书生·浦语”同样是千亿级参数的大语言模型。而MiniMax则是“新面孔”,是2021年12月在沪成立的一家大模型初创公司,今年6月刚刚获得超2.5亿美元的A轮融资,此次其自研的通用大模型“ABAB”获批面世。

北京地区除了百度外,抖音的“云雀”、百川智能的“百川”、智谱华章旗下的“智谱清言”以及中科院旗下的“紫东太初”也同样获批。有消息称,广东、安徽等省市的3家大模型公司也将很快面世。

“多模大战”将迎来应用层竞争

国产大模型“批量上市”,意味着“多模大战”正从上一阶段的“生出来”,走向“用起来”的新阶段。

步子迈得快一点的百度、抖音、商汤等企业,短短一天内已实现了手机端、网页端都可体验的“速度感”,“文心一言”甚至已迅速登顶苹果商店的免费App排行榜,从中可以窥见用户的热情。而“智谱清言”则在网页端和App端的基础上搭建了小程序,还给出了赛程设计、写作文等不同语境下的案例以及广告撰写、短报编写等不同对话参考。

在多位专家看来,除了商用之外,大模型面向普通人开放是一个重要的里程碑。数字商业分析师郝智伟认为,大模型在C端的应用可以被认为是赋能工具、生活助手,是“重要的效率提升工具”,可帮助用户更快速处理各类文本和信息、做Excel表格、进行简单的编程等,让生活和工作变得更便利。

而对于企业来说,大模型“飞入寻常百姓家”,则意味着更庞大规模的中文语料投喂和更丰富的原生应用场景。C端是大模型普及的基础,大模型只有走向全社会开放,才能完成大数据意义上的语料累积,达成深度学习并实现个体赋能。百度创始人、董事长兼首席执行官李彦宏就表示,当“文心一言”向数以亿计的互联网用户大规模开放服务后,就能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代,创造更好的用户体验。据悉,百度还将开放一批经过全新重构的AI原生应用,让用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。

郝智伟认为,面向全社会应用后,也意味着AI大模型开始从拼参数发展到拼应用,进入大规模可复制的产业落地阶段,下一阶段或将迎来应用层竞争。

备案制帮助大模型在实践中解决问题

大模型从出生到迅速在C端落地,也体现出监管的思维之变——从过去的“事后监管”变成了现在的“边跑边管”。

根据国家网信办4月11日发布的《生成式人工智能服务管理办法(征求意见稿)》,企业利用生成式人工智能产品向公众提供服务前,应当向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。7月,国家网信办联合国家发展改革委、教育部、科技部等7部门公布《生成式人工智能服务管理暂行办法》,并从8月15日起实施。从一众大模型公司获批的时间来看,这离《办法》实施只隔了半个月。

有分析人士认为,采用“备案制”而非“审核制”,为技术和产业可持续发展创造了良好的土壤,有助于大模型先行落地应用,在实践中发现问题、解决问题。

据不完全统计,目前中国10亿以上参数规模的大模型已有近80个,大模型备案机制的建立和首批开放,从一定程度上建立起真实用户调用和模型迭代之间的“飞轮效应”。在复旦大学管理学院信息管理与商业智能系讲师李文文看来,开放公众服务后,企业下一阶段需要更加关注解决大模型的局限性问题,包括幻觉、生成内容的时效性、数据安全隐患等,从而以更合规的方式健康成长。

中经传媒智库专家张书乐认为,在政策扶持和产业加快升级的背景下,强大的中文语境和针对中文语境研发的大模型,有利于真正服务国人,并建立起自己的护城河。(记者 徐晶卉)

责任编辑:hN_0129