2024-06-04 18:54:30
21世纪经济报道记者 董静怡 上海报道
人工智能大模型正在催生新一轮技术创新与产业变革,也将为金融、制造、交通、政务等众多行业企业数字化转型和高质量发展带来新的动能。
日前,在未来数据技术峰会上,星环科技创始人、CEO孙元浩指出,大模型技术已快速融入企业生产经营的方方面面,在企业生产效率提升、业务职能提效和行业应用场景创新中无处不在,不但重构产业,打造企业的核心竞争力,而且成为企业的基础设施和核心能力,助力企业打造新质生产力。
不过需要注意的是,当前市场以通用基础大模型为主,通识能力强,但缺少行业专业知识。
孙元浩向21世纪经济报道记者表示,企业通常需要高精度、高质量的专业模型,市面上很多大模型仍无法达到企业的要求。
将大模型融入千行百业,让企业的AI应用从早期直接调用通用大模型,发展到建立自己的AI基础设施,打造行业或特定领域、任务的专用大模型,助力生产力革新和产业升级,已经成为目前企业关注的核心。
“百模大战”之后,大模型在行业和企业中的应用落地情况更受到关注。
IDC数据显示,全球市场约有55%的企业正在大规模投资生成式人工智能技术,另有34%的企业正在进行概念验证(Proof of Concept, POC)试验,以探索生成式人工智能为企业带来的价值。在亚太地区,这一比例更高,达到95%,表明亚太地区企业对生成式人工智能技术的认可程度高于全球平均水平。
从具体行业来看,IDC中国副总裁钟振山在峰会上透露,目前大模型在金融、零售等行业已经具备了一定的规模布局,而在政府、教育、制造、医疗、生命科学、交通以及公共事业等行业里也看到了有相当数量的企业对于生成式AI和大模型的技术进行一系列的探索。
“大模型和生成式AI的这项技术,对于产业的影响是方方面面的,而我们预计未来所有的行业都将会受益于生成式AI和大模型技术不断普及和深入。”钟振山表示。
近一年的一个明显趋势是,出现了越来越多的具有特定行业或场景特征的大模型。这表明技术供应商在开发大模型的底层技术的同时,也在逐步增加对这些技术在特定行业或企业内部应用的关注,真正期望这项新兴技术能够为企业带来根本性的变革。
钟振山表示,大部分企业对于生成式AI主要影响的定位还是集中在生产力的解放、运营效率的提升以及个性化培训计划的开发。“我们可以看到超过90%的企业在这三个方面对于生成式AI这项技术的认可和期望是非常高的。”
为了让大模型深度融入企业,自5月以来,大模型厂商纷纷开启降价潮:国内7家大模型企业,包括深度求索、智谱AI、字节跳动、阿里云、百度、科大讯飞和腾讯云,宣布了对旗下21款模型进行价格调整。这场价格战使得大模型API的价格经历了显著下降,从最初的0.001元/千tokens降至0.0005元/千tokens,更有部分模型实现了免费。
阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发:“我们预计未来大模型API的调用量会有成千上万倍的增长。”
华福证券认为,随着大模型价格的进一步降低,B端客户,特别是云厂的现有客户将加速大模型产品的推进过程,商业化落地有望加速。
不过,也有一些企业和开发者表示,降价主要集中在一些体量不是很大的模型,而真正能够解决问题的往往是一些顶级大模型。
这也意味着对于那些寻求高质量解决方案的企业来说,降价可能并没有太大吸引力。
孙元浩也向21世纪经济报道记者表示,对于企业用户而言,他们通常对服务或产品的精确度和质量有着严格的要求,企业用户的主要关注点不在于成本,而在于能否有效解决他们的问题。
“这个方法可能不会十分有效,因为大模型之间往往可以相互替代,尤其是在性能和使用效果上的差异不大时。”孙元浩表示。
他认为,降价策略可能带来的唯一好处是能够收集到高质量的数据。因为免费提供,更多的开发者会开始在这些模型上开发应用,从而为模型提供方带来数据收集的机会。除此之外,降价对于推动市场竞争和吸引用户可能并没有太大的实际作用。
“提升模型精准度、模型的效果,才真正能够有竞争力。”孙元浩向记者表示。
企业通常更看重大模型的准确度,他们的要求远比现在的模型高很多。据孙元浩介绍,有企业客户部署了五六个大模型,没有一个达到要求。
这正是大模型企业应用的现状。目前,通用大模型数量快速增加,并不断升级迭代、提质增效,但是却不能适应企业AI应用的需求。而另一方面,企业对行业大模型需求增加,迫切需要降低使用门槛,更加普惠地使用大模型、生成式AI技术,以解决企业内部人才、算力、数据等不足的挑战。
将AGI限制在一个特定领域或者一个行业或者特定任务,不断提升模型准确度,成为一条切实可行的发展途径。
那么对于每个单独的企业来说,如何支撑起这样的大模型且覆盖其成本呢?
首先,这个过程里不需要堆庞大的参数。随着研究的深入,业内发现虽然参数规模的增加确实可以提升大模型准确度,但这种提升的边际效益正在逐渐减少。即随着模型规模的扩大,每增加一定量的参数所带来的性能提升越来越小。
相比之下,高质量的语料库对于提升模型准确度的作用可能比单纯增加模型参数更为显著。孙元浩向记者表示,通过不断增加高质量的训练数据,可以在不大幅增加推理成本的情况下,提高模型的性能和质量。
因此,当前大模型厂商的竞争焦点正在从单纯增加单个模型的参数规模,转向如何获取和利用更高质量的语料库。这不仅可以提升模型的推理质量,还可以降低推理过程中的成本。
另一方面,对于企业来说,需要的并不是一个参数巨大的模型,而是某个领域的专家。“现在企业比较务实,不再追求更大参数的模型,而是追求专业度。”孙元浩表示,在企业的实际部署中,通常会收窄大模型应用范围,收窄其泛化能力,将其训练成专业模型,只做特定的工作。专业模型参数量则不会太大。
不过,这并不意味着每个企业都能获得高质量的大模型,数据是其中最大的挑战。
为了让通用大模型适应特定企业的需求,需要在企业自己的数据上对模型进行微调(fine-tuning)或二次训练。这个过程可以帮助模型学习企业的特定术语、业务流程和决策逻辑。在此之前,企业需要做好数据整合的准备工作,使其成为可用于训练模型的格式。
然而,任何一个大型企业内部都存在着海量、多元的数据,这些数据可能包括客户信息、交易记录、日志文件等,它们通常是非结构化的,即没有固定的格式或模式,大模型无法直接使用。
“以前我们做大量工作是把数据结构化变成放到数据库里面,这是把它高质量的过程,现在要做的事情是处理非结构化的数据。”孙元浩向记者表示,语料散落在各种地方,导致工作量大,“目前最大的挑战是把现有资料整理起来训练或微调模型,企业应用要求100%准确,所以用现在的语料还不够,我们正在构建知识图谱用于推理,再结合大模型提升准确度。”
这也是星环科技所推出的产品之一。通过星环科技AI Infra工具,企业能够准确、高效地将拥有的多种来源的多模语料转换为高质量的专业领域知识,让企业构筑知识壁垒。
孙元浩比喻道,过去一年一直讲大模型是个“文科生”,因为它能写作、生成;星环的目标是把大模型训练成一个理科生,希望它能做数学分析,能够懂自然科学的各个领域、各个学科。
值得注意的是,当大模型落地企业,后续仍然存在着技术风险。钟振山表示,大模型技术对数据交换的性能要求很高,可能会对企业内部的网络环境构成新的挑战。鉴于大模型对数据的依赖性,企业在采用这项技术时,也会将内部数据视为核心资产。对于核心资产,企业需要建立一套有效的保护机制,以确保能够充分发挥大模型的最大价值。
推荐阅读
文章评论
注册或登后即可发表评论
登录注册
全部评论(0)