有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

用户投稿 106 0

智源技术分享:大模型行业应用新模式和关键实现路径

分享嘉宾 | 周华 审校 | 李忠良 策划 | AICon 全球人工智能开发与应用大会

在不久前举办的 AICon 全球人工智能开发与应用大会上智源研究院大模型行业应用总监周华为我们带来了精彩专题演讲“智源技术分享:大模型行业应用新模式和关键实现路径”,演讲分析当前行业企业在大模型落地过程中技术团队普遍会遇到的问题和障碍,结合智源研究院在大模型产业落地过程中的实践经验,总结帮助企业跨越大模型应用技术障碍的以大模型为核心新型技术路径,涵盖数据、模型评测、模型训练和应用集成,并针对行业落地过程中突出的数据问题给出数据生产流程的构建技术建议,最后向各行业的大模型应用开发者分享智源研究院在大模型行业应用方向上的最新开源技术成果。

内容亮点:

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

理解大模型行业应用落地问题的深层次原因;

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

理解大模型行业应用的独特技术差异,获得以大模型为核心的应用构建的技术方法;

高效构建可持续行业大模型数据生产流程的技术方案;

智源研究院最新的大模型行业应用相关开源技术成果详细讲解。

以下是演讲实录(经 InfoQ 进行不改变原意的编辑整理)。

去年,我们经历了一场被称为“百模大战”的激烈竞争,这场竞争主要在通用领域展开。然而,从今年开始,我们注意到众多企业,包括央企和国企,以及中小企业,都开始着手将这些模型应用于具体的行业实践中。

尽管行业落地的挑战显而易见,但我们可以认为,我们的大模型应用的发展已经进入了一个新的阶段,也就是所谓的行业落地“深水区”。下面,我将与大家分享一个我在过去两年中一直在研究的话题,即《大模型在行业应用中的新模式和关键实现路径》。

1 AI 大模型浪潮推动企业 IT 系统架构变革

回顾历史,早期计算机系统进入企业时,主要是以流程为中心,强调企业流程的优化和支持复杂流程的实现。进入 21 世纪,随着互联网尤其是移动互联网的兴起,架构逐渐转向以服务为核心。

对于资深从业者来说,可能还记得 AWS 早期提出的企业部门间以 API 的服务形式对外的理念,这一理念经过多年实践已经得到了很好的执行,特别是在微服务架构的落地上。

到了 2010 年左右,云计算和大数据技术成为主流,企业开始以数据为核心,大量大数据平台应运而生,主要处理结构化数据,同时也涉及非结构化和半结构化数据。数据被视为企业的重要资产。

ChatGPT 的出现标志着一个新的转变,我们正在进入一个以大模型为核心的时代。但这并不意味着数据将不再重要,实际上,数据和大模型是相互结合并行发展的。

未来,大模型将进一步整合数据和服务,利用其强大的泛化能力,支持系统执行许多以往需要人工完成的任务。智能系统不再是单纯的工具,而是成为一种能够主动学习、自适应和协调的智能体,支持企业 IT 系统的发展。因此,以大模型为核心的系统将成为企业 IT 系统发展的重要方向

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

以 AI 和大模型为核心的应用系统正在经历一场演进。在没有大模型的时代,用户使用 IT 系统的过程是手动的:用户需要设定任务目标,规划流程,分析信息,执行路径,最终获得所需结果。在这个过程中,用户需要与系统交互,了解系统功能,并选择相应的功能来提出请求,获得请求结果,然后决定选择下一个应用功能。开发人员的主要任务是从功能上实现整个 IT 系统服务,这是当前传统的模式。

随着大模型的引入,我们看到了一种新模式的出现。在许多企业应用中,多智能体助手成为核心,它们背后依托的是行业大模型。用户只需设定任务目标,智能体助手将负责执行用户想要的操作,并最终提供任务完成的结果。智能体助手将接管任务分解、规划和执行的工作。

在 ChatGPT 刚出现时,我们可能直接与模型对接,进行问答形式的交互,大模型还无法与 IT 系统进行整合。要让大模型真正融入 IT 系统,必须与现有的 IT 系统对接。智能体通过函数调用或工具调用与 IT 系统对接,这一过程与用户与系统的交互过程非常相似,实际上是让多智能体助手帮助用户发起请求、获取和处理请求。

应用开发者不仅要维护现有的 IT 系统,还需要实现智能体应用。同时,算法工程师这一新角色变得非常重要,他们负责训练驱动行业应用智能体的核心大模型,并提供模型服务。

智能体与传统系统之间的分工是,智能体完成专业的认知任务,而非认知性的,程序化的任务则保留在传统系统中,通过原有接口和工具执行。在这种分工趋势下,许多应用系统都将朝着这个方向发展,智能体和传统系统将共同协作,为用户提供更加智能化的服务。

2 以 AI 大模型为核心的应用系统关键实现路径

实现以大模型为核心的企业 IT 应用系统的关键路径可以分为以下几个主要模块。首先,我们需要进行需求分析和方案设计,这是实现系统的第一步。接下来,在完成方案设计后,我们将并行进行模型训练、数据工程和智能体应用系统的开发。在整个过程中,数据工程被视为核心,因此被放在中间位置。

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

具体来看,需求分析和方案设计阶段与我们传统的 IT 系统设计相似,但存在一些差异。首先,我们需要进行可行性分析,这是任何项目启动前的标准步骤。然后,我们要梳理模型的业务需求,这是确保模型能够满足实际业务需求的关键步骤。

接着是模型能力的定义,这一点与传统 IT 系统不同,需要明确系统的应用场景,并梳理出哪些任务可以由模型执行,哪些仍需依赖现有的 IT 系统。最独特的地方在于评测体系的建立。

在传统的 IT 系统中,我们通常通过测试用例来进行测试,但现在我们需要构建一套测试集来评估模型或基于模型的智能体,因为模型或基于模型的智能体的输出并不是完全确定的。能够成功完成任务的评估结果可能以百分比形式呈现,一般而言都不是绝对的 100%。最后,我们需要确定总体的应用方案,这是需求分析和方案设计阶段的总结。

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

在实现以大模型为核心的企业 IT 应用系统中,模型训练、数据工程和智能体应用开发是三个关键环节。首先,我们来看数据工程。企业拥有大量数据,但关键在于如何收集数据、判断哪些数据有用。

这需要根据模型的能力需求来确定数据的方向。数据分为外部数据和内部数据,外部数据主要是行业通用的专业知识,需要有获取渠道;内部数据则是专业的业务数据,需要盘点并进行文档预处理和数据集制作。文本数据和多模态数据的处理也包括在内。

此外,如果应用需要向量数据库,就需要进行数据拆分。如果向量模型的准确率和召回率不高,还需要准备微调数据。对于大型项目,可能还需要制作继续训练的数据集和微调的指定数据,甚至是人力对齐的数据。数据工程强调的是了解数据位置、盘点数据以及获取外部专业数据的渠道。

接下来是模型训练

雅万高铁设计总负责人赵斗:把中国高铁技术分享到全世界

视频加载中...

雅万高铁,中国高铁“海外第一单”。

雅万高铁连接印度尼西亚雅加达和万隆,是东南亚首条高速铁路。这条高铁全部采用中国设计、中国施工、中国装备、中国标准,让中国高铁第一次实现真正意义上的“走出去”。

中国高铁技术如何在海外“发芽”“结果”?本期《大国总师》系列访谈,专访雅万高铁设计总负责人赵斗,为大家讲述他将中国高铁“开”到海外的背后故事。

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

量身定制

让中国技术和标准落地印尼

雅万高铁项目从2015年启动

到2023年通车

前后用了8年时间

回顾陪伴雅万高铁走过的路

赵斗用“步履维艰”来形容

尤其是,让中国技术、中国标准落地印尼

是他们需要面临的最大挑战

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

全线施工难度最大的是2号隧道

虽然长度不长

但地质条件非常复杂

“被挖开后,这里的泥岩一旦和空气接触

岩土就吸水膨胀,用手捏就碎了”

在开掘隧道时容易发生塌方

再加上地面有铁路

建筑物也比较多

整个这段工程的建设步履维艰

面对地下隧道建设难题

赵斗提出建“帕达拉朗站”的想法

让高铁和现有的火车站并站

赵斗回忆

他们很快做了几十版方案

去和印尼方沟通增建这个车站

“这个车站和高铁全线同期建成,效果也很好”

让当地人实现便利换乘之外

赵斗说“那里现在也成了网红打卡地”

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

“雅万高铁”不仅是条铁路

更编织了当地美好生活

2023年9月,雅万高铁建成通车

一个流行词“Whoosh”从此在印尼流行

“这个词是当时印尼佐科总统乘坐高铁后提出的。”

赵斗介绍,Whoosh原意是

高速铁路疾驶而过,呼啸的声音

在印尼语里面是

“省时”“高效”“先进”首字母的缩写

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

在赵斗看来用Whoosh来形容雅万高铁

是一个非常好的评价

赵斗认为“雅万高铁的开通,

让印尼民众城际出行进入一个新时代。”

雅万高铁开通以后

雅加达到万隆的旅行时间缩短到40分钟

与此同时

这条高铁带动了沿线的开发

和旅游产业的升级

带动当地8万多人就业

“雅万高铁的开通,向世界亮出一个

中国高铁技术走出去的成功案例。”

赵斗动情地说

“我相信会有越来越多的国家

选择中国的高铁技术,

建设本国的高速铁路。”

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

最大的愿望

将中国高铁技术分享全世界

从站场见习生到专业设计者,再到总工程师

一路走来,赵斗觉得自己很幸运

“赶上了好时代,遇到铁路的飞速发展”

作为铁路建设者

他希望未来的铁路服务更好、品质更高

“未来乘坐高铁没有乘坐交通工具的感觉”

是赵斗将来追求的目标

中国高铁时速已达到每小时350公里

现在,赵斗还在带领团队

做进一步提速的研究

赵斗认为

“提速对乘客来说是个好的体验”

也是铁路部门一直在探索前行的方向之一

有技术分享 智源技术分享:大模型行业应用新模式和关键实现路径

在过去的30年里,

赵斗主持了上百个铁路项目

见证中国铁路从探索到追赶到并跑、领跑的过程

不过,现在赵斗还有一个心愿

他希望把中国高铁技术全世界

让各国人民共同分享中国高铁带来的幸福感、获得感

赵斗说,“愿为实现人畅其行,物畅其流,

贡献自己的力量。”

策划:储学军 车玉明

统筹:李晓云 李由

主持人:关心

编导:刘袁媛 汤子涵 戴丽婷

视频制作:陈杰

记者:李帅

摄像:郝杰

设计:邓豪俣

专业指导:李沛潇

鸣谢:中国铁路设计集团有限公司

新华网

新华社天津分社

联合出品

相关阅读:

我当时想10年做成,没想到用了20年

我选择了桥,桥也选择了我

去南极,和冰“硬刚”

向实现“造船强国”的梦想不断迈进

向着地球深处不断挺进

“中国天眼” 从“最大”到“最灵敏”

探月的脚步从未停歇

相关问答

借呗能够强开吗,有没有大神把开通技术分享一下啊?-小额贷款...

[回答]借呗贷款的办理前提一般是芝麻信用分需要满足在600分以上。信用分数不足的,你还需要先提高你的信用分,然后把支付宝升级到最新版本,才可以强开出来...

技术分享讲什么内容?

1.技术分享,内容不限,主要对大多数开发技术人员有帮助均可分享。2.技术软件分享,软件不限,主要对开发有帮助的软件运用,可以快速实现编码过程或者减少开发...

知乎技术分享:知乎千万级并发的高性能长连接网关技术实践-...

本文来自知乎官方技术团队的“知乎技术专栏”,感谢原作者faceair的无私分享。1、引言实时的响应总是让人兴奋的,就如你在微信里看到对方正在输入,如你在王...

如何组织团队内部的技术分享活动?

感谢邀请、干货分享、绝不私藏~我是明哥,前麦肯锡战略咨询顾问,埃森哲管理咨询顾问,13年职场经历,一个喜欢用思维导图架构PPT的老司机,欢迎关注我的头条号...

股票投资12年,在今日头条上可以写一些股票投资技术分享吗?

新手也可以写股票投资技术分享的,不过很多人都喜欢搬运,把别的地方的技术搬运到头条里去,这种方法虽然粉丝来得快。收益多,但是人不能没有良心。有句话说再...

有没有电子科学与技术专业考研的学长学姐能分享一下自己的考...

选择报考院校和专业在决定考研之后我认为最重要的也是首要的一步就是选择报考院校和专业,虽然看似简单,但这里依然有很大的学问。先看学校,很多同学...

警务技术上岸经验分享-ZOL问答

我报考了公务员公安系统的网络管理岗位,有几个问题想请教大家:第一,入职后是否会直接从事网警相关工作,还是需要先下派到派出所担任普通民警?第二,入职后是否...

能把您种植水稻的技术经验分享给大家吗?

回答这个问题之前,亮仔先跟大家简单的介绍下。这几年,我一直在浙江区域承包种植水稻,虽然达不到超高产水平,每年平均亩产也有1500至1600斤。下面为大家分享下...

比亚迪dlink系统升级,将告别实体车钥匙?-太平洋汽车

[回答]随着互联网技术和移动通讯技术的不断进步,新能源汽车身上也承载了更多功能更全面更先进的设置,而前不久比亚迪宣布将要对Dlink系统升级,将会推出NFC...

经验分享的重要性及意义?

今天就来和大家谈谈我所体会的分享的价值和意义吧,主要有三点:1.只有你能分享的知识,才是真正属于你的真知知识的掌握程度有三级:第一级知道应用:从书...

抱歉,评论功能暂时关闭!