以前也有类似的做法:AI鼓起之前,SOA(面向办事的体系架构)是一种新潮的技巧架构。SOA请求办事描述和办事发明必须遵守特定协定,但那时天然说话懂得技巧还不过关,这些协定只能设计得异常逝世板,很轻易导致“即便供给方宣布了办事,但需求方并不知道若何描述才能够找到办事”,那就等于是白做了。但如今供给方只要拥有大年夜模型,只要体系真正具备并封装了这些办事,并用天然说话进行描述,需求方就能用语义邻近的天然说话找到并应用这些办事。

白硕:对,如今大年夜家有一种错觉,就是认为通用智能体开辟编排平台会有很大年夜需求。实际上,真正的需求是在接口体系足够丰富、足够深挚之后才会出现。

恒生电子首席科学家白硕:Agent之难,无关算力、模型与平台

阻碍金融机构把Agent从演示PPT推向核心营业场景的,毕竟是什么?是算力成本,是模型才能,抑或是一个全能的开辟平台?

雷峰网:可以说,接口开放的“厚度”是Agent成长的“生门”。

在与恒生电子首席科学家白硕的深度对话中,我们获得了一个不太常见的谜底:以上都不是最要紧的。

白硕早年间在中科院计算所从事前沿研究,后经久担负上海证券交易所总工程师,主导核心交易体系进级,如今作为恒生电子首席科学家,推动AI技巧落地。在经由学术前沿、行业监管核心与家当实践这一完全路径之后,他对当下最热点的Agent话题,给出了具有汗青纵深感的、颇具穿透力的洞察。

他指出,缺乏足够“厚度”的营业接口——这里并非指底层技巧的API,而是指封装了营业逻辑、能“听懂”营业人员天然说话指令的才能单位——直接导致如今很多Agent项目陷入“读不懂”真实营业需求傍边的复杂意图,无法解读有营业语义的天然说话的指令,或者只能对原有体系做简单粗暴的封装。他滑稽地提到:你会关怀一个电饭锅能支撑若干莳花式菜谱,至于底下加热组件好不好用,会是你存眷的重点吗?

而今朝通用型Agent平台的价值,其在整体解决筹划中的价值占比有所降低——离开垂直范畴深挚积聚的平台,只能是一个“空架子”。他认为花钱做Agent,钱除了花在算力上,更要花在构建和丰富原子化的办事才能上。

在白硕眼中,金融Agent已经走过了“硬编码”“拖沓拽”的阶段,抵达今朝人们所熟知的天然说话驱动的阶段,但眼下并非他所认为的技巧终局。他告诉雷峰网,将来的架构很可能会是如许:敏态营业都归Agent负责,稳态营业改变为后台的对象、资本或物料,傍边会有AI中台进行承接。

雷峰网:恒生电子这段时光重要有哪些AI方面的动作?

这个技巧终局听起来或许不敷赛博朋克,但它在金融这个极其“苛刻”的世界傍边,指清楚明了一条AI Agent落地的生计之路。

以下是雷峰网与白硕的对话,有不改变原意的编辑:

Agent的“假门槛”与“真壁垒”

雷峰网:构建Agent过程中,真正有壁垒的是哪个环节?

白硕:接口的“厚度”,这是我认为构建Agent的核心壁垒地点。也就是说,我需求里的复杂意图是用营业说话表达的,但它跟原有应用体系开放出来的接口能不克不及对得上,是一个问题。

本来的交互方法下,营业人员能懂我的意图,但这切换到AI时代的交互方法下,让大年夜模型同样懂我,那要看企业高低文的这个“厚度”。“厚度”决定了还有若干技巧上的“欠账”,补不上这笔欠账,那营业和技巧之间就是一道鸿沟了,如许开辟出来的Agent,要么无法知足营业需求,要么带有浓厚的技巧陈迹,又或者只是对原有体系的简单迁徙,AI组合应用的灵活性也就表现不出来了。


白硕:对,只有具备足够的厚度,才能100%容纳并懂得用技巧或营业说话表达的复杂意图。不然,体系懂得不了营业表达,根本不知道怎么做。意图懂得是接口开放厚度的关键表现,也是实现技巧与营业对接的基本。

白硕:预算构成上,算力照样占大年夜头的,或者说在客户的接收程度范围之内,其他身分和算力比拟,都还没法成为决定性身分。这一点我们是力所不及的,它须要大年夜模型算法本身有足够的立异。不过Deepseek赓续冲击大年夜模型须要的算力下限,我小我对这件事是认为很钦佩的,也很有信默算力(价格)必定还可以再降。

营业文件中平日包含大年夜量宏不雅的营业说话描述,如开户需知足前提前提、检查事项等。这些请求须要器具体的对象和操作来实现,但怎么将营业文件中的字眼落到实际操作?是一个难题。

同时,要充分应用Agent,原有的IT体系须要具备必定的健康度和结实性,以及较为完全的接口。接口开放得越多,供给的办事就越多;接口越切近营业,注解在营业层面供给的办事越丰富。

雷峰网:怎么断定技巧厂商的接口开放“厚度”,断定标准是什么?

白硕:我打个比方:做饭必定要炉子加热,但炉子只是个基本对象,就像Agent的编排框架,它是标准化的,没有太多范畴相干的技巧含量,这些底层技巧组件将来可能会变成“白菜价”,异常普及。

原有的IT体系及应用体系,还没成功转化为Agent可用的对象、资本或物料,原有体系也没有把所有具体营业含义的接口都开放出来。部分开放的接口与营业慎密程度不一,有些接口距离营业较远,以至于天然说话的指令“够不着”营业。Agent也好,开辟框架也好,平台或者大年夜模型也好,要让它们充分懂得营业意图,如今的接口情势很可能是不合适的。

真正有价值的,是厂商能供给若干种“菜谱”,也就是他们能支撑若干种办事。这些办事才是厂商的看家本领,最终要经由过程MCP等以标准高低文接口的情势裸露出来。

你会关怀一个电饭锅能做若干种不合的饭菜,而不是纯真存眷炉子的短长。假如一个厂商只能供给根本的、通用的功能,就像只会用炉子煮白米饭,那它的竞争力就很有限。但它如果除了烧饭还会煲汤、炖肉,竞争力就会更强。假如这些办事可以或许经由过程天然说话被便利地发明和应用,那就解释厂商具备更高的接口开放厚度。

所以,当我们去评判一个厂商在做Agent时的接口开放厚度时,关键在于看他们能供给若干种办事,这些办事是否封装优胜,是否能被便利地调用。

雷峰网:讲到底层技巧组件的“白菜价”,Agent如今除了算力以外的成本构成是否有很大年夜变更?

我们今朝所处的阶段还不是最先辈的形态,仍然有成长的空间。实际上,我们对于接口和流程的常识并非一片空白,我们拥有大年夜量的文档和描述。这些文档和描述供给了主动化用AI的可能性,假如AI足够强大年夜,我们可以应用它来主动化地拆解流程。如许一来,那些拖沓拽的设备方法也都可以免了。


在以私安排为主的金融范畴,付费的大年夜模型打不过开源的大年夜模型。付费的私有化安排已经很少了,竞争力也不强。开源大年夜模型尤其是千问,在金融机构应用较多。恒生落地案例也是从千问开端的,在这之前开源(后果)最好的有说是Llama,但它本地化之后我们还要做大年夜量的持续练习,这里成本也蛮高的。如今可以说Llama的时代已经以前了。

雷峰网:恒生内部也是有上线响应的Agent来应对这些场景。

通用Agent编排平台,我认为它的价值是在弱化的,至少在整体解决筹划中的成本占比正在降低。

还应有一部分钱花在构建和丰富原子化的办事才能上,这是决定Agent是否有效、可否知足多样化需求的关键。

雷峰网:所以您认为,行业高估了通用Agent编排平台的价值。

白硕:如今一些过于夸大年夜通用Agent编排平台感化,把将来市场份额夸大年夜到几万亿的说法,我是认为完全纰谬的。实际上,你只是为场景供给了一个标准化的基本对象罢了。

通用的开辟平台、编排框架或对象,市场价值并不高,也没有那么大年夜市场份额,两个原因:一是它可能很快标准化,很多厂商都能供给,缺乏门槛;二是垂域仅靠它不敷,真正的竞争力不在这方面。

假如你供给一个编排平台,让用户可以或许自行搭建Agent,这很快就能实现。但关键在于搭建时所应用的“积木块”,即那些已经原子化的办事才能是什么、在哪里。只有将这些才能封装好且足够丰富,才能构建出有效的Agent。

厂商是要基于本身熟悉的资本,去通用平台开辟出贴合需求的解决筹划,不熟悉的资本,很难有效整合应用。就像恒生本身在金融科技范畴有积聚有覆盖面,天然有响应资本去开辟契合金融Agent。有人认为通用技巧可以颠覆这个路径,可以不经由过程场景的积聚,我认为这个设法主意有点一厢宁愿了。

从雏形到落地,金融Agent的务实路径

雷峰网:金融科技范畴其实一向在提数字化、智能化、主动化等等概念,您眼中的Agent是如何的成长路径?

白硕:金融AI Agent成长应当是有三个不合阶段。

最初的时刻,流程性的工作都是经由过程硬编码的方法写逝世在法度榜样里。那些内部没有写逝世的部分,出现临时情况又没有响应的流程来应对,就无法持续操作,必须有人在流程中心手动去连接。这就很像高速公路上有一些土路或者断头路,得用点“土办法”来连接,离全程主动化还很远。

AI出现之后,我们就进入了一个中心阶段,也就是半主动化阶段。在这个阶段,流程性的连接不再须要编写代码。像是步调的先后次序、前提知足后履行的操作等,这些纯粹流程性的工作,都可以经由过程拖沓拽的方法在图形界面上设备流程,将具体的步调设置到中心的具体地位。这个阶段里,节点之间的次序和营业控制逻辑是清楚的,但节点内部的具体操作以前须要写法度榜样来实现。

如今,我们可以应用天然说话去描述单一步调的动作,AI可以或许主动映射到具体的资本和才能。这一步涉及到具体的原子才能,我们须要编写可以或许映射成如许的才能。同时,有些操作会调用已知的才能,比如可履行的办法或函数,这就须要输入参数和输出参数。这些参数是一些数据要素,我们须要用天然说话来指定应用什么样的数据要素以及取什么样的值。

今朝的AI达不到百发百中、一拆解就是对的情况,但我们可以辨认到拆解出来纰谬的部分,动态地去修改它,让它再履行一遍。但要留意,存在前后依附关系时,一旦中心有一步掉足,可能会激发后续一系列的缺点。要修改的话,体系必须是未经破坏的,体系操作是可回滚、可重演的,不克不及出现弗成逆的、永远性的不相符预期的改变,或者数据是只读的,避免出现弗成逆的、永远性的不相符预期的改变。在大年夜模型调试过程中,调剂步调次序或修改数据读取权限等问题,这就是ReAct模式,在新型Agent开辟对象中很常见。

雷峰网:金融机构对Agent的需求本年以来产生了什么变更?他们“绕开”技巧厂商,自建Agent的概率大年夜吗?

白硕:一些金融机构对本身整体资本把控水平和接口裸露程度,是冷暖自知的。那他们不借助厂商才能,直接采购通用平台走自建,这种是存在的,但大年夜多半还不具备如许的才能。

机构起首照样面向营业需求,但要办事这个需求,我们会合营商量落地路径和手头的资本,所以构建Agent也并非独一选择,有时简单的技巧筹划也能知足需求。

以前两年(2023-2024年)碰到的一种情况是,金融机构的Agent构建多集中在单营业域,资本掌控相对自力,不太有各营业间的数据和底层资本交叉拉通的需求。很多场景,哪怕是同一家金融机构,不合营业背后的大年夜模型、算力都是各自采购安排、各自支撑本身的应用。

已经度过这个阶段的机构,就会开端思虑:怎么让采购的算力和大年夜模型资本可以或许交叉支撑不合营业,削减反复采购?于是平台化的需求在2025年就被提出来了。

平台化的出现,使得金融机构可以或许共享底层共性资本,实现跨体系的数据要素同一和营业立异。在AI时代,假如金融机构的接口开放程度足够高,结合Agent开辟框架、编排平台或大年夜模型,就可以更轻松地实现这种拉通和立异。这也是我们在与金融机构合作过程中不雅察到的,比较具有代表性的一种需求。

雷峰网:金融机构应用Agent时,除了算力以外,还可能面对什么比较大年夜的障碍?

白硕:算力是一个问题,再一个是营业适配的“厚度”,也就是怎么让Agent更切近实际营业需求。这是个长线义务,不是说要全都处理好了才搭场景,可以看须要,慢慢开放和搭建所需的接口,先从简单的场景入手,实现短期目标。在这个过程中,接口的积聚和营业适配的优化可以持续推动。会无邪烂漫地经由过程若干个短线目标,去把长线义务带起来。比起一次性大年夜量投入“备而不消”,“边用边备”的做法在贸易角度也比较合理,

雷峰网:Agent参加之后的金融科技解决筹划,其付费模式响应地出现了什么变更?

白硕:假如筹划中包含Agent的搭建和应用,大年夜模型可能会按token收费。底层接口和物料的应用也可能成为计价单位,这也是可以去畅想的一件事。不过,今朝大年夜多半金融机构照样采取传统的项目招投标情势进行合作。

雷峰网:幻觉这个问题,在恒生的金融科技解决筹划里可以怎么被克制?

白硕:幻觉实际上是生成式AI一个固有的缺点,重要涉及编造数据或接口,但在金融场景里,这种情况是可以或许必定程度上被控制的。因为不存在的接口是调不出来的,缺点的接口也会调用掉败。我们的智能体要用来干活儿的,假如数据或接口是虚幻的,那么就会取不到数,接口纰谬而履行掉败。这个场景并不是在聊天,所以幻觉“幻不出来”。

不过,在筹划阶段,有可能筹划步调无法履行或履行成果缺点,这时刻就须要修改,须要ReAct。这就须要确保智能体所依附的基本才能,都是可逆和可恢复的。假如做不到可逆,这个接口就不克不及裸露出来给Agent自由筹划。

终局与将来,金融Agent往何处去?

雷峰网:Agent在金融机构内部,从POC到实际上线是一个很难一概而论的过程。

然而,假如Agent具有不合的性质,例如须要经久运行、持续探测和断定前提是否知足,知足后才通知其他Agent,那么这种Agent有须要零丁存在,并与其他Agent互通。

白硕:对,有些机构会有平台级的诉求,欲望智能体具备通用才能,会存眷智能体在具体场景中的端到端表示。有些机构会从平台的交叉常识才能和跨域组合才能的角度进行评估。假如营业部分主导,他们平日看重智能体在特定场景中端到端的机能;假如是IT部分主导,他们可能更看重智能体的通用性和跨域组合才能,并且须要有真实的跨域场景来支撑这些才能的验证。

雷峰网:能看到单Agent到多Agent是一个趋势,信赖金融场景也不例外,您认为多Agent须要留意的是什么?

白硕:恒生的解决筹划里也有应用多Agent的项目,但一个法人机构内部应用多Agent的须要性相对较弱,是否为不合法人机构之间的跨机构营业往来,是断定是否应用多Agent的标准之一。

其次要留意“黑话”的存在。垂直范畴大年夜量的行话、术语,行业人士懂,但大年夜模型不必定懂。你直接把含有“黑话”的材料交给大年夜模型,它很难充分懂得,所以说这里有一个大年夜模型友爱的数据治理工作,让垂域数据和资本能与通用AI技巧友爱对接,读懂彼此之后,那就是如虎添翼了。

在一个法人机构内部,重要涉及的是分工和工作类型问题。有些Agent负责在线检查数据是否知足特定前提,知足后发送信息,另一个Agent响应并采取行动。假如仅仅是简单的高低游关系、串联式的处理,即一件事完成后依次进行另一件事,那么完全可以将这些流程归并为一个Agent来处理。假如有一个同一的场景或口径,即使流程再复杂,理论上也可以将多Agent归并为一个大年夜Agent来完成义务。


白硕:恒生电子的AI落地包含两部分,一部分是市场端客户侧的落地,别的一部分就是恒生自身的落地,不单是Agent,是对内对外推动整体的解决筹划。

在客户侧,恒生电子积极与国内头部金融机构开展合作,面向投研、投顾、运营等场景打造专业Agent应用,并陆续实现落地。此外,恒生电子也在摸索基于实体地图加强的金融垂域智能体开辟平台的研发,助力金融机构打造垂域大年夜模型技巧体系,子公司恒生聚源也经由过程“语控万数”数据智能体平台,在厚实的金融数据底座基本上,经由过程“数据地图”的导航为Agent的搭建供给精准的数据物料供给。

对内方面,比如客服部分,恒生的客户办事体系是七八年前建的,客岁做了大年夜进级,给接线的客服“武装”AI才能,进级之后变成自助平台「U+」,能答复营业、体系、运维相干问题,帮接线同事分担压力。

再比如工程,因为恒生面向市场供给的是产品,但从产品到实际落地的解决筹划,中心还有相当一部分工作量是定制,这个工程实施也须要大年夜量的常识上和对象上的赋能。工程实施的人员假如有不明白的处所,也不消具体的产品部分的员工来跟他们的对接了,很多问题都沉淀在响应的常识库里。新手员工是异常须要这种对象的,如今AI帮他们扩宽了乞助的通门路径。

还有就是内部面向法度榜样员的AI编程才能,这个技巧赓续在进步,为编程效力的晋升供给了很多空间,我们作为软件公司是必须要去拥抱新技巧,尽快地让法度榜样员转到AI赋能编程的工作方法上来。是以有很多内部对象的研发来打造最佳实践。跟着技巧推广,内部研发的流程和组织治理方法也在赓续产生变更。


白硕:Agent简单地说,就是两种用法。个中一种是“干事”,之前的聊天是干事的初级形态,copilot嵌入体系,经由过程措辞的方法来下指令批示体系干事,但应用的照样本来的体系。Agent的出现,让工作又产生了一个改变,即Agent并非嵌入本来体系,而是一种自力的存在。大年夜模型作为它的大年夜脑,本来体系的各个接口就作为它的“手和眼”,它能感知情况、能取数,对数据分析加工处理,解决营业等等。“聊天”和“干事”的区分,Agent和以往一些数字化应用筹划的区分标准之一。

智能地干事的方法,是可以或许把一些平常的环节串起来,在这个过程里表现智能。只是告诉Agent一句话,它不会把这句话只对应一个动作,而是说它可以或许把这个话作为一个复杂意图,拆解成一些简单的意图组合,每一个简单意图对应一个简单的动作,每一个动作有可能调用后台的不合伙源、不合体系、不合数据源。

雷峰网:比起“智能地干事”“主动化AI”,金融Agent还有没有下一步成长形态?

白硕:有。我们先给营业做个区分:稳态营业,相对稳定,请求较高;敏态营业,变更频繁、快速响应,多样性、差别性也比较明显。假如用传统实现方法做敏态营业,须要大年夜量定制开辟。但AI出现后,对于敏态需求,假如接口是支撑的,流程性的常识和资本完全,有营业规范文件和营业逻辑需求描述的话,AI可以处理这部分工作。

我们可能看到的终局,会是什么状况呢?敏态营业都归Agent负责,稳态营业改变为后台的对象、资本或物料。体系被切分为两部分,中心由AI中台或Agent开辟平台负责连接。但这绝对不是通用的Agent开辟平台,必须与垂域资本配套,不然只是一个空架子,没有价值。

雷峰网("大众,"号:雷峰网):如今Agent照样属于早期比较荒凉的阶段?

接口体系怎么积聚?应当看机构或企业内部的常识,包含数据和流程等方面。常识分为两个层面:一是硬件层面,即确保所有须要的接口都已具备;二是软件层面,即对流程和接口进行具体描述。这些描述构成了常识库,硬件层面是接口体系的慢慢积聚。


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部