文/付乐
2023年,大模型给人们带来了诸多惊喜。
电影《奥本海默》的一句台词:“(原子弹)不是一种新武器,而是一个新世界。”过去一年,用这句话形容大模型爆发式发展再合适不过,正如大模型的出现,“不是一个新技术,而是一个新世界。”
金融业作为数字化、全球化程度最高的行业之一,率先与新兴科技进行融合。2023年,金融机构纷纷掀起“百模大战”,行业想要依靠大模型产生新变革。度小满、奇富科技、马上消费金融等科技企业争先布局,先后发布落地了多项金融大模型,金融业正提速走向AI创新应用期。
12月28日,马上消费人工智能研究院院长陆全对《华夏时报》记者表示,大模型正在为金融产业带来体验方面的变革,金融领域需要私有化部署的通用大模型、知识处理大模型、工具型大模型、决策型大模型等四类大模型,而提供决策流程智能生成执行的决策型大模型,将是未来趋势。
从通用到垂直
今年5月,度小满发布了开源大模型“轩辕”;同月,奇富科技推出金融行业通用大模型“奇富GPT”;6月,恒生电子金融行业大模型LightGPT对外亮相;8月,马上消费发布了国内首个零售金融大模型“天镜”;11月,腾讯云发布金融行业大模型解决方案。
针对当前金融业面临的诸多挑战,华为云通过PaaS 3.0切入金融场景;马上消费的天镜大模由“三纵三横”的技术布局,嵌入优化金融业流程;星环科技了推出金融大模型“星环无涯Infinity”,可用于智能研报生成、资讯解读分析、量化因子策略等金融场景。
“金融科技公司将是金融大模型落地的第一战场。”奇富科技首席算法科学家费浩峻对《华夏时报》记者表示,市面上的主流金融科技公司普遍都有小10年的服务经验,手握几百家合作机构、上亿的用户群,相较于科技巨头更贴近业务场景,数据精度和实战经验也都更胜一筹,而这些对垂直大模型的调优至关重要。
星环科技相关负责人对《华夏时报》记者表示,初步来看,大模型分为通用场景和专有领域场景两大重要应用方向。通用场景由于基于基础大模型,因此落地时间更短,应用速度更快;而专有大模型存在专有领域语料发展、积累及训练的过程,不过一旦落地,对业务效果会有更大和更显著的提升作用。
通用大模型和实际落地之间鸿沟巨大。只有金融领域的专有大模型才能更好地服务于金融业。金融大模型是机构在业务场景中积累的金融数据训练而来。相较于通用大模型,金融大模型通常涵盖金融研报、政策、基金、银行、保险等各个方向的专业知识。
“现阶段金融大模型就是一个效率工具,必须依托具体的业务场景才能释放能效。某种程度上来说,现在金融机构就是要用大模型将过去大数据所做的事情再重新做一遍。”费浩峻表示。
那么,金融业到底需要什么样的大模型?
决策型大模型将成趋势
当前在金融领域,大模型主要落地在智能客服、企业内部智能运营等方面。
例如在营销方面,针对销售业务决策场景,通过大模型训练智能电销对话系统,以便电销机器人更好地理解客户,并更好地满足他们的需求。
陆全补充到,利用大模型与用户深度对话的过程中,对话轮次的多少、用户说了多少话、通话时长等指标的提升,都代表用户愿意去说。首先得让用户开口,不挂断电话,能说得多,这是转化的先决条件。
在助力企业内部智能运营方面,天壤COO胡艳华表示,大模型加持的新搜索,在新手需要获取专家知识时,能够及时解答疑问,降低新员工的入门难度。新营销能够使新手如优秀的客户经理一般,既懂得如何与客户沟通,又具备足够的专业知识。
内容生成方面,大模型能够进行文本生成、图像生成、3D素材生成、音视频生成等在内的多种技术能力。例如,将训练好的生成式语言大模型应用于金融行业文本生成,生成年报、研报以及分析报告等。
风险管理方面,将大模型应用在互联网文本数据、征信报告的解读上,通过用文本数据构造的预训练模型以及AI算法,可以解读更多维的出征信报告风险变量,更好的识别贷款人、小微企业主的信贷风险。
涉及金融大模型是否会在信贷风控等核心领域应用时,在陆全看来,大模型可以帮助小模型生成更好的合成数据,尤其对金融合规和风控。另有业内人士坦言,目前也在开发风险决策领域,但具体如何应用还不好说。风险管理是量化的工作,大模型现阶段的价值在于数据理解、工作流程更加流畅和低成本,而不在于更精准地做风险定价。
陆全认为,金融企业需要的大模型分为四个方面。首先是私有化部署的通用大模型。金融业是强监管行业,大部分情况下数据不能出私域,这需要有私有化部署的功能供它做泛化的使用、私有化部署。其次是知识处理大模型。大模型核心解决企业内部无论是数据库结构化知识、文本半结构化知识,还是视频、图像、声音等一些半结构化知识,都可以通过不同的专有知识处理大模型提质增效,甚至替代人工去做中间的转化工作。再次是工具型大模型,端到端代替原来必须要人工去做的事情,如果知识型大模型是辅助,工具型则是替代性的。最后是决策型大模型,提供决策流程智能生成执行,会成为未来趋势。
“金融大模型不是对传统模型的替代,其优势在于与人的交互能力更强。”陆全表示,无论是工具型、知识型还是决策型大模型都要融到场景中去,脱离了场景大模型就是一个抽象的概念。
挑战与未来
“一本正经地胡说八道”“感觉它很聪明,却总犯低级错误”,人们对大模型常持有这种观点。
大模型在人机对话中会出现“幻觉”,即给出事实错误。可以说,生成式大模型非常擅长创造,往往创造有余,但准确性不足。且金融领域的本质是复杂决策,远远比对话聊天困难得多,通用模型里面的专业知识远远不够。
除了“幻觉”现象,金融大模型还会面临哪些挑战?
一方面,和其他行业相比,金融业对于数据的安全性、精准性要求更高,而大模型对金融领域的知识存在缺失。另一方面,大模型的迭代和训练,成本高、成本大,模型需及时调整,也有银行选择利用大数据的整合,在垂直领域精调模型,以小规模算力打造轻量级精调模型。
金融的本质是风控,大模型优化金融业务流程和用户体验的同时,要将风险降到最低。
今年8月15日,由国家互联网信息办公室等七部门联合发布的《生成式人工智能服务管理暂行办法》(下称《办法》)正式施行,是我国首份针对生成式人工智能的规范性监管文件,旨在促进生成式人工智能健康发展和规范应用。
在数据安全方面,《办法》明确生成式人工智能技术提供者对使用者的输入信息和使用记录应当依法履行保护义务,不得收集非必要个人信息。在知识产权问题方面,《办法》明确生成式人工智能服务提供者应当使用具有合法来源的数据和基础模型,涉及知识产权的,不得侵害他人依法享有的知识产权。《办法》还在伦理和未成年保护等多个方面,也提出了相应要求。
值得注意的是,最近几个月,金融大模型迅速地向一个Agent自治智能体的方向在发展,不仅有知识,还有认知能力、工具的使用能力以及规划能力,能够理解使用者的习惯和需求,并做出调整。
基于大模型对自然语言的理解和生成,可以让Agent针对其所处环境和指定的目标,使用基于文本存储的记忆,并进行反思和评估,不断调整策略,进一步拆解目标和路径,制订下一步的方案和行动计划,同时利用文本生成的能力,调用各个工具,最终达成指定目标,这整个过程无需人工介入。
业内普遍认为,大模型下阶段的发展方向是Agent,大模型将化身“数字管家”,成为钢铁侠的“贾维斯”,助力行业效率提升。
责任编辑:孟俊莲 主编:张志伟