取。Common Crawl数据存储在Amazon Web Services的公共数据集以及全球多个学术云平台上。(OpenDataLab,2019,available from:https://opendatalab.com/Common_Crawl) 技术壁垒方面,金融领域涉及大量的数据,包括股票市场数据、宏观经济数据、用户交易数据等。AI需要具备高效地处理和分析这些数据的能力。同时,基于大模型的技术底座,AI能更好理解金融领域的业务逻辑和数据结构,以便为金融机构提供准确、有效的解决方案。然而,金融场景下的AI模型需要在实际应用中不断进行优化和验证,这都需要专业的算法工程师和数据科学家去确保模型的稳定性和准确性。 在信息安全与合规方面,飞笛科技丘慧慧从AI应用在内容科技业务的角度,阐述了信息准确度在传播过程中的重要性。金融领域具有其独特性,因其关乎国民财富的安全和收益,故而须受到严格的监管。在此背景下,容错率相对较低,这也意味着,如果机器或AI系统不能确保信息的准确性和来源的权威性,合规性将面临极大挑战。 而在具体内容科技业务中,信息来自于对风险的识别和对机会的判断,包括对产业、公司的理解。在综合的传播环境下及传递的过程中,信息会发生发酵,产生共振,但同时,信息既可以引导价值和拉动需求,又可能被误解从而形成市场震荡。因此,信息、资金是影响、驱动整个金融市场的核心。且信息和资金流是互相影响的,专业性要求很高,每天瞬息万变,金融对信息的及时性要求非常高,也是它的一个门槛。 深擎科技柴志伟表示,出于对金融行业独特性、数据安全及合规性的重视,中国的厂商在考虑海外大型模型在国内的应用时,表现得相对审慎。选择私有化部署的垂直领域模型,已经在AI模型层在金融领域发展成为一种趋势。金融机构对于通用大模型的运用,主要目标在于提升认知,然而,通用大模型的参数可能高达千亿级别,但垂直领域的模型参数可能仅需百亿。因此,私有化部署的要求仍然依赖垂直领域模型。 在私有化部署方面,摸象科技高鹏表示,对于银行客户,出于隐私安全及数据监管的需求,一般行方会要求AI厂商提供私有化部署,即以私有云的方式替代公共云服务。这将对我工程产品开发带来较大的挑战。持续改进产品的性能,使其更容易运营和维护,从而降低私有化部署中的工程运维成本是AI厂商的工程团队所需要做的事情。 有连云张岩介绍道,构建一个具备专业能力并符合低容错度要求的模型是富有挑战性的,它需要耗费大量的研发资源并进行反复的模型迭代和升级。金融领域的独特之处在于,金融领域对数据的时效性、准确性和稳定性要求很高,模型的数据时效性、准确性与稳定性对用户体验与客户黏性起着重要作用。 对于数据安全及合规,熵简科技费斌杰表示,在金融领域,对人工智能模型的高度可靠性要求极为重要。AI模型在行业应用中的最后一公里正是其可靠性的问题。监管对于金融行业的厂商来说,并非一个需要战胜的挑战,而是一个引导性的框架、一个市场竞争的规则,以及一个行业的规定。 为了符合监管要求并处理数据合规性,有许多可行的方法,例如发展开源模型将为整个行业带来福利,或者将模型部署在国家托管的监管云之上并为金融机构提供服务,此外,为金融机构在本地部署服务,也是值得考虑的一个方向。这些因素都有助于提高AI在金融行业应用中的可靠性。 随着经网信办审议通过,并经相关部门同意于今年8月15日起施行的《生成式人工智能服务管理暂行办法》已将网络信息内容生产者的服务规范列入技术发展与治理要求当中,未来,对于AI的信息安全将会有更明确的框架规范与要求。总体来说,AI与金融结合的门槛主要体现在技术门槛、数据门槛、人才门槛和法规门槛等方面。只有克服这些门槛,才能充分发挥AI在金融领域的优势,为金融机构提供更加智能化的解决方案。 03 AI在金融场景中的角色探索 • 主流技术及应用 • 目前AI在金融领域底层技术主要以NLP(Natural Language Processing自然语言处理技术)、“大型语言模型”(LLM,Large Language Model)、数据挖掘、数据加工(非/半结构化)等。艾瑞咨询(2022)把AI+金融的分为前、中、后台,分别从智慧营销、信用评估到模型开发及大数据层面,从机器学习及智能语音等维度剖析AI在银行、保险、证券等领域的具体角色。 *LLM,Large Language Model一种通过分析亿级规模的语言数据或视觉素材,以进行知识提炼和模型学习的过程,最终构建出庞大参数量级的大型模型。 在金融环境中,AI能够通过多种途径展现其效能。首先,在风险控制方面,AI可以对大量数据进行分析,协助金融机构进行风险评估并制定相应策略。例如,通过对客户的信用评分、交易记录、财务状况等信息的分析,AI可以为客户提供定制化的金融产品和服务。 在投资研究方面,AI能够通过对历史数据的分析,为投资者提供行业和股票的预测和建议。此外,AI还能够在量化交易领域发挥作用,通过高频交易策略为投资者带来收益。 更多的,在零售金融领域,AI可以用作智能客服,提供24小时在线咨询服务。通过自然语言处理和语音识别技术,AI能够理解客户的需求,提供准确的答案和解决方案。 另一应用场景可拓展到营销业务,AI能够协助金融机构分析客户行为,为其提供定制化的营销策略。例如,通过分析客户的消费习惯和兴趣爱好,金融机构可以向客户推荐符合其需求的金融产品。 • 零售金融中的人工智能 • 零售金融作为银行的重要业务,与AI的结合将更有利于优化用户体验及提高效率。主要应用领域可覆盖信用评分与风险管理,欺诈检测与预防,个性化推荐与产品营销,智能客服与聊天机器人,聊天机器人营销,语音识别与虚拟助手,自动化与智能化运营,大数据分析等。 摸象科技 2007年成立的摸象科技,在大数据领域持续耕耘,最初采用谷歌开源Bert模型,结合深度学习+领域知识库平台,进一步压缩模型结构、增加并发数,构建了金融行业垂直模型。目前,摸象与高校联合自主研发的垂直金融的语言大模型,模型规模已达7B,可进一步扩展。训练的数据集垂直于零售金融方向,涵盖了金融知识图谱、金融文本、金融对话等多种数据源。 摸象科技已为国内数十家省分行及股份行提供AI+金融数字员工解决方案,AI员工“象小秘”垂直于150个业务类目的场景,并被应用于银行营销和运营场景中。区别于传统RPA为后端提供自动化解决日常重复性任务的数字员工,摸象科技重点在于赋能员工实现人机协同,提升工作效率。 *RPA机器人:Robotic process automation,又称“RPA机器人流程自动化”“机器人过程自动化(RPA)”“软件机器人”,使用智能自动化技术来执行人类工人的重复性办公室任务。 摸象科技AI员工赋能,企业供图 • 内容科技中的人工智能 • 有连云 有连云国内领先的金融AIGC服务提供商,针对金融市场的时效性,致力于帮客户解决以sales and marketing为主导的应用场景问题,并把商业模式立足于解决开源层面的痛点。 其中,有连云服务的客户群体主要包括金融机构与上市公司。金融领域的痛点与一般场景不一样,对准确度要求较高,有连云AI模型可以有效降低人为错误。 有连云场景及技术,企业供图 深擎科技 成立于2018年的深擎作为内容科技与智能营销服务商,运用人工智能、大数据及财经资讯运营能力赋能金融机构,提供从内容生产、加工、分发到触达运营全流程的解决方案。基于对金融业务场景的理解,持续性地为金融机构提供内容科技服务,通过个性化推荐、智能标签以及智能内容运营等产品和服务,帮助金融企业激活存量客户,提升用户体验,促进交易转化。 公司创始人、CEO柴志伟介绍,针对券商及银行在吸纳新客户过程中面临的高昂成本和收益不稳定的问题,深擎的主要关注点在于提升用户活跃度和交易频次,从而保持用户粘性,而非单纯依赖于购买流量来实现用户增长。 其中在财经内容生成和管理方面,深擎科技会把来自财经官媒、自媒体等渠道的资讯、视频进行聚合,再经AI和人工审核,每天20万篇新增内容进行AI审核(涉政涉敏,涉黄涉暴等),还包括金融行业的数据错误(如媒体记 者在利润率、增长率等财务参数上的笔误)。 柴志伟表示,金融行业受严格监管,对内容发布的要求非常高,并不是简单撤回就可以。具体案例可体现在某银行客群,通过深擎的内容赋能,在内容端UB提升95%,UV提升63%。 *UB(User Behavior)是指用户的行为改进,包括用户在平台上的互动、使用频率、停留时间等方面的改善;UV(User Visits)是指用户的访问量,表示访问平台或内容的用户数量。 深擎科技解决方案矩阵,企业供图 飞笛科技 作为财经AIGC生成和分发平台,依赖基于全网财经信息的大数据引擎,飞笛将内容数字化+AIGC和AI投顾技术深度运用于赋能机构线上财富管理和买方服务中,强调以“买方”的视角设计数字化产品和服务,以帮助金融机构实现传统零售和经纪业务、财富管理业务的数字化转型,帮助用户获得更好的买方服务并实现可持续回报。 对于金融行业在内容科技方面的痛点,飞笛科技丘慧慧表示,2016年后,金融机构曾经有一轮要做“垂直今日头条”的建设高潮,但金融机构本身没有那么多的数据,也没有足够量级的用户和足够量级的免费内容,很难依靠算法做到千人千面。 其次,相比互联网平台容错率比较高的兴趣推荐,金融更偏向于是“价值推荐”,容错率低,彼时,基于专家系统的AIGC可以很好地解决该些难题,但并没有被充分运用起来,金融行业的那时候走的弯路现在仍在继续。现在新的一轮基于大模型的AI浪潮又来了,但是显然,上一轮没解决好的按“价值”逻辑进行生成和推荐的问题,大模型时代仍要率先面对并解决。 飞笛将自身的竞争壁垒归纳为:基于全网海量信息大数据的实时“算力”,赋能金融机构内部场景下的数据治理、服务与内容生成、业务场景和用户个性化分发,以提升金融机构“运力”,提升机构运营的ROI和用户满意度。 她特别强调,金融场景下,首先要解决AIGV,实时价值发现问题,其次才是AIGC,因为用户信息过载+金融信息高频的特点,通过外部信息数据能力的导入,为机构内部提升运营效率非常重要。数字化的运营决策力、内容生产力、按业务场景和用户的个性化分发力,都使得机构的整个运营过程变得更加敏锐且灵活。 飞笛科技数据-内容-智能交互流程,企业供图 • 投研中的人工智能 • 熵简科技 主要服务于基金/资管、证券公司等机构的熵简科技,依托大数据、云计算、AI等技术,为资管机构提供智能投研辅助决策的工具,并实现投研数字化。 熵简科技费斌杰以石油行业研究为例,对特定领域进行了深入分析。在分析石油行业时,中高级分析师会审视一系列高频指标,供需因素、页岩油信用债扩张周期、政治因素、沙特和欧佩克的减产计划等,都是石油行业的关键分析框架。在此基础上,仅仅简单地询问GPT可能无法获取详尽的信息,这对于投资决策是远远不够的。投资决策需要基于市场信息作出买入卖出决策,这也是为什么要在细分领域寻求专业化的原因。 熵简科技又以海上风电为例,在研究该行业,补贴退坡、并网情况等都是重要指标,而再往前又可再追溯到一系列前瞻性指标(装机情况、吊装情况、招投标、核准等)。在投研过程中,每一个环节都包含许多关键的高频指标,如何将这些数据和逻辑串联起来并形成一个能够投资的AI,是未来AI厂商可拓展和思考的方向,而这一领域的价值毋庸置疑。 文构财经 文构财经基于多年积累的数据的先发壁垒,其数据范围覆盖中国沪深、中国香港、美国、新加坡、英国等证券交易所,近20年的海量财经数据,清洗出共计近500G的中英文财经语料(目前数据状态为均已清洗、标定、学习后)。 通过AI理解能力与应用场景的深度结合,文构财经为用户提供了基于财经文本的全新深度处理后的数据、指标、分析师报告,从而为学术研究、量化投资、经济监管等提供多方位支持。 文构财经数据库,企业供图 -4 AI+金融:挑战与展望 • 关于挑战 • 未来,随着AI技术在金融领域的更深入发展,更加迫切地需要人才端与业务端的深度结合,以应对日益增长的合规要求。这种深度结合不仅涉及了专业技术的应用,还涉及了跨学科的整合,以及对市场的敏锐洞察。 飞笛科技的丘慧慧表示,在未来的金融领域,人工智能预计将迎来更加广阔的发展空间。然而,这种发展也面临着一定的挑战。其中一个关键的挑战是金融机构自身的组织结构。金融机构能否以用户为中心进行组织架构的调整,是决定企业能否成功进行结构转型的关键因素,而跨界人才的挑战是企业所面临的重要挑战。 有连云认为,金融领域,对于不同业务场景的理解需要长期积累经验。金融业务有复杂性和专业度,不是简单能驾驭。有连云系统能够实现高效的AIGC生成,这是通用大模型难以完成的任务,而打造具有较高黏性的产品,需要有足够的业务Know-how,并懂得如何进一步优化客户的使用体验。 深擎科技表示,AI在金融领域的挑战主要在于B2B领域的商业化实施过程,金融行业分支机构和总部的数字化协作难以有效打通这个矛盾。作为一家创业公司,面临着与客户个性化、定制化需求及标准化产品之间的冲突。深擎科技柴志伟认为,还是要在产品理解上超越客户,充分把握客户的需求和特性,以便为客户打造价值产品。 此外,公司还需要积累大量的行业案例和实践经验,以更好地指导和支持客户需求和发展。轻咨询是一种值得采用的服务模式,它可以通过团队在早期与客户的沟通和交流,影响客户的规划和预期,帮助客户将想法收敛到一个可以标准化实施的解决方案,从而实现客户需求的合理满足,以及双方共赢的局面。 在人才与技术挑战方面,熵简科技费斌杰认为,AI科技的发展,其核心仍是技术层面的探讨。技术问题并非一蹴而就,它需要深厚的专业积累。倘若把AI视作一个黑盒,训练的关键在于持续优化这个建模过程,如果技术人员未曾尝试过此类操作,那么相关的经验积累无疑将是一片空白,即使能了解大致的操作流程,但要想深入理解这类技术性的经验,仅仅通过理论学习是不够的。这也是在第一线亲自操作和实践的重要性。例如,技术人员至少需要亲自调优过GPT模型。然而在全球范围内,这样经验丰富的专业人士实际上是稀缺的,不仅仅在国内,在海外也同样如此。 • 关于模型的迭代 • 从一个中立的角度对金融领域中各类模型进行比较,就现有技术而言,如GPT、BloombergGPT、FinBert等,各模型间存在着一定的差异。在实际金融领域的应用中,随着参数量及数据集、数据类型及权重、所应用的垂直任务不同,模型的效果也不同(Nan, etc., 2023; Markus, 2023)。 对于模型的迭代,摸象科技表示,模型迭代需要新数据的加入及渐进式优化,其中数据也非越多越好,数据的来源选择很重要,比如金融的模型,加入太多物理学权重的数据可能会出问题。此外,协调数据处理、筛选将是模型训练中比较重要的工作。 熵简科技表示,公司在2020年成功研发了FinBert模型,FinBert模型继承了Bert的设计理念,两者都基于先进的Transformer架构,而FinBert在金融投资研究领域中也成为了一项预训练模型,也帮助熵简服务于金融、资产管理和投资银行等机构。 在GPT面世后,熵简更是基于GPT做上游,进行Fine-Tuning,并附加Promt工程。而对于模型的升级,其中的研发工作需关注细节以及结合学术研究成果,并转化出相关的工程代码,再在业界实践中迭代反馈,从而实现学术思路的工程化,比如通过LoRA,用更少数据训练模型,通过调整细节实现性能提升。 *LoRA :Low-Rank Adaptation, 低秩自适应,是一种基于低秩矩阵分解的个性化推荐算法,能够在推荐系统中应用于提供用户定制的推荐服务。其自适应的机制,可以根据不同用户和项目之间的关系调整模型的参数。 • AI技术的拥抱现状 • 总体而言,AI在金融领域应用广泛,但挑战在于对先进技术的实际应用,以及监管适应性。金融机构对AI有一定认知,随着AI场景的深度和广度的逐渐提高,监管环境对新技术的重视将越发提高。对于新技术,金融行业、赛道中的金融厂商整体偏向开放且积极拥抱的态度。对于AI技术,各厂商在表示积极拥抱的同时,也对目前金融机构对AI技术的态度提出了看法。 其中,有连云表示,AI及AIGC已成功地推进了本行业,挑战在于如何将先进的技术成功应用到实际情况中。这一全新的发展阶段的到来并不遥远,当前正处于一个充满活力的时期。各行各业需要调整自身来适应这样的变化。以ChatGPT为例,它在某些通用场景中可以帮助用户提高工作效率,金融领域和通用领域在文本、图片和视频等方面有共通之处,并已取得了持续的应用成果。同时,当前的监管环境对于新技术的接受度相对较宽松,整个进程在稳步推进。 熵简科技表示金融机构处于观望态度,关键原因在于数据安全问题。金融数据在国家安全方面也占据重要地位,因此直接使用 ChatGPT 模型可能并不合适。因此,未来的趋势会偏向于私有化模型部署。 深擎科技柴志伟表示,目前这波AI浪潮中,AI从1.0(2016年,小模型、垂直AI领域)到现在2.0(通用大模型,强AI)时代,技术发生了比较大的冲击和转变,金融领域表现得比较务实。目前的金融机构已对新的AI技术有一定认知,但场景还有待做大做深,基于国内对金融服务的潜在庞大需求,AI在金融领域的发展仍有很大的空间。 • AI+金融的展望 • 未来,AI厂商将有机会依赖共性技术应用到更多的垂直业务场景,使AI技术在金融行业得到更长远的发展。 有连云从金融业务角度出发,表示依托于技术共性,未来AI的应用将打开更多垂直业务场景。依托于需求的共性,有连云将加大研发投入,通过产品力提升用户体验,从而增强用户黏性。飞笛科技认为,未来AI厂商的战略壁垒在于不断发展数据化,加强内容与金融场景、用户广度、深度及密度的有机组合,实现在各个场景中应用的落地。 摸象科技从银行业角度出发,表示基于中国银行业庞大的业务体量及增速,未来AI在金融市场应用的前景将越发广阔,而摸象也计划将数字员工拓展至银行各个层级的员工,以扩大市场规模。同时考虑到金融行业的广度和深度,AI在垂类市场将会有巨大的发展空间。 深擎科技从金融从业人士角度出发,以销售为例,认为在AI的赋能下,未来线上销售行为将会被数字化,而其中头部销售的能力、经验等稀缺能力将会被沉淀、分析及模块化(话术、策略),从而帮助初级销售提高能力,此方式在国外已经逐渐得到发展,在国内券商、银行大量的客户经理将有机会被服务及赋能,以帮助更广的潜在客群。 熵简科技从AI模型的角度,表示AI已经不再仅仅作为辅助工具,而是在多个领域发挥着日益显著的影响。开源必将成为AI在金融领域发展的未来趋势。目前,开源与闭源模型在这一领域各自拥有显著的黑洞效应,这两个领域有可能分别诞生类似谷歌和苹果的头部企业,形成双重队列格局。目前,已有多家公司在开源大模型领域争夺领导地位,如Facebook的LLaMA等模型,性能方面不断提升。然而,何时能够追赶GPT-4的表现仍有待观察。 *LLaMA(Large Language Model Meta AI,大语言模型元AI),是Meta AI公司于2023年2月发布的大型语言模型。它训练了各种模型,这些模型的参数从70亿到650亿不等(维基百科,2023)。 总结 在如今热闹非凡的国内人工智能热潮中,各个细分行业的AI厂商迎来了较大的机会。人工智能技术在金融领域已经展现出了深厚的应用前景,覆盖了智能客服、内容科技、投资决策等诸多领域,这无疑凸显了AI技术的无穷潜力。 随着AI技术在金融领域作用的日益凸显,随之而来的挑战也日益突出。数据安全问题将会是一个不容忽视的议题,由于金融行业的专业知识壁垒,对于数据的深度挖掘和应用人才的需求也随之增加。 AI创业者将在金融赛道中看到的,不仅有机会,也有必须跨越及克服的特定门槛,只有克服这些门槛,配合底层技术的优化迭代,加之与业务场景的深度结合,才能充分发挥AI在金融领域的优势,为金融机构提供更加智能化的解决方案。 参考文献 [1] Epam (2023) AI for Fintech. Be the One to Change the Industry [Online], Available from: https://anywhere.epam.com/business/artificial-intelligence-in-fintech [Assessed July, 2023]. [2] Nan, H., Peng, L. and Xu, Y. (2023) Whetting All Your Appetites for Financial Tasks with One Meal from GPT: A Comparison of GPT, FinBERT, and Dictionaries in Evaluating Sentiment Analysis [Online], Available from SSRN: https://ssrn.com/abstract=4426455 [Assessed July, 2023]. [3] insider intelligence (2023) Artificial Intelligence in Financial Services: Applications and benefits of AI in finance [Online], Available from: https://www.insiderintelligence.com/insights/ai-in-finance/ [Assessed July, 2023]. [4] Markus, L. (2023) 'Sentiment spin: Attacking financial sentiment with GPT-3',Finance Research Letters, volume 55/part B. [5] The Business (2023) Global AI in Fintech Market Report 2023: Forecast Market Size, Growth Rate and Key Drivers [Online], Available from: https://www.thebusinessresearchcompany.com/press-release/ai-in-fintech-market-2023 [Assessed July, 2023]. [6] Xianzhi, L., Xiaodan, Z., Zhiqiang, M., Xiaomo, L. and Sameena, S. (2023) 'Are ChatGPT and GPT-4 General-Purpose Solvers for Financial Text Analytics? An Examination on Several Typical Tasks', Department of Electrical and Computer Engineering & Ingenuity Labs Research Institute Queen's University & J.P. Morgan AI Research. [7]. 艾瑞咨询 (2023) 中国AI+金融行业发展研究报告. 风险提示:界面有连云呈现的所有信息仅作为参考,不构成投资建议,一切投资操作信息不能作为投资依据。投资有风险,入市需谨慎!lg...