备受关注的大模型技术正在加快资管机构数字化、智能化进程,行业机构数字化转型进入新的发展阶段。与此同时,监管驱动的数字化发展新格局,对基金公司网络和信息安全、IT审计与数据安全等提出了更高要求。
为助力行业机构数字化转型与高质量发展,基金年鉴编辑部于7月27-28日线下举办“大模型应用与数据治理专题研修会”,欢迎参加。
【议程安排】
7月27日
模块一
大模型技术与探索应用
09:00-10:30
漫谈:AI与ChatGPT
北京大学教授、博士生导师、烟花算法发明人/谭营
大纲:
一、AI基本概念、发展进程、研究现状
二、AI研究的理论、方法及典型应用
三、AI发展进程中的里程碑成果
四、当今广受关注的大模型,尤其是ChatGPT,以及大模型在金融科技中的应用前景
10:30-10:50茶歇交流
10:50-12:00
大模型在资管领域业务落地中的关键问题
文因互联首席科学家/宋劼
大纲:
一、资管领域自然语言处理发展简要回顾
二、大语言模型(LLM)带来的新范式
现有技术的问题
大模型具备的能力
大模型应用的优势
三、大语言模型(LLM)在资管领域的新应用
提升数据治理效果
赋能投资研究业务
赋能投资顾问业务
打造新一代智库
四、公有大模型的局限性和自有大语言模型的工程落地
模型训练
语料工程(预处理)
提示工程(效果优化)
运维工程(效率优化)
质控工程(后处理)
五、文因LLM落地实践分享——以通过“证券从业资格考试”任务为例
数据准备与清洗
模型训练策略
语义向量化
训练优化
任务比对
硬件投入
经验总结
六、大模型在资管业务落地的规划建议
12:00-13:30午餐、休息
模块二
数据治理与数字化转型实践
13:30-14:15
易方达基金投顾数字化实践及大模型应用思考
易方达基金投资顾问业务部金融科技团队负责人/刘玮
14:15-15:00
南方基金合规数字员工引擎实践及建议
南方基金监察稽核部董事/张澄钦
15:00-15:20茶歇交流
15:20-16:05
工商银行资产托管业务数据标准化及数字化创新实践与探索
工商银行资产托管部数字化推进处处长/段凯鹏
16:05-16:50
平安资产数字化转型思考和实践
平安资产数据团队负责人/戴冰波
16:50-17:35
中泰证券数据治理实践与展望
中泰证券大数据中心经理/高长胜
7月28日
模块三
IT审计与数字化应用风险防范
09:00-10:20
基金公司IT审计实务
毕马威信息科技风险管理与鉴证服务总监/张立弘
大纲:
一、监管要求解读
基金业信息技术监管要求的发展
信息技术审计监管要求
信息技术审计的挑战
信息技术审计主要依据
信息技术审计范围
二、信息技术审计体系核心内容
信息技术治理
信息技术合规与风险管理
信息系统安全
数据治理
应急管理
信息技术服务机构
三、信息技术审计发现分享
审计发现统计分析
各领域审计发现平均数量
常见审计发现成因分析
常见审计发现管理建议
10:20-10:40茶歇交流
10:40-12:10
数据、模型与人工智能技术在基金行业应用与风险防范
通力律师事务所科技与知识产权业务合伙人/杨迅
大纲:
一、数据收集和应用中的风险防范
个人信息保护
数据安全
数据权益
二、大模型开发与应用的风险防范
模型的知识产权保护与知识产权归属
开发环境
委托开发与数据出境
模型的应用:自动化决策与智能投顾
三、人工智能在基金行业的应用及风险防范
人工智能在基金行业的应用
人工智能的隐私风险
人工智能与知识产权
人工智能应用的责任
12:10-14:00午餐交流,会议结束
【嘉宾介绍】
谭营
北京大学教授,博士生导师
工学博士、烟花算法发明人。现为北京大学教授,博士生导师。2005年曾入选中国科学院百人计划,曾任日本九州大学教授、美国哥伦比亚大学高级研究员、中国科技大学教授、香港中文大学研究员等。主要从事智能科学、计算智能与群体智能、机器学习、大数据挖掘与分析以及相关应用的研究工作。主持国家自然科学基金、国家863、973计划等科学研究项目30余项。撰写学术专著多部,发表学术研究论文380余篇,获得国际/国家发明专利授权8项以及最佳论文奖若干,曾获得国家自然科学奖、教育部和北京市自然科学奖,中国科技产业化促进会科学技术奖的卓越贡献奖等10余项。他担任十多个国际期刊的主编、副主编和编委,创立并担任群体智能国际会议(ICSI)和数据挖掘与大数据国际会议(DMBD)的大会主席,曾经担任几十个国际会议大会主席,担任金砖国家计算智能大会联合主席等,是国际群体与演化智能学会主席,是多个国际、国家科学基金和奖励计划的评审专家。
宋劼
文因互联首席科学家
博士,2018年12月加入文因互联,任技术总监,有丰富的本体工程、语义建模和平台开发经验。
本科和研究生毕业于北京邮电大学,2017年获西班牙马德里理工大学人工智能博士,曾任瑞士苏黎世联邦理工学院客座研究员。研究主要集中在物联网、语义网、本体工程、语义建模、规则推理,以及知识图谱在智能设备管理的应用,包括物联网领域的语义数据建模、链接数据的信任和隐私管理和工业互联网。
作为业务骨干参与多个物联网项目(包括中间件,协同框架,跨平台)的语义模型建设和资源整合框架。任ISWC知识图谱领域顶级会议组委,中国人工智能学会会员工委会副秘书长,中国中文信息学会金融知识图谱工作组秘书,在中文开放图谱联盟OpenKG代表文因参与cnShema标准化工作。
刘玮
易方达基金投资顾问业务部金融科技团队负责人
10余年基金行业系统研发与AI技术落地经验,负责项目曾获第八届证券期货科学技术奖三等奖、第七届证券期货科学技术奖优秀奖、第一届基金投顾智能科技金牛奖等荣誉。
张澄钦
南方基金监察稽核部董事
现任南方基金监察稽核部董事,合规数智化团队负责人,牵头项目曾获证券期货业金融科技发展研究中心课题三等奖。
段凯鹏
中国工商银行资产托管部数字化推进处处长
经济学硕士,20多年金融从业经验,先后从事投资后台、财务管理、股权投资、资产托管多个业务领域,熟悉债券、衍生、资金、股权、理财、基金等业务运作。牵头组织工商银行多个重大项目研发,多次参加银行间市场净额清算、交易证实等业务机制设计。目前负责工商银行资产托管业务系统研发、数据治理、新技术应用、增值服务等数字化建设推进工作。
戴冰波
平安资产数据团队负责人
毕业于复旦大学经济学系,获经济学学士学位。在加入平安资产之前,曾先后供职于野村证券、交通银行、埃森哲等多家国内国际知名机构,拥有20多年的金融行业工作经验,其中在海外工作近9年。入司平安资产后,先后参与公司智能债券生态一体化平台的规划建设,实施交付、运维保障等工作。目前主要负责公司整体数据治理工作,涵盖数据治理体系规划,数据管理制度制定,底层数据湖仓建设,上层数据应用开发,数据质量管控等数据相关领域。
高长胜
中泰证券大数据中心经理
东北大学计算机专业,硕士,现任职于中泰证券大数据中心。主要从事大数据开发、数据治理、数据质量、数据分析等工作近十年。先后历练过大数据售前、开发、运维等岗位,对前台和后台技术都有所了解,参与过金融、电力、海空军等多个大数据平台的建设,参与和见证了国产大数据技术和业务的发展,并在金融、电力、军工等大数据应用系统、大数据模型系统、数据挖掘系统和数据报表系统类项目中担任数据分析、项目经理等岗位。拥有DAMA、PMP和山东省大数据中级证书,参与过中泰证券的DCMM评估建设。目前主要负责数据治理工作,在元数据和数据质量体系建设方面展开探索和实践。
张立弘
毕马威信息科技风险管理与鉴证服务总监
金融风险管理师FRM,中国注册会计师CICPA,注册信息系统审计师CISA,注册内部审计师CIA。具有16年以上服务金融行业相关工作经验,拥有着丰富的财务审计、内部控制审计、信息系统审计、管理咨询等方面实务经验。
作为现场工作负责人和项目负责人,连续多年参与中国多家大型国有银行、股份制银行、城市商业银行、证券公司、公募基金公司、互联网金融公司等金融机构的信息系统审计工作。
按照证监会《证券基金经营机构信息技术管理办法》的要求,负责多家证券公司和基金公司的信息技术全面审计,涵盖信息科技治理、信息技术合规与风险管理、信息技术安全、信息技术服务机构等。
杨迅
通力律师事务所科技与知识产权业务合伙人
毕业于复旦大学法律系,获法学学士学位和法理学硕士学位,后于美国哥伦比亚大学获得LLM学位。同时拥有中国律师资格和美国纽约州律师资格。在加入通力之前,曾先后就职于多家国际知名律师事务所,并于上海、香港、伦敦等地工作,拥有19年的执业经验,其中在境外工作近8年。
长期以来从事与技术有关的法律业务,主要为金融、生命科学、电信媒体和高端制造领域企业的知识产权、信息安全和和法律监管提供法律意见。
受邀在多家知名杂志发表文章,并多次负责为Getting the Deal Through撰写“电信媒体-中国篇”,曾负责编纂《网络法学》,以及参与编写《国际技术贸易指南》等著作。杨律师被Legal 500、LegalBand和《商法》在知识产权领域、数据保护和生命科学领域所推荐。
【参会须知】
1.会议规模不超过150人,基金年鉴入编单位及会员免费参加。
2.出席代表:公募基金、券商及券商资管、保险资管、商业银行等行业机构相关负责人及业务骨干等。
3.详情咨询:010-85822148或电邮:fund@fundmarket.com.cn
国内大模型相关的进展消息每日纷至沓来,行业进入快速发展期,而业内讨论的焦点也逐渐从概念蓝图过渡到产品落地层面。随着大模型的发展热潮涌动,对话式AI正在打开新一轮的商业增量。
中关村科金作为领先的对话式AI技术解决方案提供商,在与先进技术保持同频进步的同时,积极展开相关产品研发及大模型实践的探索。
近期,中关村科金与行业客户携手共创了一些有场景代表性的试点项目,如针对财富业务场景,基于开源基础大模型打造了面向理财师的营销助手,该产品可以实时追踪行业动态,深入理解客户的投资需求,通过用户画像解析构建投资要素,为客户生成专业、客观的投资建议,减少理财师手工撰写文案的工作量、提升理财师单兵效能,同时帮助客户更好地做出投资决策。
中关村科金资深AI产品总监曹阳,于近日分享了在对话大模型上的思考和对话式智能展业助手产品的应用实践。
大模型对AI技术产品化影响的思考
chatGPT对通用大模型训练结果的优越呈现,不仅大幅提升了行业关注度,也标志着人工智能发展进入新的里程碑阶段。GPT全称为Generative Pre-trained Transformer,可译为生成式预训练Transformer模型,是“预训练”和“大模型”结合后一种新的人工智能模式,当大规模数据集在模型上完成预训练后,仅需微调少量数据甚至无需微调,就可直接支撑各类应用。
基于大模型此特性,我们AI技术产品化的路径和思路也要随之发生改变。首先在数据应用层,过去一般是采用结构化数据,而图片、文字、视频等非结构化数据机器无法理解,需要采用高效的并行分布式处理技术,并借助应用自然语言处理、影像处理、社会网分析和机器学习等专业的工具或模型,通过打标和预定义范式对数据搜索、过滤、计算,将数据结构化后再进行处理。
但标签化的过程会产生信息损失,与信息论的原理一致,一旦抽象或者总结必然有信息损失,可利用的信息就会减少。此外,结构化后有损的数据可应用的范围也较窄,多用于特定业务领域,如FAQ知识库、会话流程等。
相比之下,大模型可以直接利用非结构化数据,不用进行“加工”处理,且支持全量无损的内容输入,可运用的数据范围非常广,价值也相对更高。若将大模型产品嵌入企业服务系统中进行升级再造,包括知识检索、数据分析、辅助编程、数字员工、数字人等企业级应用都有可能被重构。可以说,大模型打开了企业数智化转型新的天花板。
其次在产品化思路上也需要进行转变。原先AI技术产品化过程需要对所有内容进行预先定义和梳理,无论是分类模型,还是SOP挖掘,都是既定范式。即在特定场景中,预定义范式后进行数据处理,并训练出对应模型,可以称之为“打标领域知识注入”,是一种预设的机械化方式。
而大模型则是一种受控的自组织化方式。只需把对话、文本、音视频和文档等数据注入大模型中,机器能够按要求进行自主学习和训练,进而完成特定任务。无需人工进行预先处理,便可直接使用结构化和非结构化数据;也无需基于特定业务进行训练,便能解决特定和非特定场景的任务。
两种方式之间有着极大的流程、效率差异。过去预设的机械化方式,无论是预先设定流程还是结构化数据要求,都需要专业人员参与,工作量大、专业性要求高。并且在业务过程中,若要判定预先设定的结构是否适合业务模式,一般只能基于事后分析,无法在事中和事前进行定义。
比如我们今天将会遇见哪个人,会发生哪些内容对话,是无法事先定义的,客服场景也是如此,这也是为什么现在的智能客服大多只能集中在售后。但对于营销而言,事前和事中才是核心,甲乙双方或者买卖双方交易的核心节点是业务关系发生变化,从没有交易到产生交易。因此探索大模型在目前人力成本不断上升但成功率较低的智能客服与营销系统的落地改造十分必要。
大模型在金融业务应用初探
中关村科金一直致力于通过AI技术,构建客户全周期对话式AI服务,助力企业服务生产力第四次跃升。围绕这一理念,中关村科金基于多款开源基础大模型,结合领域知识图谱、领域知识注入、Prompt工程等前沿技术,构建了对话式智能服务平台。依托该平台,针对财富机构展业场景,打造了一款“对话式智能展业助手”的大模型应用产品。
以前理财师跟客户是独立沟通,没有太多辅助工具,而我们希望对话式智能展业助手的推出,能够助力理财师在专业能力上得到提升,在产品的信息获取上更高效便利。
在产品逻辑上,对话式智能展业助手系统的第一步是构建用户画像,提供包括用户基本画像和深层画像、投资经历、关注竞品、投资预测等数据信息。第二步是基于用户画像构建投资策略,类似于炒股软件的策略选股,通过构建投资策略scheme(计划),以prompt(编程语言,用于显示可提示用户进行输入的对话框)的形式与专业资讯进行关联。之后结合大模型的生成提示能力,按照业务预先设定好的SOP(标准操作程序)执行任务,根据每个SOP对应节点选取的业务专家梳理的限定词,生成投资组合推荐,最终生成话术和产品营销方案等。
此外,在过程中我们还可以全流程执行SOP指导,不局限于与客户的沟通过程,而是覆盖整个生命周期。比如设定在用户生日时发送生日祝福;推送教育相关的培训分享等。
上述链路是针对于单个理财师。如果是多个理财师或者整个团队使用,对话式智能展业助手还能发挥更大价值。对所获取的所有理财师与客户沟通的内容进行分析优化后,提炼金牌销售的话术技能同步给普通销售,实现对普通销售的技能赋能,拉齐、提升团队的专业水平。
此外,对话式智能展业助手还可以应用于资产管理中心、运营中心和产品研发中心等,中后台部门通过掌握了解一线人员与客户群体之间的互动、反馈情况,可以及时进行策略调整,从而各业务之间形成良好互动,助力组织智能。
目前,中关村科金的对话式智能展业助手已在与国内某头部信托公司的共创项目中应用落地。该信托公司从业务层出发,将业务服务流程拆解为用户、投资组合、市场和产品四个维度,再结合SOP节点设置,每个节点执行对应策略,大模型根据提示词生成节点话术,并通过限定字数、沟通风格等,使生成结果更加接近理想效果。
销售的核心是信任,信任产生后客户才更容易采纳建议。所以我们希望基于前期的用户和投资策略信息,直观反馈用户应该关注的行业理财资讯。更高的专业度更容易赢得客户信任,我们希望能为理财师提供有效辅助。
在和客户沟通时,理财师可以运用对话式智能展业助手,根据用户画像知道客户关注哪些产品,结合公司当下主推的产品和系统提供的引导策略进行销售,但如果理财师觉得不合适也可修改。而新调整的策略和修改的内容,会反馈给大模型执行再次生成任务,直到得到符合理财师预期的话术和内容。
为了进一步保障生成效果,我们采用了大模型外挂领域知识库和无监督学习+调参的方式,将专业知识、操作手册、业务规范、产品信息、竞品信息等领域知识注入到大模型内,再将客户和行业数据、宏观经济的分析等内容进行关联,理财师按需求选择是否引用提示内容。在大模型思维链推导和无监督学习的能力之上,辅以领域知识库和调参,可进一步加强自然语言处理任务的完成效果。
但目前在领域知识的注入方式上,还需要依赖行业专家进行知识梳理,未来可以考虑通过新的架构或者方案,将该步骤拆分成一个个子环节,转化成专业度要求较低的操作,降低对行业专家的依赖度,实现非高价值的任务批量自动化处理。
这也是大模型的优势之一。从过去依赖AI专家手工调参,进入大规模可复制的大工业落地阶段。通过配置任务要素系统,注入领域知识,进行对话调参,影响大模型节点策略,生成话术内容,形成一个大模型自闭环的业务信息自组织架构,是未来理想的状态。
在这个模式下,市场上现有的系统都可以用大模型的思路再造一遍,大模型为ToB领域带来了一个新维度的市场。原来是基于特定的结构化数据建立特定的模型,未来可能是一个大模型获取相应的结构化或非结构化数据,通过特征工程(利用领域知识从原始数据中提取特征、属性的过程)控制完成所有任务。
而如何将特征工程更好地控制应用和落地到实际业务当中,还需整个行业共同探索。目前,中关村科金已自主研发了包括大规模对话语言模型、知识图谱、语音识别、语音生成等AI技术的对话引擎,未来将持续加大在对话式AI技术上的投入,基于该大模型对话引擎,围绕企业的各种对话场景,打造应用场景更丰富的对话式AI产品,为企业提供更高效完备的营销服一体化综合解决方案,构建人机协同的新型生产关系。