解构英特尔AI内功,为金融业献四大落地宝典

2019 年 9 月 4 日 智东西

看点:金融业需要怎样的AI方案?英特尔献专业软硬件大礼包。

智能金融江湖百家争鸣,多数玩家背后却有同一个后盾——英特尔至强平台。
很多传统企业在将人工智能(AI)部署到自身业务时,往往面临如何将AI与现有高性能计算工作负载有效兼容的难题。 另起炉灶成本太高,从零翻新基础设施显然也不现实,而增强了深度学习能力的英特尔至强可扩展处理器,专为在现有工作负载硬件上运行复杂AI任务的需求而生。
短短几年间,英特尔已经潜移默化地服务了大半个AI金融圈。
这得益于英特尔CPU在计算基础设施领域的根深蒂固、在AI领域的早早布局、在智慧金融实例的长期摸索,形成一套独具一格的“AI+金融”落地宝典。
如今,英特尔将这些经验和智慧,以及典型的服务案例,都融入一本白皮书《英特尔中国金融行业AI实战手册》中,供金融从业者及AI开发者参考。


智能化正渗透到金融业各环节

智慧金融快速成长,并不令人意外。

金融行业有几大特点: 信息化起步早、数据积累丰富、数据标准化程度高、机械化工作方式占比高,这些与擅长海量数据快速处理的AI天然契合。
金融界各种风险屡增,再加上金融普惠化和场景化创新成为必然,亟需对新技术的应用。
比如,最让金融界头疼的“欺诈”问题,在过去几年伴随科技的进步,新招数花样百出,信用卡逾期冻结、死亡骗保、短信验证码套现的场景屡见不鲜,不仅坑了众多民众,也将金融秩序搅成一滩浑水。

就在上周三,重庆警方赴柬押解回国的150名涉嫌电信网络诈骗犯罪嫌疑人,涉及全国100余起案件,涉案金额近亿元。


比如逐渐增加的不良贷款,不仅侵蚀银行利润,占用宝贵信贷额度,还致使优质项目无法及时获得信贷支持,更有甚者引发企业连锁倒闭破产,造成社会危机。

而此时,AI浪潮袭来,为海量数据实时处理问题、经验主义瓶颈、机械性工序耗费人力等问题提供有效的解决方向。

AI与金融的跨界融合似乎已是大势所趋,很多金融机构或自己组建研发团队,或与有AI基因的公司合作,几乎能将AI元素融入从前端到后端的数据分析、风险预测、智能客服等金融业务全流程。

▲金融行业AI场景
在前端,计算机视觉、语音识别、自然语言处理等感知类技术盘踞,常见的应用有身份验证、客服机器人等。
在中台,AI主要用于提高信息分析决策效率,比如多元化分析评估客户行为、提升个性化服务、降低欺诈风险等。
在后端,大量高度重复性工作被机器取代,在效率、准确性和安全性上均较原有人工方案明显提升。

金融需要什么样的AI方案?

智慧金融出现之前,互联网金融还是金融行业的重头戏。
彼时面对极速增长的数据,挑战不断出现:
比如,数据资料是静态的,无法得知实时发生的数据情况,动态数据模式显然已成为金融机构提高竞争力的必竞之处。 另外,数据造假门槛和成本都越来越低,但数据真实性鉴别成本却逐渐上涨。
深度学习可以将大量非结构化数据转化为有价值的智能,对风险预测、实时分析、自动交易、防欺诈等增加效益。

▲当前反欺诈模型常见AI算法
不过,深度学习也有其应用瓶颈,在一些特定情况,比如较小的数据集、成本受限,可解释性强的传统机器学习方法通常会被比深度学习有更好的表现。
另外企业引入AI能力时,通常不仅要考虑高性能,还要考虑成本问题。 深度网络对算力的要求,往往使之需耗费昂贵的硬件成本,而有些计算任务,传统机器学习算法完全可以胜任,不仅能以更快的速度完成迭代,而且大大降低计算成本。
现在学术界、工业界都在推崇深度学习+机器学习的混合方式,而CPU平台非常适合作为这一方式的算力基础。 无论是深度学习还是机器学习,英特尔均对其做了相应的改造,使之能胜任更高效的推理性能。
回到成本问题上,多数金融机构不愿意走完全自研之路。 这主要是因为投入成本大、时间周期长,从上层AI应用到底层基础设施,整一套智慧化升级流程下来,试错成本高。
在这一背景下,英特尔开始为国内外的AI金融发展起到重要的助推作用,帮助金融企业在既有IT基础设施的基础上,更快、更灵活、更低风险的增加AI能力。

加速AI落地金融,英特尔推软硬件“大礼包”

入局AI+金融,英特尔有天然的优势。
在AI推理市场,英特尔至强处理器的普及率非常高,为80%-90%的AI推理助力。
在此基础上,英特尔第二代至强可扩展处理器已经问世,将性能比前代产品提升25%-35%,且特意针对AI应用做了优化,内置矢量神经网络指令(VNNI),扩展了英特尔AVX-512,优化其AI推理能力。
围绕至强,英特尔推出一系列先进的内存、存储、网络和安全等技术及产品,进一步加固数据处理优势。
其中,傲腾数据中心级持久内存当属英特尔革命性的产品,通过创建新的存储层,填补内存-存储架构间的空白,它能部分替代内存,同时比内存更高性价比,并针对第二代至强可扩展处理器做了优化。


同样,英特尔傲腾固态盘也为消除数据中心存储瓶颈而生,采用创新3D XPoint存储介质,从而加快应用速度,降低延迟敏感型工作负载的事务处理成本,有效改善数据中心总拥有成本
除了硬件平台,英特尔也打造了一套与硬件适配的AI框架、库和工具集,既能最大程度挖掘硬件算力,又能降低用户使用门槛。
英特尔面向TensorFlow、MXNet、PyTorch、Caffe等主流深度学习框架做了优化,设计了MKL-DNN性能增强库,以提升这些框架在英特尔架构基础设施上的运行速度。
目前,MKL-DNN已成为众多深度学习框架在CPU上的基本配置。


另外,考虑到很多用户需要兼顾大数据分析和AI处理,英特尔将二者无缝集成到一个统一的平台Analytics Zoo中,该平台基于英特尔至强处理器平台,并融合了MKL-DNN等多种软件库,可大幅提升训练和推理速度。
这样一来,开发者无需移动数据,节省了硬件管理和学习新语言的时间,在提高部署效率和可扩展性、降低总拥有成本的同时,还不会影响计算效率与性能。


针对边缘侧的视觉处理提速,英特尔还特意推出OpenVINO工具套件,通过英特尔AVX-512以及采用VNNI的英特尔深度学习加速技术,在英特尔架构平台上,将计算机视觉相关深度学习性能提升19倍以上。
OpenVINO基于通用API接口在CPU、GPU、FPGA、VPU等各种硬件设备上均可运行。 借助这一工具套件,开发者无需改变软件,即可快速完成硬件升级和算法移植,


纸上得来终觉浅,英特尔还有一大优势,即是在过去几年和金融客户的合作实践中,积累了大量AI部 署的经验,能为AI基础设施硬件和技术套件的规划提供针对性的方案,如中 国银联、中国人 寿、中国平安等都是英特尔的生态伙伴。

对症下药,破解金融风险危机

经过和金融客户的广泛合作,英特尔从对金融行业痛点的了解逐渐深入,针对常见的反欺诈和信贷逾期两类问题,研究出一些经过验证的有效解法。

1、金融反欺诈:三层融合的”三明治”模型

面对“欺诈”这片难以打击的黑灰产,金融产业也不得不拿起新的武器——金融反欺诈应用模型,和各种风险行为斗智斗勇。
中国银联是国内唯一一个成功连接全国各地不同银行自动取款机的银行网络,每年要处理200亿单支付业务,其中支付渠道正趋于多样化,也带来更大的风控压力。

▲中国银联电子支付研究院智能分析服务平台架构图
在模型设计上,英特尔发现三个“顽疾”: 学习用户行为的算法应用时间不足、用户行为交易数据不足、正常和非正常交易数据不平衡。
传统反欺诈模型都是基于规则算法,需定期耗费大量资源总结交易业务和更新规则,造成资源消耗和增加时延。
深度学习模型的优势是能对规则自我学习,但单一深度学习模型不擅长单笔交易内的特征学习。
针对这一问题,中国银联和英特尔的思路是融合学习,他们提出创新的“三明治”多层反欺诈侦测模型“GBDT->GRU->RF”模型。

▲GBDT->GRU->RF三明治结构反欺诈模型
循环神经网络GRU模型,是反欺诈AI应用中常用的方案,新的三层方案并没有直接使用GRU进行欺诈判别,而是将其作为模型的中间层,前端通过英特尔Analytics Zoo工具,引入GBDT模型进行特征优化,后端叠加随机森林模型。
新风控系统在短短数月就达到最佳训练模式,相比基于规则的风控系统,新系统涵盖率高达60%,精确率实现20%。

▲GBDT->GRU->RF三明治结构反欺诈模型评估效果
数据非平衡性同样是反欺诈应用常见问题,英特尔也提供相应建议,如在采样和训练期间,可基于对数据量大的正常样本正常采样、提高欺诈样本权重、随机打乱次序多次训练欺诈样本的策略。
此外,在实践过程中,英特尔发现算法准确度会受不同方法组合的次序的影响。 经测试,在2个特征内提前特征性的方法间,加入特征间提取特性的方法,准确率最高。 三明治结构还使用旁路加强特征重用。
银联的训练集群全部采用了英特尔至强处理器平台,上述整套风控系统均基于英特尔Apache Spark计算集群和BigDL深度学习平台,由英特尔设计架构和提供数据建模、参数调优等支持,中国银联已将该系统进行封装和整合,并以API接口形式提供智能分析解决方案。

2、信贷逾期风险:LSTM+传统机器学习模型

除了反欺诈,信贷逾期风险同样是长期困扰金融界的症候,信贷风险管控已成为银行风控系统的重要内容。
信贷风险预测主要由两类应用场景,预测方案存在人工投入大、周期长、质量良莠不齐、受多种因素影响的问题,给银行带来成本和管理压力。
目前业界常用机器学习或深度学习的方法来构建预测模型,用NLP方法研究和预测环境数据,英特尔在和金融用户的合作探索中,选择构建基于LSTM和传统机器学习的混合模型。

▲模型融合的整体结构
其中,机器学习模型XGBoost是已经被广泛运用到信贷逾期风险预测方案中。 该模型由大量分类回归树集合成的强分类器,相比GBDT等机器学习方法,它有4个特点:
1、支持并行计算,可充分利用处理器的多线程能力;
2、XGBoost在其代价函数中引入正则化,可有效控制模型的复杂度,防止过拟合;
3、支持列抽样方式,可有效防止过拟合、降低计算复杂度;
4、对代价函数进行二阶泰勒展开,预测效果更强。
LSTM是循环神经网络重要的衍生模型,基于LSTM的深度学习方法可大幅提升时序分析工作的效率,但缺乏可解释性; 基于树的传统机器学习方法是信贷逾期风险与此模型常用的技术,预测结果具备较高可解释性。 两者训练结果进行加权融合,准确性和可解释性均提高。

▲贷款逾期风险混合预测模型软件栈
这一方案已在某银行用户处实践部署,数据显示,新方法比人工预测方案准确性提升2倍,预测时延缩短到2天,在线预测方案的每笔预测时间小于1秒。 双方还计划进一步探索用NLP方法研究和预测环境数据。

提高业务水平,精准营销和影像分析新解法

除了帮助金融用户构建降低常见风险的模型,英特尔也帮助多家金融企业用英特尔开源“大数据分析 +AI” 平台Analytics Zoo中的各种AI模型,优化自身业务流程,通过更精准的用户行为分析,优化服务质量。

1、精准营销:NCF+WAD模型

精准营销和个性化营销正成为许多行业提高服务质量的重要应用。 基于金融行业较高信息化水平和数据优势,AI在金融精准营销中的策略日益受到更多关注。
推荐模型一般分三类: 协同过滤、基于内容和混合系统。 协同过滤依赖显性反馈和隐形反馈,基于内容的系统依赖大量特征值训练且会重复推荐,越来越多人开始研究基于深度学习的推荐模型。
NCF模型是目前最常用的深度学习推荐算法之一,将GMF结构+多层神经网络融合,获得更好的推荐效果。

▲神经协同过滤(NCF)模型的示例
另外还有一种宽深学习模型,通过将深度神经网络和线性算法模型混合,创建效率更高的推荐系统。
这两种模型先通过英特尔Analytics Zoo可以轻松构建。 比如中国人寿上海数据中心在做险种推荐主要采用了NCF模型,经评估,其推荐系统的命中率达99.8%,超过预期数值; 万事达优化推荐服务时用了NCF和WAD模型,从验证结果来看,精准度和召回率均相比ALS模型有明显提升。

▲万事达深度学习模型比ALS模型的改进结果

2、影像分析:2D ResNet+3D V-Net方案

车险、健康险等保险各个险种都对影像分析有巨大需求,其中健康险技术难度非常高,需要保险公司的工作人员具备专业病理知识和实践经验,能准确评估被保险人疾病情况,AI真诚为有效的医学影像判读辅助手段。
ResNet是当前应用最广泛的CNN特征提取网络,也是2D计算机视觉任务的主流神经网络之一。 另外还有一种叫V-Net的完全CNN被用于处理3D影像数据。
面向英特尔架构优化的Caffe就为RESNET50网络提供了优化版本,而且加入层融合技术,并支持INT8精度推理,从而实现更大幅度的性能提升。

▲面向英特尔架构优化的Caffe在至强可扩展处理器
中国平安就利用ResNet+V-Net方案,以及面向英特尔架构优化的Caffe等框架,在2018年初的肺结节分析(LUNA)评测中,以95.1%和96.8%的精度,刷新了“肺结节检测”和“假阳性筛查”的世界纪录。
包括ResNet和V-Net在内,英特尔推出的工具套件在人脸检测、比对、活检等各模块都有预训练好的算法模型,可以拿来即用,而且模型效果都经过很多实践验证。

结语:加速智慧金融需简化AI升级流程

在数据驱动下的智能化浪潮中,英特尔正以至强CPU为核心技术支柱,不断细化和填补软硬件技术和产品布局,并在长期与金融客户的合作中,积累了大量的实践经验。
经由合作伙伴的助力,英特尔正在着力将其技术尽可能大程度地转化成智慧金融落地经验,打磨出具有针对性和借鉴价值的行业参考方案,推进金融业的AI实践与创新生态的构建。
目前,AI在金融业的应用还处于初级阶段。
银行、证券、保险等各类金融业都在积极引入AI,把控风险、降低人力成本并洞察用户需求,将AI技术理论转化为实际经济价值,提升服务竞争力。
但与此同时,这些传统金融企业也面临着融合AI能力、升级原有IT基础设施的壁垒,要加快金融业智 能化建设,像英特尔这样能提供简化AI升级流程的企业正扮演着至关重要的角色。
点击阅读原文,查看英特尔官网了解更多信息

(本账号系网易新闻·网易号“各有态度”签约帐号)

登录查看更多
0

相关内容

英特尔公司是世界上最大的半导体公司,也是第一家推出x86架构处理器的公司,总部位于美国加利福尼亚州圣克拉拉。由罗伯特·诺伊斯、高登·摩尔、安迪·葛洛夫,以“集成电子”之名在1968年7月18日共同创办公司,将高级芯片设计能力与领导业界的制造能力结合在一起。 维基百科
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
186+阅读 · 2020年3月31日
专知会员服务
121+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
194+阅读 · 2020年3月8日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
292+阅读 · 2019年12月23日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
133+阅读 · 2019年12月12日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
112+阅读 · 2019年10月10日
2019 GAITC 专题论坛之十二丨智慧交通--智慧城市的核心动脉
中国人工智能学会
7+阅读 · 2019年5月6日
【大数据】工业大数据在石化行业的应用成功“落地”
重磅!人工智能即将进入产业爆发的拐点(PPT报告)
机器人大讲堂
5+阅读 · 2018年6月9日
海康威视AI Cloud助力平安城市4.0建设
海康威视
7+阅读 · 2018年1月17日
中国平安股价持续大涨背后
凤凰财经
5+阅读 · 2017年9月13日
Arxiv
6+阅读 · 2018年10月3日
Arxiv
8+阅读 · 2018年1月19日
Arxiv
4+阅读 · 2015年8月25日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
157+阅读 · 2020年6月2日
德勤:2020技术趋势报告,120页pdf
专知会员服务
186+阅读 · 2020年3月31日
专知会员服务
121+阅读 · 2020年3月26日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
194+阅读 · 2020年3月8日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
292+阅读 · 2019年12月23日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
133+阅读 · 2019年12月12日
2019年人工智能行业现状与发展趋势报告,52页ppt
专知会员服务
112+阅读 · 2019年10月10日
相关资讯
2019 GAITC 专题论坛之十二丨智慧交通--智慧城市的核心动脉
中国人工智能学会
7+阅读 · 2019年5月6日
【大数据】工业大数据在石化行业的应用成功“落地”
重磅!人工智能即将进入产业爆发的拐点(PPT报告)
机器人大讲堂
5+阅读 · 2018年6月9日
海康威视AI Cloud助力平安城市4.0建设
海康威视
7+阅读 · 2018年1月17日
中国平安股价持续大涨背后
凤凰财经
5+阅读 · 2017年9月13日
Top
微信扫码咨询专知VIP会员