从全面对内到稳步对外:
平安科技的战略转型和技术探索

平安最初以保险起家,逐渐向银行、投资等金融业务拓展,形成了多元的综合金融服务集团。旗下平安科技成立于2008年,前身为平安集团下属的IT信息管理中心,负责集团整体IT规划、数据中心及基础设施建设,以及开发和运营服务等工作。自2013年平安推进互联网战略起,平安科技就开始了互联网金融领域的研发工作。

因此,为探索平安科技在IT转型的时代洪流下如何调整战略和技术架构,如何摸索前行、推陈出新,在这个过程中又通过了哪些科技创新手段实现业务发展和变革,InfoQ对平安科技相关负责人进行了专访,看看他们如何揭晓企业成长背后的苦与乐。

一、平安科技在战略转型下的技术探索

互联网给传统金融企业的IT基础架构管理带来了巨大的挑战。传统金融更注重的是安全、稳定,而互联网则注重敏捷、弹性。互联网金融融合二者之所需,在满足安全稳定的同时,也对IT基础架构提出了更加灵活、弹性的需求。

此外,如何将IT系统的构筑和业务的改善关联起来,实现IT贡献度的可视化,对企业战略和IT转型来说,也同样是非常重要的课题。从业务需求到在信息维度的分析,再过渡到技术架构的分析,这样一系列的拆解过程,才能使企业的业务发展与信息技术架构紧密相联。为此,平安科技在技术方面主要围绕以下五个方面进行了阶段性的探索:

双模式金融云服务建设

随着平安战略转型下互联网金融业务快速发展,其高并发、快速迭代等特点需求,有别于传统金融应用,为此平安科技探索建立起双模式金融云平台,在“两地三中心”传统金融云服务数据中心之外,并行建设了多地同城双活互联网数据中心,保证传统金融业务不受影响的同时,互联网金融业务能够通过科技自主研发云平台快速进行孵化。平安科技的双模金融云的建成,针对综合金融的不同业务需要提供了技术解决方案,为平安集团“互联网+”战略转型提供了坚实基础,是转型成功的有效保障。

早在2013年互联网转型初期,平安科技同步开始了金融云平台“平安云”的建设,和金融业界同行最大的不同,平安科技一直是通过自身强大的IT能力进行自主研发。其提供虚拟化、容器和专属物理机服务,具备优秀的健壮性和扩展性特点,可以充分匹配互联网金融业务的弹性需求,同时满足金融领域特有的高标准监管要求。

云平台在搭建过程中,受限于产业界影响,网络的挑战一直是比较大的,但和业界处理方式(人工操作脚本化、人工触发执行脚本)所不同的是,平安科技从一开始就把网络服务的标准定的比较高。这得益于研发团队驾驭开源社区的能力,在很短的时间内就定义了云环境中多租户网络所需要的抽象网络模型,并通过这个抽象模型实现了对网络设备的服务编排,不仅在自动化出现上比业界方式更高效,在网络数据管理上也较为领先,该模型也因模型的优势获得强大的扩展性,便于更快地推出各种网络服务。互联网类应用对存储的需求相比传统应用提升较多,平安云平台通过分布式集群实现了块存储和创新的对象存储服务,有效满足了互联网业务快速发展,并且也有越来越多传统应用开始使用该对象存储服务。

数据库技术的积累和沉淀

平安科技自成立以来,已经积累了在Oracle数据库上运行金融核心应用的丰富经验,无论从系统运行稳定性、安全性、可靠性还是规范化都在金融业界建立了良好的口碑。

但平安科技并没有满足于现状,早于2013年就开始对开源数据库在金融领域的引入进行调研。当年便根据平安自身的特点和MySQL的特性制定了全方位的架构、开发、运维等规范,不仅成功将部分核心系统运行于MySQL之上,而且采用了分库分表的分布式架构。

此外,随着平安集团的互联网转型以及业务的高速发展,系统的负载越来越大,负载类型以及数据格式也趋于多样化,平安科技数据库团队意识到仅有一两种数据库是不足够的,无法支撑集团的高速发展以及架构上Polyglot Persistence的要求。于是从2014开始,其更加积极地探索和引入多种开源和不同类型的数据库。

在数据库选型上,也充分考虑到人员技能的因素,能够将多年积累的经验复用和最大化,将学习成本将至最低。这也是为什么平安科技要引入PostgreSQL的重要原因之一。同时,数据库团队也将多个运行在Oracle上的金融应用成功迁移到了PostgreSQL,这个过程中积累了大量的迁移和运维经验。做为科技主推的关系型数据库,PostgreSQL的部署量还在继续增长。

到今天,平安科技已经形成了从RDBMS到NoSQL再到In-Memroy数据库的全方位覆盖。在NoSQL中,更是包含了Key-Value, Column Family和Document不同类型的产品,以适应不同格式数据存储和计算负载的要求。更重要的是,在引入和推广这些数据库过程中,没有发生过一起生产故障。当前,平安科技在使用的数据库产品有Oracle、PostgreSQL、MySQL、MongoDB、Redis、HBase、Timesten,总共七种,其内部称之为“七种武器”。所有这些数据库的总运维实例量达到了五六千之多。借助于“七种武器”的合力,可以更好地支撑集团的互联网转型和高速发展。

基础架构快速交付和运维自动化

在互联网金融业务高速发展过程中,IT能否做到快速交付尤为重要,是业务迭代的基础,平安科技开发了一套行之有效的自动化交付和运维平台,大大提升了交付速度和质量,使得原来一至两周的环境搭建周期,缩短至现在的几小时。

以往的应用环境交付,采取的是“叠积木”方式——由人拆分资源需求,通过流程工具分发各技术领域完成再进行组装,最终交付。这种方式,受制于人和流程等因素,效率和质量难以保证。为此,平安科技凭借历史技术积累,基于自建的平安金融云资源弹性伸缩支持,结合Saltstack等开源软件,自主研发了编排工具及Dolphin等一系列自动化运维平台。环境交付也由“叠积木”转变为“流水线”,极大限度减少了交付过程中的人工操作和繁琐流程。并逐步打通了代码移交上线全流程,形成了IT服务管理和运维自动化无缝对接的平安统一运维平台,真正实现安全、稳定、敏捷、弹性等特点。

智能端到端运营监控

金融业务在稳定性、安全性等方面的要求,标准都大大高于其他行业,平安金融云的可用性和可靠性自然需要一个强有力的运营保障,来保证交付业务的SLA和管理要求。

早年平安科技便以自主研发的模块化、可视化监控工具,从物理层、存储层、应用组件层、网络层、业务层实现监控全覆盖,并建立起监控方法论体系,包括存在性、存活性、可访问性、健康状况和效率、逻辑正确性、安全性全面的监控原则和方法。

在互联网金融持续转型探索中,基于原有的监控理论体系和工具,平安科技又自主开发建立起智能化监控平台——“端到端监控”。通过收集、采集涵盖双模式中基础架构层、数据层、应用层的各类信息数据,监控跨多个业务系统的整个端到端业务流程,以大数据的方式进行分析呈现,并将逐层下钻的IT数据信息与全流程业务对象进行关系映射,做到业务运营角度的IT元素可视化,最终提供主动风险预防、业务影响分析、快速故障根源定位、自动处理恢复的智能化能力。这一智能化监控平台,在平安互联网转型中,有力保障了双模式金融业务稳定运行,据悉平安科技金融云可用率达到99.99%以上,运营能力领先行业。

技术创新探索运用

平安集团拥有金融业全牌照,平安科技作为技术输出,坚持科技引领金融战略,积极在大数据、人脸识别、语音识别、声纹识别等人工智能创新领域中进行探索研究。另一方面,得益于云、数据库、基础架构和运营支持的完善,平安科技孵化了大量业务层技术创新,并且多项创新技术已成功应用到平安诸多业务当中。

例如,平安科技的人脸识别技术,通过三年的应用改进和技术创新,准确率已达到99.993%。其配备独特的活体识别技术,具有识别快、准确率高的特点。平安科技向国际权威人脸识别公开测试集LFW(Labeled Faces in the Wild)提交了测试结果,在无限制条件下人脸验证测试(Unrestricted, Labeled Outside Data Results)中,平安科技人脸识别率以0.9960±0.0031的成绩名列前茅,领先国内外等知名公司。并且已与深圳机场展开实际合作,应用到机场安保、反恐识别高安全性领域,依托平安科技技术平台识别高危场景,共同推进风险联防联控,提升机场整体服务能力。

平安科技大数据平台,已经完成了对所有子公司和相关合作伙伴的数据收集,并通过内外部的数据整合,形成了一个非常清晰明确的体系和不同的模型。并通过人工智能技术对大数据进行深度挖掘,将之运用在诸如风险控制、保险定价、欺诈识别、贷款风控、精准营销等很多金融服务场景中。例如在平安普惠信贷业务的风险控制实际应用上,依靠大数据分析,在审核贷款时能够清晰地通过贷款人过往的数据行为判断其信用情况、还款能力等,提供更精准的客户风控评级。在智能金融方面,通过大数据预测投资风险、对投后风险作预警、舆情信号分析等;在健康领域已有非常多的应用场景使用到平安科技大数据技术,例如基于大数据智能分析的智能健康技术,可以应用于如疾病预测、健康管理等功能。