一、项目简介

数字化转型的浪潮下,金融业系统原先的模式,已经无法满足「以客户为中心」的业务快速创新的需要。伴随新技术不断出现,快速部署和迭代,多业务同步开发和上线成为趋势,对核心系统的整体升级改造亟待开展。

2020 年 12 月,腾讯中标某知名银行的核心交易系统项目,涉及基础硬件、操作系统、中间件、数据库、云平台 5 大领域全栈式国产化创新。

腾讯团队与该银行通过多次 POC(Proof of Concept,概念验证),开展深度技术交流,协助规划数据库标准,从 TencentOS 操作系统到 TDSQL 数据库,提供完整的创新解决方案,支撑该银行核心系统持续稳定运行,最终在投产平台日均交易量超 1 亿笔的基础上,做到了 0 故障。

二、解决方案

TencentOS Server 是腾讯研发的服务器 Linux 发行版,提供了专门的功能特性和性能优化,能为服务器实例中的应用程序提供稳定、安全和高性能的运行环境。TDSQL 是腾讯自研的国产化「金融级」数据库,整个过程投入超过 600 人,中国十大银行中的七家都应用了 TDSQL。

TencentOS 与 TDSQL 是天生的一对好搭档。TDSQL 的研发和测试平台基于腾讯自研的 TencentOS 服务器,TencentOS 针对 TDSQL 也做了较多定制和优化,比如网络,I/O,CPU 调度等方面的优化,为 TDSQL 的稳定高效运行提供了强有力的保障。

在调研了该银行的技术需求与基础后,TencentOS 操作系统团队提供了定制的镜像和便捷的 OS 部署系统,针对该银行数据中心使用的场景定制了分区方案,对系统数据安全提供了强有力支持。

在网络部署场景,通过获取定制镜像实现全自动快速部署,大大节约了系统安装的时间,并且无需额外的系统配置修改,做到开箱即用的效果。

三、技术细节

以阵列监控系统为例,在项目中,该银行首次引入和使用了 NVME 设备,为了提高数据的安全性和存取的吞吐量,NVME 磁盘又通过 RAID 来进行统一管理和呈现。因为 TDSQL 对磁盘的 IOPS 以及容量有较高要求,在 TDSQL 项目实际部署过程中,使用了由 Tencent OS 提供的软 RAID 功能。相比于 NVME 硬件阵列卡,软 RAID 能够对 NVME 提供更好的支持以及更佳的性能体验。

针对该银行的 NVME 软 RAID 项目,TencentOS 团队为客户详细分析了内核中 RAID10 的实现原理,提供了软 RAID 性能测试数据以及资源开销情况,同时还提供了一个全方位的监控工具来监控软 RAID 以及 NVME 设备是否正常工作。

从 PCI 层面,监控 NVME 设备是否有掉盘以及降速行为,针对故障盘提供自动化的点灯能力;从设备自身状态方面,扫描设备的 smart 日志判断设备的使用寿命是否将近、是否温度过高、是否有运行时错误以及警告等;系统层面,扫描内核的系统日志查看是否有 NVME 相关报错;性能方面,实时采集 NVME 磁盘的性能数据、分析是否有慢盘以及磁盘夯事件发生。针对 RAID 阵列,监控并采集阵列状态、分析磁盘阵列是否有降级以及错误发生。

TDSQL 数据库与 TencentOS 操作系统的融合,实现了技术方案的完整闭环。项目开展后, TencentOS 团队提供了长期一站式技术支持服务,高效、快速地解决遇到的问题,为该银行的核心业务稳定运行保驾护航。

四、实践价值

TDSQL 搭载 TencentOS 相比社区其他操作系统的性能,在数据库 TPCC 指标测试中有 7-8%的提升,在相同测试方法和磁盘硬件条件下,系统 IO 性能提升 30-60%。

在 TencentOS 与 TDSQL 的技术组合推动下,该银行从集中式到分布式扩展实现高扩展,数据库可视化管理,实现运维监控高度自动化,在安全、稳定和体验方面实现了极大提升,解决数字化转型难题:

  • 核心系统的持续稳定运行,实现 0 故障
  • 基于 NVMe 的软 RAID 方案顺利上线,效果符合预期
  • 阵列监控系统持续监控阵列状态,阵列持续稳定
  • TencentOS 与 TDSQL 的兼容性、稳定性、性能表现更好

项目还通过中国人民银行颁布的《分布式数据库技术金融应用规范安全技术要求》,满足国产化和信创能力要求,满足 5、4、3 级灾备和高可用方案满足业务连续性要求。

小结

操作系统和数据库同为底层基础软件,二者交互频繁,关系密切,需要高度协作支持。TencentOS + TDSQL 的组合,实现操作系统和数据库的快速拉通对齐,避免了由于跨厂商而导致的冗长的信息传递,能够更加高效、快速地解决问题。

TencentOS 蕴含了腾讯在操作系统领域超过 10 年的技术积累,基于 TencentOS 衍生的社区版——OpenCloudOS,集社区之力,针对云原生场景和需求,进行了深度的重构设计,供开发者和中小企业免费使用。TencentOS 和 OpenCloudOS 用户态和 CentOS 同源兼容,相比原生内核稳定性提高 70%、典型场景性能提升 50%,满足用户对 CentOS 替代的需求。

国产化战略下,操作系统等基础软件获得了国家与 IT 产业的重视,其中,互联网企业自研操作系统,正在成为金融领域技术变革的重要力量。依托OpenCloudOS社区的源动力和TDSQL 的高效协作,TencentOS 未来可期。

添加小助手好友(微信号:OpenCloudOS),加入社区用户群,了解更多 OpenCloudOS 与 TencentOS 技术细节。

文章来源于腾讯云开发者社区,点击查看原文