国产分布式数据库到底怎么样?

服务器

浏览数:194

2019-8-20

(本文约2500字,阅读需10分钟)

非国产芯片;

非国产操作系统;

非国产数据库。

三个野蛮、拔横的山大王,牢牢盘踞在信息系统的关键路径上,每年享受大把大把的保护费,时不时还要威胁山后的居民,你们休想走出去。

如果非国产芯片消失有多痛?

2018年的几个大事件得出的答案是,断肠化骨。认清差距,多说无用,实干为先。

如果非国产操作系统消失有多痛?

感谢开源的恩赐,除了PC端,我们的国产操作系统品类还算“丰富”,无论是移动端还是服务器端。但是临近2018年末尾,谷歌宣布将在欧盟开始收取安卓附加费,虽然只是擦个边,没有直接说未来更进一步的方案,但是足以让产业界脊背发凉。

如果非国产数据库消失有多痛?

很痛,但不至于死亡。很痛,是因为关键行业的关系系统,99%以上还是所谓的IOE;不至于死亡,一是因为开源,我们有强大的学习借鉴应用能力,很多非关键系统可以应用的很好,二是是因为我们不是没有可替代的国产数据库,只是不敢用,改革责任甚大,非勇者不敢为先。

战略上讲,钉子户是必须要拔的,只不过需要考虑早晚的问题;但是战术上,拔的动并且拔的极具价值的,也就是性价比最高的,就是非国产数据库。

国家在这方面的号召、指引甚至要求,从未停止。

互联网行业就是这项考核的优等生。为什么呢?

一是互联网行业起步晚,没有历史包袱,直接建设比翻新可是要简单;二是有那个能力自己折腾,可以升级改造维护开源给予的恩赐;三是没有强力监管, 出了问题不至于牢底坐穿,所以不需要通过购买外部服务的形式进行风险转移;四是成本,在技术底色的烘托渲染下,购买服务的成本比养人的成本可是要贵的多。

可是传统行业,电信、金融、工业、政务等这些传统行业呢?

互联网的四个优势,对比下,就是传统行业的劣势。这些传统行业的单位大概率的策略就是通过花大笔的钱购买服务进行风险转移,节省人力成本,原有系统能少动就少动。

但是令人心痛,或者令人兴奋的是,当前的产业环境,不允许传统行业继续这种做法了。

经济环境,下行,压力大;政治环境,高压,不正确;数据环境,暴涨,不够用。

前两个环境决定了“国产”属性的发展方向,最后一个特性决定“分布式”属性发展方向,于是国产分布式数据库产业开始了爆发。

资本的嗅觉是灵敏的,提供这类产品的企业名称越来越多,市面上相关产品类别越来越“繁荣”。

中国体系广为流传的“王婆卖瓜”式营销模式再次开始了纷争,每款个产品都“极度优秀”,每一个企业都“接近完美”。

甲方企业也从“没得选”变成了“不敢选”,看看外面蜂拥而来的“乱力怪神”,很多人略带恐惧的回到以前的舒适区,选择等待同行勇者的扛雷攻略。

“信任”,这个市场最基本的因素,如果不得到解决,死水永远不会翻涌成海。

背景终于交代结束,下面进入本文真正的主体。

让我们通过首份测试数据,来看看国产分布式数据库到底怎么样。(说明,这里特制事务型的数据库,因为分析型数据库更偏向大数据,我们国内做的不错。)

信通院云大所和支付清算协会金融专委会在2017年12月份牵头成立了金融分布式事务数据库,项目组包含5家股份制银行,10家国内顶尖的数据库厂商(具体项目组名单见文末),制定了一份分布式事务数据库技术要求和测试方法,定义了50项分布式事务数据库应该具备的能力,并且在2018年7月-2018年10月期间,征集了6款国内典型的数据库产品,进行了测试验证。

在测试结果公布细节公布之前,首先先感谢参与测评的6款产品。

他们都来自于身经百战、充满自信的厂商,他们有勇气、有自信参与第一批测试,敢于登上“天下第一武道会”级别的擂台,在万众瞩目下展露自己的能力,抛开“王婆”式自卖自夸的手段,这就是拥抱创新改革的魄力。

他们6款产品的详细信息如下图所示。

第一批测试产品信息

接下来简单介绍一下测试的标准。

测试的标准分为6大项,50小项:基本功能(18项),兼容能力(6项),管理能力(14项),高可用(4项),扩展性(4项),安全性(4项)。每一项测试要求都在制定过程中明确了统一的操作方法及预期结果。具体测试项目构成如下图。

分布式事务数据库技术标准

而六家企业的测评结果如下图所示。

分布式事务数据库首批测试结果

上述表格数字化的显示了当前国内第一梯队的厂商产品能力到底如何,囊括这些数字在内,我本人在亲自参与这六个测试项目的过程中,总结了一些更细节的体会和观察,希望这些感悟能够对产业能力的评判增加一些素材。

一、第一批测评企业的完成度总体很高,所有6款产品都达到了85%测试项完成率,头部产品的能力终于得到了数字化验证

二、决定事务属性的分布式事务测试项均得到保障,读未提交、读已提交两种隔离级别均实现,基本业务一致性得到保障,部分企业实现了四种隔离级别

三、6款各产品差异主要集中在兼容性和功能性,例如自增序列、自定义函数等功能的支持

四、当前大数据环境下,各产品已经开始逐步重视外部系统的兼容性,尤其是对于大数据平台类的兼容和集成能力

五、为了解决甲方关心的历史包袱和迁移问题,多数厂商研发了数据迁移工具,以较小代价对接现有数据库系统

六、分布式架构的实现主要分为中间件(腾讯、阿里云、热璞、爱可生)和新型一致性协议(百度、巨杉)两种实现方式

七、容灾能力的主要实现方式为实例级主备或数据分片级主备,部分企业两种方式均实现

八、在50项测试要求中,支持率较低的集中在存储过程、自定义函数、序列、外部表四项

九、各产品在同一项的完成细节度仍存在差距,例如运维统计分析的全面度、备份还原的便捷度、故障管理的感知模式、权限审计的粒度等

说完了这九点感悟之后,我想再次感谢第一批参与测试的6款国产分布式数据库产品,先行者才能决定路的方向,希望你们继续加油。

回到片头的问题,如果非国产数据库消失有多痛?

我们相信,如果科技发展的三驾马车,政策、技术、产业齐头并进,痛是可以减缓的,是可以暂时的,未来一定是光明的。

未来信通院这方面的工作将一直持续,标准将会随产业步伐进行迭代,测试仍将持续招募勇者。希望参与相关工作的数友,可以直接邮箱mapengwei@caict.ac.cn。

虽说任重道远,但是让平凡的生活多了一些意义。

最后附上标准制定的单位名单,感谢这些单位和企业的大力付出。

中国信息通信研究院云计算与大数据研究所

中国支付清算协会金融科技专业委员会

中信银行

北京银行

光大银行

建设银行

民生银行

华为技术有限公司

中兴通讯股份有限公司

蚂蚁金服服务集团

百度在线网络技术(北京)有限公司

腾讯云计算(北京)有限责任公司

广州巨杉软件开发有限公司

上海热璞网络科技有限公司

上海爱可生信息技术股份有限公司

PingCAP

天津南大通用数据技术股份有限公司

腾讯云计算(北京)有限责任公司

作者:外陈内罗