演讲实录|陈志标:自主原创、行稳致远
本文为“2024国产数据库创新大会”深算院首席技术官兼崖山科技总裁陈志标的演讲实录分享,主题为《自主原创、行稳致远》,欢迎阅读。
各位领导、嘉宾,下午好!我是崖山的陈志标,今天很荣幸在这里跟大家分享我对中国数据库的思考和创新实践。
金融行业面临自主可控与业务创新双重挑战
我们正处在百年未有之大变局中,中国的科技以前所未有的速度登上国内国际大舞台,我国的数据库也是如此。过去十年,国产数据库在党政、金融等行业进行了试点,取得了令人非常瞩目的成绩,但也充分暴露了当前国产数据库在产品和技术上的不足。目前国产替代已进入“深水区”和攻坚阶段——从试点到全面推广,从一般业务系统到核心业务系统的全面替代,规模化和核心替代是这一阶段的主要特点。我相信这是基础软件的黄金时代,只要抓住并利用好这样的时代机遇,中国一定会孵化出一批伟大的基础软件公司。
国产替代对我们而言是机遇也是挑战。以金融行业为例,我们来看一下其面临的挑战。首先,金融行业面临安全可靠的挑战。国家网络安全部门和金融行业监管部门对金融行业安全可靠等合规性提出愈加严格的监管要求。按照“能替尽替、真替真用”的原则,根据统计,全国有5000多家金融机构,有近百万业务系统需要在未来几年内完成替代。这些都意味着在安全可靠保障、用户体验不变的基础上,要投入少、替换快,也就是快、稳、省。过去靠堆机器、堆人力的业务改造方法,在规模化和核心替代的今天已经不适用。
强安全、稳保障、高兼容、“零”修改、高抗压、高可用是金融行业的生命线,特别是在大压力场景下,性能和可用性必须全面对标国际标杆。
同时,金融行业也面临创新发展的挑战,行业新需求、新场景、新模式层出不穷。充分利用大数据、云计算、AI+等新技术去赋能业务创新,是金融科技的新业态。尤其是现在的AI大语言模型,从客户服务、产品研发、开放生态等多个方面,将从根本上重塑金融行业,这也对数据管理提出了更高要求。
如何满足金融行业安全可控和创新发展的诉求?我认为今天的我们一定要找到更经济、更普适的规模化替代方案,作为国产数据库,一定要做到能真正对标且超越国际巨头。
对标国际巨头的底气
崖山之志。“立崖山之志,补科技之断层”,这句话从一开始就在我们实验室的墙上,打造国际领先的中国数据库系统是我们的初心。有不少朋友对“崖山”的名字来由感兴趣,它是我院首席科学家樊文飞院士亲自命名,取自南宋著名的保家卫国战役崖山海战,10万军民以死殉国,知其不可为而为之,以生命坚守华夏民族气节、风骨。我们知道,在国内做基础软件很难。我们做崖山也是明知其不可为而为之,希望为华夏民族的软件事业坚守气节和风骨,打造中国原创数据库民族品牌。
崖山之人。在市场化推广时,很多朋友好奇崖山成立短短几年,为什么能从零做出100%自研的数据库产品,还能突破共享集群等塔尖技术。我的回答是:关键在于人,在于团队。崖山的最大竞争力在于我们具有不可复制的人才团队,这里聚集了许多天才横溢的基础研究专家,也聚集了许多坚持板凳要坐十年冷的数据库内核工匠,大家放弃了外部优厚待遇,只为崖山之志聚集在深算院,打造属于中国人自己的数据库产品。
崖山之道。我们一直在坚持全自研路线,践行长期主义。通过原创理论的研究、根技术的突破以及系统工程能力的持续积累,实现“三位一体”全方位突破。在基础理论方面,过去五年我们发表了108篇论文,其中属于CCFA类96篇,属于数据库四大数据库国际顶会论文65篇;当然,这些研究成果不只是停留在论文层面,而是直接解决工业界在工程实施过程中遇到的问题,目前有超过60%已经在系统中应用,共申请知识产权超过200项。
在根技术突破方面,基于有界理论突破的有界加速技术,将大数据变小,实现大数据分析性能数量级提升。在架构层面突破共享集群“塔尖”技术,在具备金融级高可用能力的同时有优异的性能表现,4个节点可以提供超500万tpmC的处理能力,完全具备为核心业务系统提供与国际标杆1比1平替的能力。
在工程实现能力方面,我们坚持每年近2亿的研发投入,践行软件研发IPD流程,将不确定性的软件研发最大确定性化;采用3层质量保障体系,有近百万级自动化测试用例,300多台物理服务器7*24小时不间断测试、运行等等,这些都是为了提供高品质产品所做的工程,也是崖山对标国际巨头的底气。
我们致力为核心业务提供国产替代更优选,实现“三不变、两对等、一更优”是崖山1:1平替方案最核心的价值主张。“三不变”——即应用不变,高度兼容Oracle,一键式迁移,无需业务额外改造;架构不变,采用共享集群架构,行业最佳实践;运维不变,直接复用国内超20万Oracle DBA生态,人才获取成本大大降低,学习成本也非常低。“两对等”——首先是性能对等,在大压力场景下,业务体验不会下降;二是可用性可靠性对等,采用两地三中心,数据不丢失,业务不宕机,可以让运维人员睡个“安稳觉”;“一更优”——100%自研可控,100%满足安全可靠要求。
我们测算了一下,相对于业务系统改造,崖山1:1平替方案能释放50%以上的成本,预计每年可以为全社会节省数百亿的计算资源和人力投入,让更多的资源可以投入到业务创新,让中国企业更好地参与到国际竞争当中。
面向“新质生产力”的高质量转型,崖山数据库基于原创理论在HTAP、多模融合以及关系、图、向量融合分析方面实现技术突破与布局。深算院除了崖山之外,还有另外两款产品,提供“一体两翼”全链条数据管理解决方案——采石矶数据质量系统解决数据质量问题,崖山数据库管理系统解决数据的存、算、管的问题,钓鱼城数据分析系统解决数据的使用问题,助力企业更简单地用好数据,实现数据普惠。
立足当下,崖山想通过真正的1:1平替方案来解决现在面临的核心替代难题,节约社会成本;面向未来,我们希望崖山使能业务创新,更好地释放经济效益。
民族英雄文天祥有两句诗广为人知,“人生自古谁无死,留取丹心照汗青”,这首诗叫《过零丁洋》,是他在广东目睹崖山海战之后写的,还有另外两句“惶恐滩头说惶恐,零丁洋里叹零丁”。我们希望能够致敬先贤,做到“惶恐滩头筑数据底座,伶仃洋侧扬华夏威名”。
自研、高端、根技术,这就是崖山给出的答案。谢谢大家!