对话陈志标:如何推动国产数据库长远发展
前言
近期,深算院YashanDB首席技术官陈志标接受了《湾区科技评论》的采访,介绍了深算院在研究、工程等方面的经验,以及YashanDB产品的研发和推广。
以下是专访内容:
01
从“理论”到“工程”
《湾区科技评论》:能否介绍一下深算院组织架构?理论团队和工程团队是如何配合的?相比其他的高校和企业,深算院的理论研究和产品研发有哪些不同?
陈志标:国家级实验室及先进的科研机构始终是发达国家在科技领域的战略支柱,如美国贝尔实验室、德国弗劳恩霍夫协会等。借鉴贝尔实验室的成功经验,深算院采取了一种独特的“理论+工程”双轨科研创新模式,以市场需求为导向,推动源头创新及关键核心技术的突破,并实现大规模的产业应用。
在理论研究方面,深算院汇聚了全球顶级青年科学家团队,专注大数据领域的原始创新探索,我们不追随热点,而是发现新挑战或是给出经典问题的新思路,引领一个研究方向并持续突破。自2019年揭牌至今,深算院围绕大数据的计算和管理,发表了近百篇论文,其中90余篇发表在CCF 推荐的A类国际学术会议/期刊上,樊文飞院士提出的有界计算、多核并行计算及跨模融合计算理论,将有望为大数据处理带来革命性的进步,具备国际引领创新能力;
在工程方面,作为一个“具备产品能力的基础研究机构”,深算院拥有可与硅谷相媲美的大数据系统工程团队,占比超过八成,团队中拥有数十位具备二十余年经验的数据库内核专家,在行业内首屈一指,具备从产品定义、代码实现到质量保障端到端的工程实现能力,我们坚持从0到1的系统开发,不基于开源系统上进行优化,而是真正掌握底层系统的每一个实现细节。
《湾区科技评论》:传统关系型数据库的发展情况如何?目前面临着哪些问题?深算院的YashanDB在此基础上做出了什么样的改进?
在人工智能与大数据时代背景下,如何提升多模数据查询的优化程度,充分挖掘和运用多模数据的价值,成为未来发展趋势。我们通过融合机器学习与逻辑推理的方法,提出了跨模数据链接、语义级跨模关联等理论途径,实现了跨模计算的易用性,有效解决了跨模计算实时性低、计算成本高的痛点,目前我们已初步实现关系与图的统一计算。
《湾区科技评论》:请介绍一下YashanDB的研发经历。数据库的理论如何进行工程实现,如何把理论应用在产业需求上?其中的挑战是什么?
02
在实际场景中推广
《湾区科技评论》:目前崖山等产品的市场推广状况如何?客户有哪些方面的反馈?还会有哪些方面的挑战?
陈志标:目前,YashanDB已在多个行业及场景的核心系统中广泛应用,如政务、金融、能源、交通和智能制造等关键领域。YashanDB在平滑迁移、性能表现及稳定性方面均展现出了显著优势,获得了客户的广泛认可与高度评价,助力用户在众多核心业务系统中实现了底层技术的自主可控。
无疑,作为新推出的产品,在市场推广过程中我们面临着诸多挑战。尤其是在起步阶段,客户往往担心新产品的性能不稳定、安全性不足或未来的支持不够。因此在PoC验证阶段我们向客户提供了高品质的产品和服务,在性能、安全性和用户体验等方面都能达到或超越了客户的期望。随着客户信任的逐步建立,我们也获得了更多的合作机会和市场认可,慢慢打开了市场局面。
《湾区科技评论》:国产自研的数据库,如何满足用户在数据库迁移时的需求?如何建立自己的服务生态?
陈志标:服务是数据库厂商的核心竞争力之一,我们始终以用户为中心,首先,构建了标准流程与专业工具体系,根据用户问题的严重级别,对问题进行分级管理和专人响应;其次,我们与全国各地的服务伙伴建立了深度合作关系,共同打造一个全国性的服务网络是YashanDB从1走向100的关键。
与此同时,数据库是典型的生态型产业。如何用好数据库、构建数据库生态以及培养人才等成为业界广泛关注的焦点。我们与上下游软硬件厂商“强强联合”,兼容适配了超百家芯片、操作系统、中间件等主流软硬件生态,与深智城、长亮、金蝶、超图等生态伙伴推出企业级联合解决方案,打造互助共赢的生态格局。在人才生态方面,我们推出了数据库人才培养和认证体系,现已覆盖全国20余个省份、数千名用户,持续为行业培养和输送高质量的数据库人才。
《湾区科技评论》:如何考虑进一步完善产品的商业模式?目前市场和服务团队的搭建情况如何?
陈志标:随着客户群体从深圳逐步扩展至全国各地,包括华东、华北等地区,我们的市场和服务团队将立足大湾区,积极布局全国网络。一是加强原厂的市场与服务能力,为直接客户提高更有市场竞争力的产品与解决方案;其次是与全国各地的渠道、服务伙伴建立深度合作关系,并建立本地的办事处,配备当地销售与服务渠道的骨干人员。
未来,我们基于行业应用的实际需求,持续提升产品的硬核能力、持续完善配套工具的支撑能力、持续加强数据库运维和服务能力,并深耕场景,系统打造场景规模化复制能力。
《湾区科技评论》:未来YashanDB研发的重点方向是什么?是更多的从理论出发,还是从目前客户关注的需求出发?
03
国产数据库突破之路
《湾区科技评论》:近几年,国内整体数据库的发展情况如何?有哪些重要的瓶颈需要突破?
陈志标:从商业角度来看,国内的数据库生态圈是繁荣的,据不完全统计国内数据库产品数量有200多款,但反而观之,繁荣的背后也存在着瓶颈制约:首先,在高端核心系统场景中,目前仍以国外数据库为主流,主要原因在于国产数据库的内核性能及高可用保障能力不足,无法做到1:1平替;此外,核心系统对于业务连续性的要求十分高,目前长期依赖于Oracle的共享集群产品,国产数据库尚未在高端领域形成成熟且稳定的高可用解决方案。
更为重要的是,随着大数据、物联网、AI等技术的飞速发展,数据呈现了大规模、多样性、极速增长的态势,对数据处理的新鲜度和融合性提出了更高的要求,例如中国数据量规模2027年预计达到76.6ZB,相当于足以存储约38万亿部2小时的高清电影,基于传统计算模式开发的产品难以应对庞大的计算体量。新应用场景是国产数据库需要重点关注和长期投入的领域,更是实现国际引领超越的关键。
《湾区科技评论》:能否介绍下YashanDB以自主可控的大数据技术破解关键领域“卡脖子”方面的优势是什么?
助力解决国家关键领域“卡脖子”难题,需要在数据处理领域提供具备“根技术”能力,且真正提供高端应用场景1:1平替的解决方案。
《湾区科技评论》:在发展基础软件方面,企业、高校、政府分别扮演着什么样的角色?如何共同推动这一领域的发展?
陈志标:高校之优势集中体现在理论创新及人才培育。相对而言,企业端则更侧重于对接并拓展多元化的应用场景,从而能够更为迅速地推动理论研究成果向实际应用转化。在此过程中,政府扮演着产业布局规划者的角色,并提供全面的政策扶持,以促进产业的稳健发展。
深算院作为新型科研机构,致力于打破一直以来存在的理论研究与工程转化之间的鸿沟。在理论创新及人才培育方面,深算院培养了一批高端的数据库理论和工程人才,为国产数据库长远发展厚植一方沃土,同时与多所高校合作,将自身积累多年的理论与工程经验对外输出;在场景和应用落地方面,秉承“理论和系统并重”的初衷,我们打通科研成果“最后一公里”,基于原创理论开发实用系统,为行业提供领先自主、拥有根技术的原创产品和解决方案。得益于深圳“双区驱动”的重大历史机遇、优质的创新土壤、良好的“产学研用”生态基础,优质的营商环境以及一流的企业发展配套服务,深算院在发展之初获得了政策、资金和人才等等各方面的扶持,才能在短短几年间取得突破性的科研成效以及商业落地。未来,深算院将朝着建设世界一流的计算科学基础研究机构的目标,继续以新模式和新速度高速稳健发展,打造中国原创的基础软件品牌。