杨传辉:数据库如何推动从“数据存储”到“AI原生”的变革
222
订阅已订阅已收藏
收藏点击播报本文,约
编者按:随着数据要素市场化配置改革持续深化,制度构建、价值释放与治理协同成为推动数字经济高质量发展的关键议题。在此背景下,人民网·人民数据对话专家学者、地方政府相关负责人、企业代表,共同探讨数据要素高质量发展新路径。
本期嘉宾:杨传辉 蚂蚁集团OceanBase首席技术官
主持人:吴海天 人民网·人民数据研究院研究员
持续打磨稳定性、可靠性、易用性等数据库核心能力
人民数据:数据系统作为核心基础设施,应具备哪些关键能力才能支撑数据要素安全、高效流通?这些能力又如何在实践中逐步锤炼、持续形成?
杨传辉:数据库作为信息技术行业的基础设施,主要应用于两类场景:一是在线事务处理(交易场景),二是在线分析处理(报表场景)。作为关键基础设施,数据库需要具备以下核心能力:首先是稳定可靠,这是最基础也最重要的能力。数据库需保障数据强一致性,确保无任何一行数据丢失;当系统发生故障时,无论是由于服务器故障、机房故障还是整城停电,都能自动恢复,不影响在线服务。其次是灵活性,数据库的应用场景覆盖大、中、小型企业,可适配关键业务系统与多元业务系统,部署环境包括线下机房及各类公有云平台,因此需支持灵活部署模式,既能实现轻量单机部署,也可便捷扩展为分布式集群部署。最后是易用性,需适配多种工作负载,涵盖在线交易、在线分析及AI场景的模糊检索等。应避免通过多套数据库支撑不同工作负载,而是以单一数据库兼容多元需求,降低用户的使用成本与学习成本。
研发此类数据库,一方面需要具备强大的软件工程能力,包括完善的系统设计、严格的编码规范、大规模系统测试及关键算法的理论验证;另一方面,数据库作为复杂软件难以完全规避缺陷,需要通过实际生产系统持续打磨才能逐步稳定。
数据库研发的底层逻辑是“应用驱动技术创新”。以蚂蚁集团原生分布式数据库OceanBase为例,2011年起每年服务于阿里巴巴“双11”购物节的高并发的场景,在这样的场景下每时每刻都要提供服务,确保每一笔交易都不出错,在此过程中打磨了系统的稳定性。
AI时代数据库建设需加强数据与模型的协同
人民数据:随着AI大模型发展,数据规模与处理复杂性爆发式增长,传统数据库“只管存数据,AI平台单独做计算”的模式,在实时性、系统协同等方面面临新挑战。在您看来,面向AI时代,数据库需要具备哪些关键能力,才能从“数据的保管者”真正转变为“智慧的赋能者”?
杨传辉:2025年大模型企业应用开始爆发,为了把大模型应用到企业业务流程里,需要把企业的私有数据跟大模型的处理能力结合在一起。这既涉及企业数据处理,也关乎数据与模型的协同。因此,AI时代的数据库主要具备三大特征:第一,支持非结构化数据直接处理。传统数据库以结构化数据处理为主,而AI时代的数据库不仅需处理结构化数据,还需支持非结构化数据处理,具备多模存储能力,可针对非结构化数据建立向量索引、图索引、全文索引等语义索引,实现多类型数据混合搜索,为AI大模型提供精准上下文,提升推理准确率、降低推理成本。第二,适配机器访问的弹性扩缩容能力。传统数据库的使用者以专业技术人员为主,需通过开发应用操作数据库;而AI时代,非技术人员也可通过与大模型对话构建专属AI智能体,使得AI智能体数量实现量级增长。这类智能体的访问特征表现为“多数低访问量、少数高突发访问量”,因此数据库需要具备更强的弹性扩缩容能力:低访问量时精简资源占用,高访问量时可秒级扩容,并支持冷热数据分离。第三,实现数据与模型深度融合。传统数据库与大模型分离的模式在实时性、系统协同方面存在明显短板,而将模型能力直接集成于数据库内部,可有效解决这一问题。
构建开放、协同、可持续的数据库生态体系
人民数据:数据库未来应如何与上下游产业链及科研机构协同,才能构建更好的生态体系?
杨传辉:自研数据库的发展可分为三个阶段:第一阶段是实现核心技术创新,第二阶段是将技术创新转化为产品,应用于不同行业与场景,第三阶段是打造开放、协同、可持续的生态体系。构建数据库生态体系,核心需秉持“开放共赢、长期主义”理念:作为基础软件,数据库企业需以共赢心态持续投入,与上下游软件完成深度适配;同时聚焦底层存储技术研发与服务兜底,让合作伙伴专注于上层应用开发与基础服务落地。同时,需坚持开源开放路线。开源不仅能加速数据库的普及推广,更是国产数据库实现换道超车的有效路径。此外,深化产学研融合。数据库建设既涉及理论研究,也涉及产业实践,从产业实践过程中抽象出真正的痛点问题,通过高校的理论抽象发表成论文,可以进一步指导产业实践。在此过程中,人才培养至关重要,可在高校开设国产数据库相关课程,通过数据库大赛等形式提升学生动手能力,培养兼具理论功底与实践经验的研发人才。
聚焦企业数字化与AI原生应用难点,推动技术价值落地
人民数据:当前,千行百业数字化转型向纵深推进。从赋能实体经济、推动数实融合的角度,AI技术栈与基础软件产业需优先聚焦哪些核心场景或关键领域,才能更好实现规模化价值落地?
杨传辉:数据库的核心价值在于规模化解决企业实际问题,需优先聚焦两大方向:一是解决企业数字化转型中的核心痛点。金融、运营商、能源等行业的核心业务系统,对数据库的可靠性、并发性能、复杂功能有着极高要求,应优先攻克这些行业的痛点问题,在此类场景充分验证之后,应用到其他场景只是系统的适配跟时间投入的问题。二是攻克企业智能化进程中的AI原生应用难题。当前,大量企业已在生产效率工具、知识增强、大模型智能体、行业垂直智能应用等场景应用AI大模型技术,这类AI原生应用发展非常快,通过聚焦这些场景,既能打磨出具备全球竞争力的AI数据库,也能实现技术价值的规模化落地,值得重点投入。(来源:人民数据微信公众号)
关注公众号:人民网财经
分享让更多人看到
- 评论
- 关注































微信扫一扫


第一时间为您推送权威资讯
报道全球 传播中国
关注人民网,传播正能量