清华大学联合腾讯云攻坚数据库 AI 研究:让数据库听懂自然语言

摘要

DeepSeek 爆火背后,底层数字技术也在求索与 AI 的深度结合。

DeepSeek 爆火背后,底层数字技术也在求索与 AI 的深度结合。

3 月 7 日,清华大学、腾讯云、intel 在北京宣布启动「数据库 AI 联合创新计划」,围绕数据库与大模型的交叉技术展开深度研究,推动数据库智能化升级,同时为 AI 应用构建高效数据基础设施。

这也是国内首个数据库 AI 领域的产学研联动项目。

(图:清华大学、腾讯云、intel 联合启动「数据库 AI 联合创新计划」)

随着大语言模型技术爆发,数据库系统面临从「被动存储」向「主动服务」转型的挑战。传统数据库依赖人工编写复杂查询语句,而大模型的自然语言交互能力可大幅降低使用门槛;另一方面,AI 训练与推理所需的海量数据处理,也亟需数据库在分布式架构、缓存管理等环节实现性能跃升。

针对这一趋势,本次合作规划了两大技术攻坚路径:一方面研发基于大模型的智能查询生成与优化系统(Text2SQL),让用户通过自然语言直接操作数据库,实现艰深的数据库技术也能听懂「人话」;另一方面打造面向大模型推理的分布式缓存产品,解决 AI 任务调度、存储资源分配等核心难题。

在 Text2SQL 方向,项目组提出端到端技术框架,重点突破语义理解、模式匹配、SQL 验证等关键环节。通过大模型微调、强化学习(DPO)与检索增强(RAG)技术,系统可将用户提问拆解为多级子任务,并动态匹配数据库表结构,最终生成高准确率 SQL 语句。

面向大模型推理加速,项目组设计了分布式缓存系统,通过两阶段任务调度、KVCache 优化及 GPU 直连存储技术,显著降低计算资源浪费。

作为合作的重要支撑,腾讯云在数据库 AI 领域已有不少积淀。据腾讯云数据库副总经理罗云透露,腾讯云数据库以 AI for DB 和 DB for AI 作为技术发展的战略方向,在多产品中已集成自适应运维与故障诊断、数据库智能优化、自然语言驱动数据分析等能力,同时依托腾讯云向量数据库千亿级向量规模和 500 万 QPS 峰值能力,为 3000 多家企业构建了 AI 时代的数据枢纽。

此次合作也凸显了「产学研」深度融合的创新模式。清华大学数据库科研组在学术领域连续多年位列 CSRankings 全球第一,腾讯云则拥有业界领先的工程落地能力。双方合作将加速技术研究从实验室到企业生产环境的进度。

清华大学数据库科研组表示:「未来的数据库不仅是存储工具,更是 AI 产业链的数据大脑。我们期待通过这次合作,为全球数据库技术发展提供中国方案。」

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。