华为云数据库首席架构师担任QCon专题出品人,关于数据库他这样说……
2021年5月29-31日,华为云数据库首席架构师彭立勋出席了2021年QCon全球软件开发大会。与以往不同的是,此次大会他多了一重身份——QCon全球软件开发大会“数据库与存储技术”专题出品人,与业界众多数据库领域大咖共同打造了一场精彩绝伦的技术分享盛会。
华为云数据库首席架构师彭立勋现场分享
能够担任QCon“数据库与存储技术”专题的出品人,彭立勋究竟有何过人之处?他又是如何成为MySQL领域的大牛?带着这些疑问,我们对彭立勋进行了采访。
机缘巧合进入MySQL领域,深受MySQL之父鼓舞
通过采访我们得知,彭立勋并非一开始就对MySQL数据库感兴趣,他是在机缘巧合下接触MySQL,进而自学研究,从做DBA(数据库管理员)开始,然后做DA(数据库架构师),再到做内核研发、内核架构工作,经过刻苦钻研,最终成为MySQL领域大牛。
彭立勋有着光鲜亮丽的履历,他曾荣获Oracle ACE Director(for MySQL) 的极高荣誉(Oracle ACE是Oracle授予Oracle公司之外的技术人员的荣誉称号,目前MySQL领域的ACED全球仅有5人)。社区贡献方面也极具影响力,他是为数不多的 MySQL 源码贡献者,并积极参与了 ACMUG(MySQL 中国用户组)的发起和组建,担任该组织的副主席及杭州地区的组织者。同时作为 MariaDB 基金会第一位亚太成员,他是国内唯一的MariaDB提交组成员,向官方提交了 Multi-Source Replication,Thread Memory Usage Monitor 等功能补丁,并积极推进MySQL/MariaDB在中国的普及。
谈及MariaDB,彭立勋还分享了自己与MySQL之父、MariaDB 公司创始人兼 CTO Michael Widenius(又名Monty)的一段不解之缘。有一天他收到一封标题为<Can we use your MySQL patches in MariaDB>的邮件,发件人竟然是MySQL之父Monty。Monty在网上看到了他开源出来的一些补丁,希望他能够授权自己合并到主干。Monty称“这些Patch的想法quite impressed(印象深刻),其中几个补丁的实现思路how talented(很有才华)”。这对一个刚毕业工作两年的新人来说,非常受鼓舞,也坚定了彭立勋一直在MySQL领域继续深入工作下去的决心。
选择华为,与巨人同行共创新价值
加入华为前,彭立勋曾在大型互联网企业和创业公司从事了10+年的数据库工作。他认为,数据库是一个投资巨大且周期很长的技术,必须要坚持长期的投入才能收获成果。华为是一家非常愿意在技术研发上进行投资的公司,拥有强大的研发基因和服务客户的基因。一方面,华为非常重视技术的先进性和软件质量;另一方面,华为对客户的声音也非常重视,对待故障的态度非常严苛。
彭立勋认为,如今数据库行业的发展,站在全球角度来看有两个趋势,一个是开源数据库的占比越来越高,商业数据库占比越来越低;另一个趋势就是数据库部署在云上的比例越来越高,而这其中,云原生数据库的占比快速增加。而站在国内市场角度来看,除了上面两个趋势之外,国产化数据库的呼声和发展得到了前所未有的提升,大量的国产数据库和国产数据库公司如雨后春笋般出现。
但我们必须面对一个现实情况,就是中国数据库行业起步较晚,行业上已经形成了事实上的行业标准,大量的应用系统都是与成熟商业数据库绑定的,开源数据库也已经被MySQL、PG这样的成熟生态覆盖,新的生态想要成熟需要付出巨大的努力,开放是唯一可能成功的道路。
这一点和华为云数据库坚持的生态开放理念不谋而合,因此,他认为华为有能把数据库做好的信心,从而选择了华为。
执着技术不停步,以云原生促进产业智能升级
彭立勋介绍道,华为云数据库坚持走开放生态的道路,目前已支持华为自有生态openGauss和MySQL、MongoDB、Redis、Cassandra、InfluxDB等主流开源数据库生态。
在创新上,华为云数据库实现了一套架构、多种产品的GaussDB架构,SQL Layer提供不同的生态兼容(比如MySQL、MongoDB等),Index Layer提供不同的数据组织方式(比如B-Tree、文档、KV等),Storage Layer使用统一的跨AZ分布式一致性存储DFV。这样华为可以在每一层单独进行演进,一方面可以兼容各种开源生态,另一方面也可以去发展华为自有生态,而底层存储技术可以单独演进,不断提升和数据库的结合能力。
除了技术创新,华为云数据库还积极拥抱云原生,云原生分布式数据库GaussDB系列的设计目标是为了充分利用云基础设施内在的能力,从简单的部署在云上使用云资源的ON CLOUD,到充分跟云基础设施结合长在云上的IN CLOUD。与云原生能力结合的GaussDB系列数据库,具备了跨AZ部署的一致性能力,以及存算分离、极致弹性,多平台软硬协同,数据存储可靠,智能运维等能力。
彭立勋认为,想让更多企业走上云原生转型之路,云厂商需要提供更高效稳定、安全性高的方案,比如客户最为关心的数据库的可用性和弹性问题,以及安全可靠问题,确保用户的数据在云上是安全的,不会发生任何未授权访问事件。此外,降本增效是所有企业都会考虑的问题,云厂商要通过技术手段,在不影响用户体验的情况下帮助用户降低使用成本。
彭立勋最后提到,技术无止境,云数据库未来的路还很长,开放生态、云原生、智能运维将是未来的发展方向。自己会继续脚踏实地,持续深耕技术,用自己的专注和思考给数据库发展注入一滴新鲜血液,为企业智能升级贡献自己的一份力量。
Ps:第三届华为云GaussDB数据库挑战赛火热进行中,还没报名的小伙伴们赶快抓紧时间前去华为云官网大赛活动页报名,机不可失,大家冲鸭!
报名链接:
https://competition.huaweicloud.com/information/1000041405/introduction
好文章,需要你的鼓励
这篇研究介绍了KVzip,一种创新的查询无关KV缓存压缩方法,通过上下文重建机制为大型语言模型提供高效存储解决方案。该技术能将KV缓存大小减少394倍,同时提高解码速度约2倍,在各种任务上性能几乎不受影响。不同于传统查询相关的压缩方法,KVzip创建可在多种查询场景下重用的通用压缩缓存,特别适合个性化AI助手和企业信息检索系统。研究在LLaMA3.1-8B、Qwen2.5-14B和Gemma3-12B等多种模型上进行了验证,处理长度高达17万词元的文本,并能与KV缓存量化等其他优化技术无缝集成。
腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架。研究表明,通过使用自然语言而非传统形式化系统,即使是7B参数的模型也能在复杂定理证明上取得显著成果,超越许多更大的专业模型。这一成果为AI数学推理开辟了新途径,使语言模型能够像人类数学家一样思考和证明。
MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接机制,在通道维度上运作以更好地保留外观特征。实验表明,MAGREF在身份一致性和视觉质量方面优于现有技术,能将单主体训练泛化到复杂多主体场景,为内容创作者提供了强大而便捷的视频生成工具。
这项研究揭示了大型语言模型(LLMs)偏好决策的内在机制。以色列理工学院和IBM研究院的团队开发了一种自动化方法,不需人工预设即可发现和解释影响AI判断的关键概念。研究横跨八个领域(从一般问答到安全评估),分析了12种偏好机制,发现人类评判者重视权威性和清晰度,而AI评判更关注事实准确性。他们提出的层次多领域回归模型不仅能准确预测偏好,还能清晰解释判断过程,为构建更透明、更符合人类价值观的AI系统提供了新途径。