开源成就访谈|对话林咏华:从 IBM 到智源,一位开源「架桥者」的 AI 征程

摘要

「开源不是一座孤岛,而是连接全球智慧的桥梁。我们不仅要做技术的使用者,更要做规则的定义者。」在《开源成就访谈》的镜头前,智源人工智能研究院副院长兼总工程师林咏华这样说道。她的语气平和,却带着一种不容置疑的笃定。

「开源不是一座孤岛,而是连接全球智慧的桥梁。我们不仅要做技术的使用者,更要做规则的定义者。」在《开源成就访谈》的镜头前,智源人工智能研究院副院长兼总工程师林咏华这样说道。她的语气平和,却带着一种不容置疑的笃定。

在开源大模型进入全面竞争时代的今天,中国 AI,如何从开源浪潮的参与者,成长为不可或缺的构建者与引领者?

从全球化视野,到中国力量的崛起

时间拨回 2013 年。当时的林咏华还在 IBM 中国研究院,亲历了 OpenStack 开源社区的崛起。「我们当时希望中国技术团队能在国际开源核心圈有一席之地,」她回忆道,「那是一个漫长且需要主动『破冰』的过程,从贡献边缘代码、文档开始,一步步走到核心项目。」

这段经历,让她深刻理解了开源世界的运行法则:影响力并非与生俱来,它需要持续的技术贡献、频繁的面对面交流,以及融入全球协作网络的决心。这也成为她后来推动中国 AI 开源走向世界的方法论基础。

十年后的今天,局面已然不同。根据智源每月从 Hugging Face、Modelscope、GitHub 等平台拉取的数据,中国开源大模型的全球下载量在 2025 年迎来了爆发式增长。「尤其是到了十月份,像千问这样的模型月下载量已达 1 亿级别,这在国际上是很难撼动的力量。」林咏华认为,中国已从开源模型的「重要参与者」,转变为不可忽视的「核心贡献者」。旧金山高速公路上出现的 DeepSeek 广告,正是这种影响力外溢的生动注脚。

然而,她也清醒地看到,许多在国内声势浩大的优秀开源项目,在海外却知者寥寥。「问题不在于技术,而在于沟通与可见性。」她分享了一个智源自身的故事:为了将自研的算子库项目推向 PyTorch 生态,团队主动前往国际会议设立展台,与核心开发者面对面交流。正是这种「线下破冰」,最终让项目被 PyTorch 生态正式接纳,全球下载量随之激增。

「不要预设别人不欢迎你,很多时候只是他们不知道。」林咏华总结道,「开源社区里的『墙』其实不存在,关键在于我们是否主动走出去,把桥梁搭起来。」

刷新「自主生态」:话语权,而非重复造轮子

面对国内关于「自主可控」等同于「一切自研」的争论,林咏华的观点鲜明而务实。

「在 AI 时代,如果所有代码都要从零自己写,我们根本无法跟上迭代的速度。」她以编译器为例解释道,「像 Triton 这样的编程语言,已是全球开发者共用的工具,无所谓属于谁。真正的『自主』,在于我们能否定义其演进的优先级。」

她介绍了智源的实践:针对 OpenAI 开源的 Triton 语言,由于原生的 Triton 编译器在支持多芯片架构上明显不足,并存在效率问题,智源联合高校与企业「派生」出一个名为「FlagTree」的 Triton 语言编译器的下游社区。这个社区保持与上游的最新重要能力同步,同时能优先集成和支持许多国内新型 AI 芯片架构,并进行了诸多性能的优化,目前已经成为了支持 Triton 语言的重要编译器开源项目。

「自主,不意味着每一行代码都要自己写,而是意味着在技术发展的关键路径上,我们拥有定义方向和节奏的话语权。」林咏华强调,这是一种「站在巨人肩膀上再创新」的智慧,其核心是参与甚至主导全球共有的技术基座,而非在封闭体系中重复建设。

构建开源底座:FlagOpen 的雄心与责任

从轰动一时的悟道大模型,到如今系统性的「FlagOpen」大模型技术体系开源,智源的策略体现了系统性思维。

「模型开源只是冰山一角。支撑大模型的数据、评测体系、系统软件,才是托起它的真正底座。」林咏华介绍,FlagOpen 旨在将包括大模型算法、数据处理、训练框架、评测工具等全栈技术开源,形成一个可复用的「AI 基础套件」。

其中最引人注目的,是旨在打破算力生态壁垒的「FlagOS」技术栈。FlagOS 试图在多样化的 AI 芯片之上,构建一个统一、高效的运行层。「这不仅是中国的需求,也是全球的期待。」

然而,这条路的挑战巨大,FlagOS 要面对十几种不同芯片。「如何既保持通用性,又逼近极致性能?这需要汇聚众智。」这也是该项目中文名定为「众智」的原因——以开源模式,汇聚产业与学术界的共同智慧。

「打造底座,最关键的是持之以恒的责任心和中立的开放心态。」林咏华说,「我们要做的不是昙花一现的项目,而是一个能让社区信赖、长期维护的『基座』,并且始终保持开放,吸纳全球的优秀成果。」

下一波浪潮:用 AI 发展 AI,赋能每一个人

展望未来,林咏华认为开源 AI 将更加「百花齐放」。模型尺寸会因场景而异,技术路线也将超越 Transformer 出现更多创新。而下一波显著的机会窗口,在于「用 AI 加速 AI 自身的发展」。

「像 FlagOS 这样复杂的底层技术栈,如果只用传统方法开发,追赶的速度永远赶不上差距拉大的速度。」她透露,智源已将「AI for AI」作为战略重点,例如开发 AI 辅助的算子生成工具 Triton-Copilot、利用智能体(Agent)技术进行代码自动迁移等,目标是让 AI 工具来帮助更高效地构建 AI 基础设施。

更令人振奋的是,通过「OpenSeek」这类项目,智源正试图降低前沿研究的参与门槛。OpenSeek 以完全开放的方式,公开训练计划、代码与数据,召集全球开发者以小组形式共同改进算法、贡献数据,最终合力训练出新一代模型。

「这打破了『大模型研发被巨头垄断』的迷思,」林咏华说,「它让任何一个有聪明想法的研究员或学生,都有机会在顶尖模型上验证自己的创新,真正站在了巨人的肩膀上。」

给开源后来者的话

访谈尾声,提及对新一代开发者,尤其是女性开发者的建议,林咏华的回答朴实而有力:「参与开源,可以从提交第一行代码、修复第一个 Bug 开始。它不仅仅是程序员的事,运营、布道、文档、生态合作,每一个角色都不可或缺。」她说,「开源是一扇通向全球的窗户,它能给你的职业成长和视野带来意想不到的收获。关键是要行动起来,不积跬步无以至千里。」

从 IBM 的全球研发,到北京智源人工智能研究院的中国实践,林咏华始终践行着「连接」与「构建」的理念。在她看来,中国 AI 开源的道路,既不是闭门造车,也不是简单跟随,而是在深度融入全球协作的基础上,于关键处积累定义规则的能力。这或许正是中国 AI 从技术应用大国迈向创新策源地,所必须经历的一场范式转变。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。