周鸿祎受邀到清华授课 解读 DeepSeek 如何重塑全球 AI 格局

摘要

周鸿祎清华授课剖析 DeepSeek:开启 AI 普惠与产业升级进程

近年来全球人工智能技术加速迭代,中国的大模型企业展现出强大的创新活力。尤其 DeepSeek-R1 模型的横空出世,不仅以一系列颠覆式创新重新定义了行业标准,更为全球范围内的 AI 普惠与产业升级提供了全新路径,也因此成为近期 AI 创业领域无可比拟的焦点所在。

2 月 25 日,360 集团创始人周鸿祎受清华大学邀请,在清华校园面向线上线下约 3000 名清华大学的本科生、硕士、博士及创业者等进行了一场主题为「DeepSeek 给我们带来的创业机会」的授课。他以 DeepSeek 带来的变革为切入点,深入剖析 AI 行业发展趋势,并分享了 AI 技术于创业的应用前景。

周鸿祎首先重申了自己在 DeepSeek-R1 模型出现前对 AI 行业作出的十大预判:传统 AGI 发展趋缓,亟待探索新路;慢思考成为新的发展模式;模型越做越专、越做越小、成本越来越低;知识的质量和密度决定大模型能力;多模态越来越重要;智能体推动大模型快速落地;开源效果追赶上闭源,以及中美差距快速缩小等,并指出 DeepSeek-R1 的出现验证了他的预判,且「DeepSeek 的创新更具颠覆性」。

「DeepSeek-R1 和以 GPT-4o 为代表的预训练模型不是同一个物种,R1 突破了大模型 Scaling Law(缩放定律)的瓶颈,为人类通往 AGI 找到方向」,周鸿祎说。

周鸿祎介绍,与「堆显卡」「堆算力」路线的传统预训练模型不同,以 DeepSeek-R1 为代表的推理型模型更加注重逻辑推理和深度分析能力,可利用合成数据解决数据用尽问题,通过逻辑链条推导答案,分解规划,自我反思,学会「慢思考」,在不增加预训练成本的同时大幅提升模型性能和复杂问题的解决能力,因而从预训练 Scaling Law 转变为强化学习 Scaling Law,开辟强化学习新范式。

周鸿祎进一步指出,尽管 OpenAI 的 o1 模型同样采用强化学习方式且更早推出,但与 DeepSeek-R1 相比,其一方面为收费使用,用户规模相对较小,另一方面为闭源架构,技术未公开。因此,免费使用、技术公开且用户规模庞大的 DeepSeek-R1 成为了「AI 发展史上的重要里程碑」。

在周鸿祎看来,DeepSeek-R1 实现颠覆式创新的原因并不局限于技术方面的突破,更好的用户体验,以及开源、免费、低成本等特性同样缺一不可。其在用户体验方面的重要突破在于更加理解用户需求,大幅降低 Prompt(提示词)要求,直接呈现思维过程,展现出像真人一样思考的能力,提高用户的信任度。同时它结合了实时搜索与复杂推理能力,通过网上实时数据矫正模型幻觉。

「DeepSeek-R1 春节期间零广告投入,7 天收获 1 亿用户,创最快应用破亿纪录,关键在于优化用户体验,让人工智能从『不可用、凑合用』迈向『都能用、都爱用』,在中国实现 AI 全民普及,中国有望借此成为全球 AI 普及率、渗透率最高的国家,加速 AI 产业革命爆发步伐。」周鸿祎谈道。

周鸿祎表示,DeepSeek 的开源模式优势尽显,促使全球公司、开发者等纷纷转向开源阵营,从而建立起强大生态,使 DeepSeek 的开源技术成为全球 AI 的「根技术」。在无主动推广的情况下,各国政府、企业、云厂商纷纷接入,影响力辐射全球,引领的开源文化加速中国在全球 AI 领域跻身领先地位。

周鸿祎提到,DeepSeek-R1 模型出现后,中国普通用户使用 AI 工具的先进性和普及率远超美国。一方面企业与政府因其开源透明、可信,从而进行大量私有化部署;另一方面 DeepSeek 将研究成果开源共享,终结中国百模混战,节约大量开发经费。同时众多公司、开发者参与模型优化,并基于其生态开发应用,促进 AI 应用如寒武纪大爆发般蓬勃发展。此外,其适配国产硬件、降低推理与训练成本、公开蒸馏方法等创新,使人工智能技术门槛骤降,创业者有机会与巨头同线起跑,发展中国家也有机会入局,迈向人类命运共同体。

「DeepSeek 又好又免费,每个人都能拥有,从而引爆应用奇点」,周鸿祎说。他认为,未来应用将从六大方向实现爆发:第一,人人智能——DeepSeek 的开源与低成本特性赋能个人拥有自有大模型,成长为超级个体;第二,万物智能——AI 赋能智能硬件全面革新;第三,数转智改——帮助传统产业、制造业打造新质生产力,利用 AI 降本增效;第四,未来产业——低成本低算力需求使模型更容易被部署到机器人等智能设备;第五,科学研究——基于 DeepSeek 的强推理模型,利用科学领域专业知识进行强化学习,打造更加专业的科学推理模型;第六,AI 安全——360 提出「以模制模」新解法,用安全大模型应对 DeepSeek 广泛应用后引发的安全问题。

周鸿祎特别强调了 DeepSeek 如何在政府和企业应用的问题,他表示,DeepSeek 虽然能力强大,个人使用绰绰有余,但要在政府、企业应用需要和场景结合,「不要幻想用一个大模型解决企业所有问题,而是找垂直场景,做专业技能大模型」。他认为企业内部未来一定是多个大模型组合工作,DeepSeek 开源、免费、能力强大、可本地部署等特性是打造专业大模型、垂直大模型、场景大模型的最佳选择。

周鸿祎同时表示,有了场景之后,只有 DeepSeek 还不够,解决企业应用,打造专业大模型,还应解决知识库和智能体打造等问题。其中知识库打造是 DeepSeek 更懂企业的基础,打造智能体则能通过大模型调用各种工具,将日常重复性业务流程形成 Playbook,实现流程自动化。

而对于个人应如何更好地拥抱 DeepSeek,提升 AI 能力,周鸿祎推荐使用「纳米 AI」个人版作为学习 AI、了解 AI、掌握 AI 的工具。纳米 AI 搭载 DeepSeek-R1 联网满血版模型,可实现「实时搜索+复杂推理」的完全融合,且服务稳定;支持语音搜、拍照问,可直接生成答案,并支持文生图、图生视频等多模态功能,用户体验超过 DeepSeek 官方版本。此外,纳米 AI 集成国内 16 家大模型厂商 50 多款模型,用户可按需选择,并可多模型协同。用户还可借助纳米 AI 打造个人的专业知识库和智能体,拥有属于自己的 AI 工具和数字助手。


最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。