全球前沿科技亮「剑锋」,杭州何以抢滩大模型之争

摘要

当前,全球技术创新步入密集活跃期。

撰文/「中国视谷」融媒体中心 苏会会

当前,全球技术创新步入密集活跃期,国内「百模大战」酣战一年格局初显,人工智能大模型整体呈现爆发式发展,逐渐成为产业新型基础设施,加速转动商业化应用齿轮。

大势之下,让我们一起探寻全球大模型生态的发展步伐与涌现了哪些强悍的大模型,崛起了哪些新兴应用?以杭州为代表的国内城市又是如何抢滩大模型阵地,打造新质生产力加速发展的重要「引擎」?

一、溯源进阶:科技巨头引领全球创新潮流

大模型是全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。

追溯 AI 大模型的发展进程,2017 年,Google 提出基于自注意力机制的神经网络结构——Transformer 架构,奠定了大模型预训练算法架构的基础。次年,OpenAI 和 Google 分别发布了 GPT-1 与 BERT 大模型,预训练大模型成为自然语言处理领域的主流。

图 大模型技术迭代历程 来源:《人工智能图景展望:跃迁点来临(2023)》报告

2022 年,AIGC 初步呈现爆发态势,最引发市场关注的是 Stable Diffusion 和 ChatGPT。尤其是 ChatGPT 惊艳问世,在全球范围里掀起了一轮 AIGC 创新热潮,开启「人机互生」新阶段。2023 年 3 月 15 日成为 AIGC 时代来临的关键节点。OpenAI 发布多模态预训练大模型 GPT-4,由此引发了全球科技巨头「互掰手腕」、中国市场「百模大战」的连锁反应。随后,OpenAI 又在今年打造了现象级「爆款」——视频生成大模型 Sora,60s 一镜到底的电影级视频「硬控」了每一位见证者。

图 国内外大模型基座发展示意图 来源:《大模型关键技术与未来发展方向——从 ChatGPT 谈起》报告

从全球范围看,世界各地积极推动大模型研发和应用,美国、中国是主要「玩家」,而英国、加拿大、新加坡等国家和地区尚处于前期尝试阶段,仅个别头部企业开始应用。

现阶段,国外大模型领域主要呈现三大发展模式,包括「龙头大模型+原有业务」、「龙头大模型+外部行业数据」、「开源大模型+自有行业数据搭建行业大模型」,最具代表性的有 OpenAI 模式、微软模式、谷歌模式等,已在自然语言处理、计算机视觉、智能语音等领域取得了标志性技术突破,在模型精度、通用性和泛化能力等方面实现了跨越式发展。

二、大模型之争:「千模大战」与「四省争霸」

大模型之争在国内产业界日趋「白热化」,「百模大战」逐渐演变为「千模大战」。

相比国外大模型「龙头效应」显著,国内大模型的发展模式主要包括「自有通用大模型+外部行业数据」以及「自有或其他开源大模型+自有行业数据」。

而根据应用场景和目标人群的不同,可分为通用大模型和行业大模型两大类。我国具有代表性的通用大模型主要包含百度「文心一言」、阿里巴巴「通义千问」、科大讯飞「讯飞星火认知」等;行业大模型主要涵盖蜜度「文修」、容联云「赤兔」、用友「YonGPT」等。根据运行载体不同形成了端侧和云侧大模型,如端云结合的有 vivo「蓝心」大模型,端侧主要以蔚来「NOMI GPT」大模型为代表。

截至目前,国内 AI 大模型市场尚未出现爆款级应用,面临着算力限制和高质量训练数据集匮乏两大难题,有望倒逼算力基础设施建设加强,以及数据在大规模、多模态、高质量三大维度上的全面提升,其红利和贡献还远未被发掘。

图 基于大语言模型的多模态大模型通用结构 来源:《大模型关键技术与未来发展方向——从 ChatGPT 谈起》报告

大模型不仅在行业内「争奇斗艳」,也在城市之间「打」得火热,托举中国大模型实力稳居全球第一梯队。

截至 2024 年 3 月 28 日,通过国家互联网信息办公室备案的大模型名单有 117 个,其中,北京 51 个,上海 24 个,广东 19 个,浙江 9 个,大模型数量占全国总模型数量的 88%。

图 浙江省生成式人工智能服务已备案信息 来源:杭州市「中国视谷」专项工作组

其中,浙江是大模型孕育的繁荣之地、大模型应用的领先之地。截至 2024 年 4 月 29 日,浙江已备案如阿里巴巴「通义千问」、新华三「百业灵犀」、同花顺「问财」等 11 项生成式人工智能服务。还有一大批垂直类大模型以及处于内测、未开放给公众的大模型不断壮大。

综合来看,浙江省泛人工智能企业主要集中在环杭州湾地区,省内现有大模型也大多数诞生于杭州,来自「中国视谷」产业生态企业,成了杭州助力浙江加快培育新质生产力的强大引擎。

图:「中国视谷」精神堡垒 来源:杭州市「中国视谷」专项工作组

例如,「中国视谷」正前瞻布局一批大模型相关未来产业,培育发展超大模型类脑计算,将推进知识增强、跨模态统一建模、提示学习、持续学习等技术在超大模型中的创新应用,加快超大模型在机器视觉、多模态、人机交互等领域应用。同时,鼓励龙头企业、科研院所开展多模态通用大模型研发并向中小企业开放模型应用,围绕模型开发搭建开源开放平台(社区),构建基于开源开放技术的软件、硬件、数据、应用协同的产业生态。

三、城市案例:杭州打造「模型即服务」新模式

当前,杭州加速引领全省人工智能产业的特色化发展,推进「模型即服务」新模式,支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型,鼓励相关技术和算法开源开放,推动「中国视谷」产业生态企业合力探索大模型的商业化应用进程,形成了「1+N+X」的协同创新、双向赋能产业生态。

图 MaaS 模式下的 AGI 基础业态分析 来源:《人工智能图景展望:跃迁点来临(2023)》报告

例如阿里巴巴「通义千问」已迭代 2.5 版本,落地应用速度不断加快,赋能天文、PC、文旅、航空、矿业等多个领域。根据阿里云公布的最新数据,目前通义大模型已经服务超 9 万家企业,通义开源模型累计下载量突破 700 万。

图「通义千问」已迭代 2.5 版本 来源:阿里巴巴

新华三集团则一直积极推动智能算力的创新与发展,秉持「1+N」大模型策略,以国内首发的私域大模型百业灵犀 (LinSeer) 为基础,开放合作了 N 个业界优秀的通用大模型和行业细分大模型,为垂直行业和专属地域客户提供订制、独享、生长的智能化服务。为推动大模型、AIGC 等应用与政企丰富场景的深度融合,新华三业已率先推出了 AIGC 灵犀一体机。

图 灵犀大模型 来源:新华三

再看宇视科技的「梧桐」大模型。2023 年,宇视领先 AIoT 行业率先推出了「梧桐」,并与多家行业龙头联合启动「梧桐大模型种子合作伙伴计划」,探索大模型在交通、教育、零售、体育公共服务等领域的端边云侧的深入落地。经过一年的技术迭代和生态共建,宇视又推出了升级版 AIoT 行业大模型「梧桐 2.0」,并发布「猎光 2.0」AI-ISP 图像引擎感知终端等一系列大模型产品,打响了 AIoT 行业「装备大模型化」的第一枪。

宇视科技创始人、总裁张鹏国认为,「大模型技术是 AIoT 行业当下最大的技术变量,必定会带来新的市场机会点。一个大的机会点就是大量在网产品的更新迭代。借助于行业大模型技术,边、端产品有望用更低的成本,在某些细分场景下实现更好的应用效果。」

此外,还有海康「观澜」,大华「星汉」、安恒信息「恒脑·安全垂域大模型」、恒生电子「Light-GPT」、实在智能「塔斯」,以及致力于大模型与智能体技术普惠落地的联汇科技,近期全新发布了第二代思考大模型 OmChatV2,推出了第二代多模态智能体 OmAgent,并完成了与多款国产 GPU 的适配与性能验证。

由此可见,杭州的大模型生态呈现「百花齐放」的态势,充分发挥了链主作用,并部署集聚更多国内软硬件设备厂商、核心元器件厂商、解决方案应用商协同发展,共同做强做优做大智能物联产业集群。

聚焦大模型的「扼喉之处」的算力层面,根据《关于加快推进人工智能产业创新发展的实施意见》《关于高标准建设「中国视谷」高质量发展视觉智能产业的实施意见》等系列政策显示,杭州一要建设算力中心,创建国家公共算力开放平台,打造算力高地和模型输出高地;二要推进算力供给市政化,全市每年设立总额不超过 5000 万元的「算力券」,重点支持中小企业购买算力服务。

预计到 2025 年,杭州将基本形成「高算力+强算法+大数据」的产业生态,打造成为全国算力成本洼地、模型输出源地、数据共享高地,人工智能创新应用水平全国领先、国际先进。

抢滩未来,杭州这座数字之城加快实施「人工智能+」行动推进数字经济二次攀登、五大产业生态圈提能增效,推动以大模型为代表的新技术加速规模化、体系化发展,在「中国视谷」的建设进展中不断孕育发展新质生产力的关键变量。有朝一日,算力或许如水电一般即取即用,AIGC 步入新一轮爆发期,人工智能全面赋能新型工业化,推动人类社会快速迈入高度智能化时代。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。