RockAI 参与上海市政协重点课题调研,共话大模型技术发展与实践革新

摘要

4 月 18 日, 上海市政协经济和金融委员会开展「加快新旧动能转换, 推动制造业高质量发展」重点课题调研, 围绕人工智能产业邀请相关部门和企业座谈交流。岩山科技旗下上海岩芯数智 (以下简称「RockAI」) 以其在人工智能技术领域的深厚积累和创新能力, 受邀参与此次座谈, 共话大模型产业发展新趋势。

4 月 18 日, 上海市政协经济和金融委员会开展「加快新旧动能转换, 推动制造业高质量发展」重点课题调研, 围绕人工智能产业邀请相关部门和企业座谈交流。岩山科技旗下上海岩芯数智 (以下简称「RockAI」) 以其在人工智能技术领域的深厚积累和创新能力, 受邀参与此次座谈, 共话大模型产业发展新趋势。

本次座谈会由市政协经济和金融委员会主任严旭主持, 特别邀请市政协副主席肖贵玉、寿子琪参与, 徐汇区委书记曹立强陪同调研。座谈会上, 市领导就「通用人工智能大模型国内外企业差距」的话题询问企业的发展意见。部分企业认为, 国内人工智能大模型已经从去年的「百模大战」进入「淘汰赛」阶段, 当前大模型企业发展的痛点主要是算力和人才。作为以认知智能为基础、专注于自然语言理解及人机交互等核心技术的创新型企业, 岩芯数智代表行业前沿, 积极参与并贡献了专业见解。

RockAI 企业代表邹佳思认为, 虽然在短期内算力和人才是推动大模型发展的关键要素, 但从长远看, 底层技术的创新可能才是关键所在。以 GPT4 大参数大算力的相关数据为例,GPT4 由 16 个 1100 亿的模型通过 MOE 架构组成, 经过百天在两万张卡上完成训练, 耗电量巨大, 应验了算力的尽头是电力。而 GPT5 拥有更大的参数、更大的数据, 需要更多的 GPU 算力, 这些要素都是目前国内大模型企业面临的困难。另一方面, 目前主流基于 Transformer 架构的模型有着与生俱来的幻觉问题, 在个人场景也许是创造力的表现, 但是跟很多企业落地场景是有天然冲突的。

提及「GPT5 会给国内大模型企业带来哪些挑战」, 邹佳思表示, 虽然主流架构的 Scaling Law 依然生效且没到天花板, 但是我们也注意到 Transformer 架构跟人脑的工作模式是不一致的, 人的大脑有 800-1000 亿神经元, 不但可以局部激活而且能工作在 20 瓦的低功率之下。国内一方面固然需要沿着 OpenAI 路线进行追赶, 但是换个角度, 底层架构的创新以及针对企业场景的模型创新或许是新的机遇。

据悉, 通过持续加强核心算法自研和技术探索,RockAI 已从零开始完全自主研发设计了 Yan 架构, 并于 2024 年 1 月发布了国内首个非 Attention 机制的通用大模型——「Yan 1.0 模型」。该创新架构重点关注大模型算力和幻觉问题, 可助力大模型在金融、能源、制造、医疗等风险敏感领域实现广泛应用, 提供性价比更高、更便捷、更可控的 AI 服务。目前,RockAI 已与上海工创中心、华为昇腾、广电五舟等科技企业达成战略合作, 接下来将携手生态伙伴进一步推动创新升级和生态建设。

「我们现在要做的是种一个种子下去, 让这个种子具有良好的基因, 发育成一个胚胎, 最后形成一个巨人。」市政协副主席肖贵玉说, 人工智能背后有巨大的想象空间, 而大模型正引领新一轮人工智能变革, 已经成为全球科技竞争的焦点。他希望各位企业家脚踏实地为「打造基因」献计献策。针对现有教育难以支撑先导产业和未来产业发展的局面, 他表示, 要在机制层面解决人才问题:在教育端创新改革, 连接高校和企业的合作渠道, 达到依靠自身的教育体系为企业提供高端人才人力资源支撑的目的。

「上海要打造 AI 高地, 重点在落地应用, 赋能各行各业解决各类问题。」座谈会进入尾声, 市政协副主席寿子琪总结到, 希望能聚焦「基础大模型怎么做」「架构上如何寻找更优解」「是否能打造本地人工智能企业」等展开调研, 争取率先在具体领域应用取得突破, 对上海推进人工智能产业发展意义重大。

此次座谈会为 RockAI 提供了与政府部门、专家学者以及行业同仁深度对话的平台, 进一步促进了产学研合作, 强化了企业在人工智能领域的发展共识。RockAI 期待与各方携手, 共同推动上海乃至全国人工智能产业迈向更高水平, 为我国经济「数实融合」与持续健康发展添砖加瓦。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。