中国智造定义 AI 未来:听力熊 Teeni.AI 科学家张驰团队发布全球首个自进化手机智能体 AppAgentX

摘要

近日,中国人工智能领域迎来里程碑式突破!听力熊 Teeni.AI 杭州 AI 研究中心首席科学家张驰团队正式发布全球首款通用型自进化手机智能体——AppAgentX。该成果不仅以「成长型大脑」为核心,实现智能体从「工具」到「伙伴」的跨越式升级。相关技术论文已在科学预印本平台 Arxiv 发布,并同步开源代码,引发国际学术界与产业界的高度关注,被评价为「重塑移动端 AI 交互规则的颠覆性创新」。

近日,中国人工智能领域迎来里程碑式突破!听力熊 Teeni.AI 杭州 AI 研究中心首席科学家张驰团队正式发布全球首款通用型自进化手机智能体——AppAgentX。该成果不仅以「成长型大脑」为核心,实现智能体从「工具」到「伙伴」的跨越式升级。相关技术论文已在科学预印本平台 Arxiv 发布,并同步开源代码,引发国际学术界与产业界的高度关注,被评价为「重塑移动端 AI 交互规则的颠覆性创新」。

AppAgentX 的技术突破并非空中楼阁。其前身可追溯至张驰团队于 2023 年发布的初代智能代理工具 AppAgent——这款被誉为「手机 AI 助手」的开创性产品,曾以革命性理念颠覆行业认知。AppAgent 能通过模仿人类点击、滑动等操作,自主完成社交、金融、办公等 50 余个高频场景的复杂任务。它不仅能像人类一样「看懂」屏幕内容,还可通过观察用户行为自主优化操作路径,甚至被用户称为「手机里的数字同事」。

在初代产品的成功基础上,张驰团队历时 18 个月完成技术跃迁,将 AppAgent 的「单任务助手」升级为 AppAgentX 的「全能型大脑」。这一进化不仅体现在性能指标的指数级提升,更标志着中国团队在通用型 AI Agent 领域从「功能创新」到「认知革命」的跨越。

(AppAgentX 的功能示意图)

当前,全球 AI 产业正经历从大语言模型(LLM)向通用智能体(General AI Agent)的范式跃迁。OpenAI、DeepMind 等国际巨头虽在 LLM 领域占据先发优势,但其智能体技术仍受限于固定任务场景与高算力依赖。张驰团队瞄准行业痛点,以 AppAgentX 突破两大技术天花板:通用性——跨应用、跨设备的「即插即用」能力;进化性——通过自我学习将高频操作固化为「肌肉记忆」,首次实现 AI 智能体在移动端的长期自主进化。

技术层面,AppAgentX 执行任务时,把过程分解为重叠三元组,用大语言模型生成页面和界面元素功能描述,合并重复描述,记录交互历史形成节点链。执行中,它引入进化机制,生成「捷径节点」,让智能体跳过逐步推理,直接调用高级动作,大幅提高执行效率。

(AppAgentX 流程设计与功能实现示例)

实验结果显示,在多个 GUI 交互任务测试中,AppAgentX 在单步执行效率和总体 API token 消耗上,均展现出显著的「降本增效」优势,技术实力强劲。

业内人士分析,AppAgentX 的发布或将重构全球 AI 产业格局——其「自主进化」的技术路径,为端侧 AI 提供了可扩展、低成本的落地范式。随着中国 AI 团队持续突破核心领域「卡脖子」难题,一个由中国技术定义的新智能时代正加速到来。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。