香港科技大学团队破解AI手机助手的"记忆难题"

2026-04-06 05:35:20

当你拿起手机,想让AI助手帮你完成一项复杂的任务时,比如先在淘宝和京东上比较AirPods Pro 2的价格,然后把便宜的那款加入购物车,最后把链接分享给微信好友,你会发现现在的AI助手往往力不从心。它们可能在前几步表现不错,但随着任务步骤的增加,就开始"健忘"了——明明刚才查到了两个平台的价格,转眼就忘记了哪个更便宜。

这种现象引起了一个由香港科技大学(广州)、香港科技大学、西安交通大学、香港城市大学、悉尼科技大学等多所知名院校组成的国际研究团队的关注。他们在2026年3月发表的最新研究中,深入分析了这个问题的根本原因,并提出了一种名为"锚定状态记忆"(Anchored State Memory,简称ASM)的解决方案。这项研究成果发表在计算机视觉领域的顶级会议上,论文编号为arXiv:2603.18429v1。

想象一下人类是如何完成复杂任务的。当我们要完成上述比价购物任务时,大脑会自动记住几个关键节点:淘宝上的价格是多少,京东上的价格是多少,哪个更便宜。这些"关键信息点"就像锚一样,稳定地固定在我们的记忆中,帮助我们在后续步骤中做出正确决策。然而,现有的AI系统在处理长任务时,要么试图记住所有细节(就像把整个图书馆都搬进大脑),要么只保留粗略的总结(就像只记住"我去过图书馆"),都无法准确保存和使用这些关键信息。

为了彻底研究这个问题,研究团队首先构建了一个名为"AndroTMem-Bench"的测试平台。这个平台就像一个专门设计的"考场",包含了1069个需要多步骤完成的手机操作任务,平均每个任务需要32.1步操作,最多的甚至达到65步。这些任务都有一个共同特点:后面的步骤必须依赖前面步骤获得的信息才能正确完成。比如,只有先在两个购物平台都查到价格,才能决定把哪个商品加入购物车。

通过在这个测试平台上评估12个不同的AI系统,研究团队发现了一个令人惊讶的规律:无论是开源还是闭源的AI模型,无论是谷歌的Gemini还是OpenAI的GPT系列,它们的表现都随着任务长度的增加而急剧下降。更重要的是,这种下降主要不是因为AI看不懂屏幕内容或不知道该点击哪个按钮,而是因为它们无法有效地记住和使用之前获得的重要信息。

这就好比一个人患了特殊的健忘症:他能清楚地看到眼前的景象,也知道下一步该做什么,但就是记不住几分钟前发生的关键事情。研究团队通过详细分析发现,现有AI系统在长任务中主要面临四种"记忆障碍":一是重要信息丢失,比如忘记了之前查到的价格;二是信息混乱,比如把淘宝的价格错误地关联到了京东的商品上;三是上下文漂移,比如忘记了当前正在进行什么任务;四是进度验证失败,比如不确定某个步骤是否已经成功完成。

基于这些发现,研究团队提出了"锚定状态记忆"这一创新解决方案。这种方法的核心思想是让AI系统像人类一样,只记住任务中的关键节点信息,而不是试图记住每一个细节。这些"锚点"包括六种类型:子目标完成(比如"已在淘宝查到价格"),状态转换(比如"进入了支付页面"),依赖关系(比如"这个价格将用于后续比较"),异常处理(比如"关闭了弹出广告"),上下文信息(比如"用户选择的联系人是Alice"),以及任务完成(比如"商品链接已发送")。

更巧妙的是,这套系统还会建立这些锚点之间的因果关系。就像在大脑中用看不见的线把相关记忆连接起来一样,当AI需要做决策时,它可以快速找到相关的历史信息,而不必翻遍整个"记忆库"。

实验结果令人鼓舞。在各种测试场景中,使用锚定状态记忆的AI系统比传统方法的成功率提高了5%到30%不等。特别是在那些需要跨应用协作的复杂任务中,改进效果更加明显。这就像给一个健忘的助手配备了一个智能笔记本,不仅记录关键信息,还能在需要时快速翻到正确的页面。

这项研究的意义远不止于技术改进。随着我们越来越依赖AI助手来处理日常事务,从简单的查询到复杂的多步骤操作,这种"记忆力"的提升将直接影响用户体验。试想,未来你可以对手机说:"帮我订一张下周末去上海的高铁票,选择下午2点后的班次,如果没有座位就改订飞机票,然后把行程分享给我的家人。"而AI助手真的能一步步完成,而不是在中途"断片"。

当然,这项技术目前还处于研究阶段,距离大规模应用还有一段距离。研究团队也坦诚地指出了当前方法的局限性:比如它主要针对单次任务设计,还无法处理跨越数天的长期任务,也没有充分考虑应用界面变化或内容更新对任务执行的影响。但是,这项工作为AI系统的"记忆机制"研究开辟了新的方向,为我们提供了一个理解和改进AI长期任务执行能力的新视角。

从更广阔的角度来看,这项研究触及了人工智能发展的一个核心问题:如何让机器具备类似人类的认知能力。记忆不仅仅是信息存储,更是智能行为的基础。当AI系统能够像人类一样选择性地记住关键信息,并在需要时灵活调用,它们就向真正的智能助手又迈进了一大步。正如研究团队所说,他们希望这项工作能够为构建可靠、可扩展的长期AI助手奠定基础,让人工智能真正成为我们日常生活中不可或缺的智能伙伴。

Q&A

Q1:什么是锚定状态记忆技术?

A:锚定状态记忆是香港科技大学团队提出的一种AI记忆机制,它让AI系统像人类一样只记住任务中的关键节点信息,比如查到的价格、完成的步骤等重要状态,而不是试图记住所有细节。这些关键信息像锚一样固定在记忆中,并建立相互关联,帮助AI在长任务中做出正确决策。

Q2:现在的AI手机助手为什么完成不了复杂任务?

A:主要问题是记忆障碍。当任务步骤超过20-30步时,AI会出现四种典型问题:重要信息丢失、信息关联错误、忘记当前任务目标、无法确认步骤是否完成。这就像患了健忘症,能看懂当前屏幕但记不住之前的关键信息,导致后续决策出错。

Q3:锚定状态记忆技术什么时候能用到我们的手机上?

A:目前这项技术还处于研究阶段,距离商用还需要时间。研究团队目前主要验证了技术可行性,提升了AI长任务成功率5%-30%,但要真正应用到日常手机助手中,还需要解决跨天任务、应用界面变化等实际问题。预计未来几年内会有相关应用出现。