Listen

Description

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。

今天的主题是:

Think, Speak, Decide: Language-Augmented Multi-Agent Reinforcement Learning for Economic Decision-Making

Summary

经济决策不仅依赖于价格、税收等结构化信号,还深受同伴交流与媒体叙事等非结构化语言信息的影响。尽管多智能体强化学习(Multi-Agent Reinforcement Learning,MARL)在优化经济决策方面展现出潜力,但其在处理语言所固有的语义歧义性和上下文丰富性方面仍面临显著挑战。

我们提出 LAMP(Language-Augmented Multi-Agent Policy,语言增强型多智能体策略) 框架,将语言系统性地融入经济决策过程,从而缩小与真实世界场景之间的差距。LAMP 采用 Think–Speak–Decide(思考–表达–决策) 的流水线式架构:

  1. Think(思考):对数值型观测进行解释,提取短期冲击与长期趋势,并缓存高价值的推理轨迹;
  2. Speak(表达):基于推理结果生成并交换策略性语言信息,通过解析同伴通信来更新自身信念;
  3. Decide(决策):将数值数据、推理过程及反思信息进行融合,形成 MARL 策略,以优化语言增强条件下的决策行为。

在经济仿真实验中,LAMP 在多项指标上均显著优于传统 MARL 方法和仅依赖大语言模型(LLM-only)的基线方法,包括累计回报(分别提升 63.5% 与 34.0%)、鲁棒性(分别提升 18.8% 与 59.4%)以及可解释性。这些结果表明,语言增强型策略在构建更加高效且稳健的经济决策方案方面具有显著潜力。

原文链接:https://arxiv.org/abs/2511.12876