本文介绍: 论文建立了一个有 25 个机器人 (代理) 的虚拟小镇(沙箱环境),用户可以观察和干预代理的计划、分享新闻、建立关系和协调团体活动。用 GPT 工具模拟人类行为:起床,做早餐,去上班;作画,写作;形成意见、互相关注并发起对话;反思过去计划未来。文中描述了一种架构,通过扩展大语言模型使用自然语言存储智能体的完整经历记录,随着时间的推移将这些记忆综合成更高层次的反思,并动态地检索它们以规划行为。
摘要
论文建立了一个有 25 个机器人 (代理) 的虚拟小镇(沙箱环境),用户可以观察和干预代理的计划、分享新闻、建立关系和协调团体活动。用 GPT 工具模拟人类行为:起床,做早餐,去上班;作画,写作;形成意见、互相关注并发起对话;反思过去计划未来。
文中描述了一种架构,通过扩展大语言模型,使用自然语言存储智能体的完整经历记录,随着时间的推移将这些记忆综合成更高层次的反思,并动态地检索它们以规划行为。
论文还观察和评测了智能体作为个体和群体的行为,通过消融实验证明了代理架构的组成部分:观察、计划和反思,对于代理行为的可信度至关重要。
读后感
这篇文章非常具有启发性,很多点都可以引发进一步思考和研究,比如在产品设计方面:定制反映自己特点和经验的计划助手;在结构设计方面,提出三个组件:记忆、反思、计划 的架构,用于存储、合成和应用相关记忆,根据这些原则,应对各种复杂的场景。在具体实现方面还在附录中给出了一些可用的提示信息。
其中有两个实验结果很有意思,一个是:如果没有观察、计划和反思,仅有一般性的知识,模型性能将大打折扣;另一个是:”你会选择谁共度一小时“,如果不加反思,结果是最频繁交往的人,反思之后是深层价值观相似的人。
1. 引言
2. 相关工作
3. 生成代理的行为和互动
3.1 代理角色和通信
3.1.1 代理间的交流
3.1.2 用户控制
3.2 环境交互
3.3 示例“一天的生活”
3.4 通过交互产生社会行为
3.4.1 信息传播
3.4.2 关系记忆
3.4.3 协调
4. 生成代理架构
4.1 记忆与检索
4.2 反思
4.3 计划和反应
4.3.1 反应和更新计划
4.3.2 对话
5. 实现沙盒环境
5.1 从结构化环境到自然语言再回到结构化环境
6. 受控评估
6.1 评估程序
6.2 条件
6.3 人类评估者
6.4 分析
6.5 结果
7. 全面评估
7.1 紧急社交行为
7.2 边界和错误
8. 讨论
8.1 生成代理的应用
8.2 未来的工作和局限性
8.3 道德和社会影响
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。