本周工作思考
- Agent上下文管理(Context-Engineering)的总结与反思
- Sentry Agent在不同的任务的选用了不同模型,在这个策略的支持下,服务任务分发的决策Agent使用gpt-4o的模型,因为要把之前的所有的agent的输出以及issue data作为输入,导致经常出现上下文超限。
- 目前的解决办法是采用简单的压缩策略,具体来说遍历第二层对象,检查每层对象的长度,超出阈值,就进行压缩处理。
- 具体的压缩算法:列出数据结构中所有的第三级和第四级对象,设定每个对象的重要程度,对超出阈值的对象,依次递归以对象的重要程度开始裁切,重要程度最低的,最先移除;如果最后核心对象的数据也超出,就是直接裁切的办法,使用”…”告诉大模型此处有压缩的情况
- 这一种简单粗暴的办法,目前也暴露出了问题,上下文不足,导致问题判断出现错误,可以自动修复的,现在也要用人工修复。
- 目前Agent上下文的相关论文,讨论和实践非常多,但在遇到具体的问题往往不能很快的找到最佳实践,作为一个探索转落地的项目,我的设计原则是在创新探索和实用可靠保持均衡,目前尝试使用类mem0和memoryBank方案
- 在这个角度思考,目前Agent相关思想、技术等太过庞杂,对于我们来说各有利弊,以过往经验看这种情况一般表示是技术的工程化程度不高的表现,对我们来说,现有业务需要谨慎增加这类还不太稳定的技术栈,而对新业务来说,我们可以积极拥抱这类处于发展初期的技术,但需要以审慎的态度进行技术选型,并以长期主义为理念进行及时的重构技术架构