(资料图片)
Google DeepMind、普林斯顿大学和斯坦福大学的研究人员提出了一款LATM框架,可以将GPT-4等大型语言模型变为工具制造者(LATM,即LLMs As Tool Makers),能够编程客栈生成自己的可重新使用的工具来处理新任务。
这个框架包括两个关键阶段:
工具制造:LLM作为工具制造者,专门为给定的任务php设计工具(以python函数形式实现)。
工具使用:另一个LLM作为工具使用者,可以调用工具来处理新的请求。
这种两阶段的设计允许LATM将任务分配给最合适的LLM。一方面,需要高强度能力的工具制造过程可以分配给功能强大、资源密集型的模型(例如GPT-4)。另一方面,相对简单的使用工具过程可以分nzkQscEl配给轻量级、经济高效的模型(例如androidGPT-3.5Turbo)。这种方法不仅增强了LLM解决问题的能力,而且可以显著降低处理一系列任务的平均计算成本。
实验结果验证了这种方法在复杂推理任务上的有效性。结果表明,LATM可以达到与资源密集型模型相当的性能,同时具有更高的成本效益。这种新型大型语言模型方法仿照了人类创造和使用工具的进化之飞跃,为开辟使用大型语言模型生成的工具的社区提供了无限的可能性。
论文地址:
https://arxiv.org/pdf/2305.17android126.pdf