当前位置: 首页 > news >正文

【精华】AI Agent:大模型改变世界的“钥匙”

文章目录

        • 1.Auto-GPT
        • 2.BabyAGI
        • 3.AgentGPT
        • 4.GodMode
        • 5.AI Town
        • 6.ChatDev

当前大模型的本质是大语言模型(Large Language Model, LLM)。相较于传统的自然语言处理模型,LLM通过无监督训练,从大量文本数据中学习自然语言的模式和结构,在一定程度上能够更加准确地模拟人类的语言理解和生成过程,还展现出一定的逻辑思维和推理能力。

但是,LLM远远不足以处理复杂的现实问题,如基于天气、人流量等数据完成旅游线路的规划、基于实时更新的市场数据完成交易策略的模拟甚至构建一个全新的交易策略等。

2023年3、4月,随着AutoGPT、AgentGPT与BabyAGI等项目的爆火,以LLM作为核心的AI Agent成为了解决上述问题最有前景的方向。虽然初期的AI Agent项目功能并不完善,但它们确实代表了迈向更复杂的人工智能的早期趋势。

AI Agent与单纯的LLM不同:大语言模型如ChatGPT的使用基本为人机问答的形式,人类在文本框内输入问题,大语言模型做出回答;AI Agent则更进一步,不仅可以告诉人类如何做,更可以在现实中帮人做,是一个能自主理解、规划、执行复杂任务的系统。于是,能够自主执行、独立运作的AI Agent开始被认为是“变革社会的生产力工具”,更有人将其视为“通往通用人工智能(AGI)时代的开始”

AI Agent具体是如何工作的?实在智能的TARS-RPA-Agent展现出了强大的功能特点。实在智能在业界首发基于大模型的Agent产品,即TARS-RPA-Agent,就是一个基于“TARS+ISSUT”双模引擎,有“大脑”,更有“眼睛和手脚”的超自动化智能体。自研垂直领域TARS塔斯大模型是AI Agent的大脑,并辅以CV大模型(ISSUT)以及RPA等前沿技术的规划、记忆与工具使用,实现”所说即所得“,动动嘴就能实现任务的执行。

以下是当前爆火的AI Agent项目:

1.Auto-GPT

Auto-GPT是第一款AI代理,由游戏开发者Toran Bruce Richards开发的,是一个实验性的开源应用程序。它是自动化的GPT,由GPT-4驱动,能够让GPT-4持续为任务生成提示词,自主实现我们设定的任何目标。

GitHub:https://github.com/Significant-Gravitas/Auto-GPT

img

2.BabyAGI

BabyAGI也是GitHub上的项目,由Yohei Nakajima开发的,需要你会写命令行、知道怎么安装开发环境才能使用的AI代理。

GitHub:https://github.com/yoheinakajima/babyagi

img

3.AgentGPT

AgentGPT是一个开源项目,可帮助用户创建自主的AI代理。无需编程专业知识,AgentGPT可用于创建各种应用程序的代理,例如聊天机器人和流程自动化。此外,AgentGPT还能使用组织的数据进行训练,以生成准确答案,回答客户问题。AgentGPT不仅适用于自动化编码任务和技术操作,还适用于针对特定业务的定制化应用。

GitHub:https://agentgpt.reworkd.ai/zh

img

4.GodMode

该工具提供了一个图形用户界面 (GUI),用于与 ChatGPT 模型进行交互。使用此 GUI,用户可以输入文本提示或问题,并从 ChatGPT 模型接收基于文本的响应。该界面可能包括文本格式、自定义选项以及保存或导出对话的能力等功能。该工具可用于生成文本、回答问题或模拟与虚拟助手的对话等任务。

Demo:https://godmode.space/

img

5.AI Town

一个数字化的「西部世界」沙盒虚拟城镇中,有学校、医院、家庭。25个AI智能体不仅能在这里上班、闲聊、social、交友,甚至还能谈恋爱,而且每个Agent都有自己的个性和背景故事。

详情介绍:斯坦福小镇二创,8个智能体生活交友,猫猫小镇AI Town人人可搭

GitHub
https://github.com/joonspk-research/generative_agents
https://github.com/a16z-infra/ai-town (AI小镇二创)

Demo:https://www.convex.dev/ai-town

6.ChatDev

一种全新的软件开发框架,该框架采用了基于对话的端到端方法,借助大型语言模型(LLMs)实现多角色间的高效沟通和协作。创建一个虚拟的聊天驱动软件技术公司-CHATDEV。它遵循经典的瀑布模型,将开发过程划分为设计、编码、测试和文档四个阶段。在每个阶段,CHATDEV招募多个不同角色的代理人,如程序员、审查员和测试工程师。为了促进有效的交流和协作,CHATDEV使用了一个提议的聊天链,将每个阶段分解为原子子任务。在聊天链中,每个节点表示一个具体的子任务,两个角色在上下文感知的多轮讨论中参与,提出和验证解决方案。这种方法确保了客户需求的分析、创意的生成、原型系统的设计和实施、潜在问题的识别和解决、调试信息的解释、吸引人的图形的创建和用户手册的生成。通过沿着聊天链指导软件开发过程,CHATDEV向用户交付最终的软件,包括源代码、环境依赖规范和用户手册。

详情介绍:CHATDEV-软件开发的交流代理,这是让ChatGPT开软件公司么?

GitHub:https://github.com/OpenBMB/ChatDev

Demo:/

更多AI工具,参考国内AiBard123,Github-AiBard123

http://www.lryc.cn/news/167887.html

相关文章:

  • CVPR2023 RIFormer, 无需TokenMixer也能达成SOTA性能的极简ViT架构
  • 瑞萨MCU入门教程(非常详细的瑞萨单片机入门教程)
  • 【Java】采用 Tabula 技术对 PDF 文件内表格进行数据提取
  • 完全保密的以太坊交易:Aztec网络的隐私架构
  • 初识Java 9-1 内部类
  • 合宙Air724UG LuatOS-Air LVGL API控件-屏幕横屏竖屏切换(Rotation)
  • 在Unity中,Instantiate函数用于在场景中创建一个新的游戏对象实例
  • 解决 tesserocr报错 Failed to init API, possibly an invalid tessdata path : ./
  • 使用Python CV2融合人脸到新图片--优化版
  • Python分享之对象的属性
  • 编程参考 - std::exchange和std::swap的区别
  • Sentinel整合RestTemplate
  • 微前端学习(下)
  • Android Splash实现
  • FPGA projet : VGA
  • JDK8 升级至JDK19
  • Python3.10 IDLE更换主题
  • C# OpenVino Yolov8 Pose 姿态识别
  • 北邮22级信通院数电:Verilog-FPGA(1)实验一“跑通第一个例程” 过程中遇到的常见问题与解决方案汇总(持续更新中)
  • CSS - 鼠标移入整行高亮显示,适用于会员套餐各参数对比页面(display: table,div 转表格形式)
  • 无涯教程-JavaScript - ATAN2函数
  • Tomcat 下部署 jFinal
  • 【Spatial-Temporal Action Localization(二)】论文阅读2017年
  • 二维码智慧门牌管理系统:数据现势性,满足应用需求的根本保证
  • BF算法(C++)简单讲解
  • JVM 虚拟机 ----> Java 类加载机制
  • 《protobuf》基础语法2
  • 利用 SOAR 加快事件响应并加强网络安全
  • uni-app:通过ECharts实现数据可视化-如何引入项目
  • string 模拟与用法