当前位置: 首页 > news >正文

WINDOWS AGENTARENA:EVALUATING MULTI-MODAL OS AGENTS AT SCALE论文学习

文章开头说现有的agent都是局限于特定领域(什么网络问答啊,仅限文字啊,仅限于某一个app啊)这样的,本文的工作主打一个贴近用户使用场景,用户用什么软件,看什么网页,本文的模型就用什么软件,看什么网页,只要是能在windows系统上用的东西本agent都能用,泛用性更强。(常规操作,没啥新颖的)本文使用了OSworld的架构(OSworld论文之前讲过了)。除了数据集以外本文还提出了一个叫Navi的模型

文章提到现在的benchmark测试一般在虚拟机上进行,这样是比较慢的。文章提出可以提高任务并行化。

模型的动作空间如下:

剩下的呆会看

http://www.lryc.cn/news/440767.html

相关文章:

  • 3步轻松定制报价方案,亿发商城报价神器你用过了吗?
  • CISP备考题库(五)
  • 【Kubernetes】常见面试题汇总(二十三)
  • linux-Shell 编程-Shell 脚本基础
  • Linux运维篇-tigervnc工具的使用
  • 基于Spark的电影推荐系统设计与实现(论文+源码)_kaic
  • 基于python+django+vue的医院预约挂号系统
  • 镀金引线---
  • 『功能项目』窗口可拖拽脚本【59】
  • Map--08--CurrentHashMap 与 Hashtable的异同?
  • Docker学习笔记(三)存储与卷
  • 硬件工程师笔试面试——滤波器
  • 【SpringBoot3】面向切面 AspectJ AOP 使用详解
  • wav怎么转mp3格式?给你推荐几种音频格式转换方法
  • Redis的AOF持久化、重写机制、RDB持久化、混合持久化
  • Dom4j使用xpath查询xml文
  • 国家专精特新小巨人企业指标解析与扶持领域
  • 进程的属性
  • Git 中的refs
  • 408算法题leetcode--第六天
  • ubuntu64位系统无法运行32位程序的解决办法
  • 深入理解Go语言中的并发封闭与for-select循环模式
  • Java学习Day42:骑龙救!(springMVC)
  • 原型模式详细介绍和代码实现
  • ArcGIS Pro SDK (十三)地图创作 5 图层样式
  • 【Python报错已解决】 Requests.exceptions.ProxyError: HTTPSConnectionPool
  • 现在量化中普遍使用QMT和PTrade?哪家可以同时提供QMT/PTrade?
  • 【计算机网络】UDP 协议详解及其网络编程应用
  • 基于ESP32S3的链接大语言模型对话模块
  • Cpp输出多字符常量警告