当前位置: 首页 > news >正文

学习 字节UI TARS GUI Agent

网上针对的资料还是非常多的,主要是围绕字节的论文做一些分析,这个其实还是非常重要的,了解该模型的实际原理,这里做动手的就不详细描述了。我们主要从实际的部署上看看

我们先看看UI TARS和UI TARS desktop  查了很多资料有点类似claude 不过这个是闭源模型

所以无法本地进行部署

先看看github UI TARS

https://github.com/bytedance/UI-TARS-desktop/blob/main/docs/quick-start.md

可以进行下载最新版本的Ui tars desktop 

前端的客户端可以正常下载后,后面就是如何在本地部署服务端的,可以参考如下blog中的做法

直接下载 docker 和gguf后的模型 可以成功的运行

在低显存环境下运行UI-Tars 1.5 7B模型并在UI-Tars-Desktop上使用_ui-tars-7b本地部署-CSDN博客

 docker run -d -it --name ui-tars --gpus all -v /home/test/ui-tars/models:/models -p 8000:8000 ghcr.io/ggml-org/llama.cpp:server-cuda --port 8000 --host 0.0.0.0 -m /models/UI-TARS-1.5-7B-GGUF/UI-TARS-1.5.gguf --mmproj /models/UI-TARS-1.5-7B-GGUF/mmproj-model-f16.gguf -a ui-tars-1.5-7B --api-key xxxx -c 228000 --threads 10

客户端的设置 如下:

不过效果很一般,这里可能是有两个原因 1 是因为本身模型开源的是没有商业的好,2另外一种是量化后的gguf模型不行

http://www.lryc.cn/news/602703.html

相关文章:

  • 为什么bert是双向transformer
  • 无人机气动设计模块解析
  • html转word下载
  • NVDB-CAVD 杯汽车信息安全系列赛事
  • 基于Java的汽车商城系统设计与实现
  • 汽车膨胀水箱(副水箱)液位传感器的作用
  • 小鹏汽车AI测试
  • stm32开发 -- TFTLCD相关
  • API产品升级丨全知科技发布「知影-API风险监测平台」:以AI重构企业数据接口安全治理新范式
  • JavaWeb 入门:HTML 基础与实战详解(Java 开发者视角)
  • 分数函数的实用性及与数据密度的关系解析
  • ffmpeg-7.1.1 下载安装 windows 版,MP4 转 m3u8 切片,遇到报错 Unrecognized option ‘vbsf‘的解决办法
  • SD卡简介与驱动开发
  • 优测推出HarmonyOS全场景测试服务,解锁分布式场景应用卓越品质!
  • Makefile if语句用法
  • Linux内核驱动开发核心问题全解
  • Python全栈项目--基于深度学习的视频内容分析系统
  • 使用Docker在Rocky Linux 9.5上在线部署LangFlow
  • GoldenDB 分布式数据库详解
  • 在CentOS上以源码编译的方式安装PostgreSQL
  • <七> CentOS 8 安装最新版本Docker
  • 很妙的一道题 Leetcode234. 回文链表
  • 力扣 之 最小覆盖子串(变长滑动窗口,越短越好)
  • 电磁兼容五:仿真技术
  • Mac安装navicat17版本教程mac下载Navicat Premium for Mac v17.1.9【好用】
  • 微算法科技(NASDAQ:MLGO)利用基于区块链的机器学习模型进行交易分类,实现交易数据的匿名化
  • redis数据库的四种取得 shell方法
  • 安宝特案例丨户外通信机房施工革新:AR+作业流技术破解行业难题
  • 免费版酒店收银系统弹窗在押金原路退回流程中的应用价值探究 ——仙盟创梦IDE
  • 设计模式(二十一)行为型:状态模式详解