当前位置: 首页 > news >正文

【AI】Windows环境安装GroundingDINO

Grounding DINO简单来说,它可以根据文字描述检测指定目标。此外,当Grounding DINO与stable diffusion结合,便可以实现更神奇的功能–自动P图。在专业领域中,GroundingDINO可以用来进行遥感影像解译,可以减少人工工作量。
Grounding DINO相对于其他方法有以下几点优势:

  • 其transformer结构更接近于自然语言处理模型,因此更容易同时处理图片和文字;
  • Transformer-based detector在处理大型数据集时被证明有优势;
  • 作为DETR的变种,DINO能够完成end-to-end的训练,而且不需要NMS等额外的后处理。

github地址:https://github.com/IDEA-Research/GroundingDINO
官网和其他的一些教程上,其安装都是使用的Linux系统,对于一般使用windows作为开发环境的人来说,经常会遇到直接使用pip安装时报错的问题,那么可以考虑使用github源码的安装方式。

1.配置CUDA_HOME环境变量

linux环境可以直接使用

echo 'export CUDA_HOME=/path/to/cuda' >> ~/.bashrc
source ~/.bashrc
echo $CUDA_HOME

来进行操作

windows环境就需要在环境变量中配置了
在这里插入图片描述
在这里插入图片描述

2.安装

推荐使用Conda虚拟环境进行安装,安装GroundingDINO之前先安装一下torch和torchvision,具体的环境配置可以参考之前的文章:【AI】PyTorch安装记录及Anaconda环境配置
直接在github上下载源码,然后进入项目中,将当前项目安装为依赖

# 下载源码
git clone https://github.com/IDEA-Research/GroundingDINO.git
# 进入项目中
cd GroundingDINO/
# 安装本项目
pip install -e .
# 下载预训练模型
mkdir weights
cd weights
wget -q https://github.com/IDEA-Research/GroundingDINO/releases/download/v0.1.0-alpha/groundingdino_swint_ogc.pth
cd ..
http://www.lryc.cn/news/255331.html

相关文章:

  • 【Node.js】基础梳理 6 - MongoDB
  • .NET8 依赖注入
  • Ubuntu18安装(重启黑屏问题)
  • [PyTorch][chapter 4][李宏毅深度学习][Gradient Descent]
  • 利用proteus实现串口助手和arduino Mega 2560的串口通信
  • Web APIs—介绍、获取DOM对象、操作元素内容、综合案例—年会抽奖案例、操作元素属性、间歇函数、综合案例—轮播图定时器版
  • 题目:分糖果(蓝桥OJ 2928)
  • Leetcode刷题笔记——摩尔投票法
  • RabbitMq整合Springboot超全实战案例+图文演示+源码自取
  • 10-Hadoop组件开发技术
  • postman参数为D:\\audio\\test.mp3请求报错
  • 进行主从复制时出现的异常FATAL CONFIG FILE ERROR (Redis 6.2.6)Reading the configuration file
  • 611.有效的三角形个数
  • 超详细,使用JavaScript获取短信验证码
  • 利用 Python 进行数据分析实验(七)
  • 前端小技巧: 写一个异步程序示例, 使用任务队列替代promise和async/await等语法糖
  • 【Windows下】Eclipse 尝试 Mapreduce 编程
  • Python---time库
  • unity 自由框选截图(两种方法,亲测有效)
  • 项目代码规范
  • STM32的BKP与RTC简介
  • 11.Java安卓程序设计-基于SSM框架的Android平台健康管理系统的设计与实现
  • jetbrains卡顿(Pycharm等全家桶)终极解决方案,肯定解决!非常肯定!
  • c++的排序算法
  • YOLOv5独家原创改进:SPPF自研创新 | SPPF与感知大内核卷积UniRepLK结合,大kernel+非膨胀卷积提升感受野
  • 【C/PTA —— 15.结构体2(课外实践)】
  • 艾泊宇产品战略:适应新消费时代,产品战略指南以应对市场挑战和提升盈利
  • 使用autodl服务器,两个3090显卡上运行, Yi-34B-Chat-int4模型,并使用vllm优化加速,显存占用42G,速度23 words/s
  • ORACLE数据库实验总集 实验六 SQL 语句应用
  • [FPGA 学习记录] 快速开发的法宝——IP核