当前位置: 首页 > news >正文

huggingface笔记: accelerate estimate-memory 命令

  • 探索可用于某一机器的潜在模型时,了解模型的大小以及它是否适合当前显卡的内存是一个非常复杂的问题。
  • 为了缓解这个问题,Accelerate 提供了一个 命令行命令 accelerate estimate-memory

accelerate estimate-memory {MODEL_NAME} --library_name {LIBRARY_NAME} --dtypes {dtype_1} {dtype_2} ...
MODEL_NAME (str)模型名称,位于 Hugging Face Hub 上
library_name {timm, transformers} (str)

模型与之集成的库名称,如 transformers

仅在 Hub 上未存储此信息时需要

dtypes

{float32, float16, int8, int4}

([{float32, float16, int8, int4} ...])

用于模型的数据类型,可以是 float32、float16、int8 和 int4 中的一个或多个

举例:

accelerate estimate-memory meta-llama/Meta-Llama-3-8B   --library_name transformers

http://www.lryc.cn/news/355660.html

相关文章:

  • 李飞飞亲自撰文:大模型不存在主观感觉能力,多少亿参数都不行
  • 超级好用的C++实用库之套接字
  • C++ | Leetcode C++题解之第108题将有序数组转换为二叉搜索树
  • 5月27日,每日信息差
  • echart扩展插件词云echarts-wordcloud
  • 解决无法直接抓取链接地址
  • java面对对象编程-多态
  • 【Sql Server】随机查询一条表记录,并重重温回顾下自定义函数的封装和使用
  • 基于C#开发web网页管理系统模板流程-主界面管理员录入和编辑功能完善
  • K8s证书过期处理
  • 刷题之路径总和Ⅲ(leetcode)
  • MongoDB 原子操作:确保数据一致性和完整性的关键
  • 2024上半年软考高级系统架构设计师回顾
  • SQL注入绕过技术深度解析与防御策略
  • Redis教程(十六):Redis的缓存穿透、缓存击穿、缓存雪崩
  • 如何实现一个高效的单向链表逆序输出?
  • 使用 Go 实现 HelloWorld 程序,并分析其结构
  • 机器学习:在Python中sklearn库的使用,纯干货!12个小时的整理!
  • XSS 攻击
  • .Net Core 中间件与过滤器
  • 【ARMv7-A】——WFI(wait for interrupt)
  • 92. 反转链表 II
  • Modbus工业网关
  • c++——模板初始识
  • 帆软生成csv文件
  • 12.Redis之补充类型渐进式遍历
  • 品牌做电商控价的原因
  • 安全面试中的一个基础问题:你如何在数据库中存储密码?
  • 【python深度学习】——torch.min()
  • 华为校招机试 - 最久最少使用缓存(20240508)