当前位置: 首页 > news >正文

Dataset用load_dataset读图片和对应的caption的一个坑

代码:

data_files = {}
if args.train_data_dir is not None:data_files["train"] = os.path.join(args.train_data_dir, "**")dataset = load_dataset("imagefolder",data_files=data_files,cache_dir=args.cache_dir,)

数据:

想要读进图片和以及对应的caption, 结果只是读出来了和label(这里只有一个文件夹,所以label全是0)。   于是一直找错,查看huggingface官网:https://huggingface.co/docs/datasets/v2.4.0/en/image_load#imagefolder

自己代码和他写的一摸一样,为什么会把caption读不进去呢?    

终于。。。。。。

发现了我的 datasets的版本是2.1.0。     发现我浏览的huaggingface官网的版本是2.4.0。   好的,立马换了版本,over,成功读如图片和caption!!!!

http://www.lryc.cn/news/497370.html

相关文章:

  • 【信息系统项目管理师】第7章:项目立项管理 考点梳理
  • 知识库、提示词对大语言模型的影响测试
  • vistat-监控和分析网络状态
  • EasyAnimateV5 视频生成大模型原理详解与模型使用
  • 水稻和拟南芥生命周期中单碱基分辨率的m6A定量分析-文献精读88
  • 学习threejs,使用canvas更新纹理
  • 【笔记2-3】ESP32 bug:PSRAM chip not found or not supported 没有外部PSRAM问题解决
  • 大数据hadoop、spark、flink、kafka发展的过程
  • 设计模式-理论基础
  • 猎板 PCB特殊工艺:铸就电子行业核心竞争力新高度
  • 用于目标检测的集中式特征金字塔
  • 大舍传媒-关于海外媒体宣发的探讨
  • Python从入门到入狱
  • AMEYA360 | 杭晶电子:晶振在AR/VR中的应用
  • RAG评估指南:从检索到生成,全面解析LLM性能评估方法
  • 贪心算法实例-问题分析(C++)
  • Ubuntu20.04 配置虚拟显示器和切回物理显示器
  • HTML 常用标签属性汇总一〈body〉标签
  • Python yield关键字
  • tomcat的Mysql链接字符串问题
  • 聊聊JVM G1(Garbage First)垃圾收集器
  • 【论文复现】隐式神经网络实现低光照图像增强
  • Python知识分享第十九天-网络编程
  • C# 绘制GDI红绿灯控件
  • Centos 8 服务器时间校正
  • 模型 正则化方法(通俗解读)
  • ffmpeg命令
  • 使用 EasyExcel 实现高效的 Excel 读写操作
  • 数据结构(栈Stack)
  • Windows 11 环境下 条码阅读器输入到记事本的内容不完整