当前位置: 首页 > news >正文

统计XML标注文件中各标注类别的标签数量

        目标检测任务重,担心数据集中各标签类别不均衡,想统计XML标注文件中各标注类别的标签数量,可以使用以下脚本:

import os
import glob
import xml.etree.ElementTree as etdef count_labels(source_dir):file_list = glob.glob(os.path.join(source_dir,"*.xml"))labels = {}for file in file_list:tree = et.ElementTree()tree.parse(file)objects = tree.findall(".//object")for object in objects:name = object.find(".//name")label = name.textif label in labels.keys():labels[label] += 1else:labels[label] = 1count_all = 0print(source_dir)for i in labels.keys():print(i,labels[i])count_all += labels[i]print("all_labels : ", count_all)print("all_images : ", len(file_list))if __name__ == '__main__':count_labels("/disk/test_xml")

         

http://www.lryc.cn/news/129186.html

相关文章:

  • 一百六十、Kettle——Linux上安装的Kettle9.2.0连接Hive3.1.2
  • C++新经典03--共用体、枚举类型与typedef
  • HCIP-OpenStack组件介绍
  • 2682. 找出转圈游戏输家
  • RESTAPI简介与DRF使用
  • 深度学习笔记(kaggle课程《Intro to Deep Learning》)
  • windows下载任意版本php
  • Linux命令
  • TDD(测试驱动开发)?
  • C/C++
  • CCF C³ 走进百度:大模型与可持续生态发展
  • Vue使用html2canvas将DOM节点生成对应的PDF
  • 专访阿里云席明贤,视频云如何运用大模型与小模型来破茧升级2.0
  • Vue 2的计算属性与侦听器
  • JavaScript基础:学习JavaScript语言的基本语法和常用操作,了解网页交互的基本原理
  • 网络每日一练
  • asp.net core读取request内容
  • 笔记:移植xenomai到nuc972(2)
  • 记忆正则表达式的基本元件
  • 低代码是什么?解决哪些问题?什么业务场景适合用低码开发?
  • SOA架构
  • “深入探索JVM内部机制:解密Java虚拟机“
  • PostgreSQL空值的判断
  • 使用phpunit进行单元测试
  • MongoDB 简介
  • [LitCTF 2023]Follow me and hack me
  • Java从入门到高级的全面指南
  • linux 命令- systemctl
  • 自动驾驶,一次道阻且长的远征|数据猿直播干货分享
  • 大数据培训前景怎么样?企业需求量大吗