backbone 和Run-Length Encoding (RLE)含义
在深度学习中,特别是在图像分割任务中,backbone(主干网络)是指用于特征提取的预训练神经网络模型。Backbone 的主要作用是从输入图像中提取有用的特征,这些特征随后会被用于更高层次的任务,如分类、检测或分割
Run-Length Encoding 是一种简单的无损数据压缩方法,常用于图像处理和计算机视觉领域。它通过记录连续相同像素的数量来压缩数据。RLE 特别适用于处理具有大量连续相同像素的图像,如二值图像(只有黑白两种颜色)
RLE 编码通常以成对的形式表示,每一对包含两个整数:
- 起始位置(Start Position): 连续相同像素的第一个位置。
- 长度(Length): 连续相同像素的数量。
-
示例输出
对于
mask_rle = "1 3 5 2"
和shape = (3, 3)
,输出将是:[1 1 1] [0 1 1] [0 0 0]]