【python】对纯二进制向量(仅包含 0 和 1,长度为 8 或 16)的检测和提取
- 不得不惊叹于python的强大,实现的简单而优雅
加入对纯二进制向量(仅包含 0 和 1,长度为 8 或 16)的检测和提取。我们用正则表达式 ^(?:[01]{8}|[01]{16})$ 来匹配:
import reglobal_label = ['1', '10101110', '116', "Good"
]# 编译一个匹配 8 位或 16 位二进制串的正则
binary_pattern = re.compile(r'^(?:[01]{8}|[01]{16})$')# 先初始化这些变量,避免未定义
emotion_label = None
type_label = None
desc_label = None
longest_label = None
music_style_label = None
cycle_label = None
binary_label = Nonefor label in global_label:# 检测 8 或 16 位纯二进制向量if binary_pattern.match(label):binary_label = labelprint(f"向量标签: {binary_label}")print("最终选择的描述标签:", longest_label if longest_label else "无描述标签")
print("提取到的二进制向量标签:", binary_label if binary_label else "无二进制向量标签")
关键点说明:
正则 ^(?:[01]{8}|[01]{16})$
^/$ 分别是行首、行尾,确保整个字符串都匹配。
(?:…|…) 是非捕获分组,用来“要么 8 位,要么 16 位”。
[01]{8} 匹配正好 8 个 0 或 1;[01]{16} 则是 16 个。
在循环结束后,binary_label 就会保存最后一次匹配到的二进制串(如果有多个,也可以改成存到列表里)。
你可以根据需要,改成只接受 8 位、或同时接受其他长度,只要调整正则即可。
- 图片来源,与文本关联不大
- 雅歌的结构