当前位置: 首页 > news >正文

Python利用jieba分词提取字符串中的省市区(字符串无规则)

目录

  • 背景
  • 库(jieba)
  • 代码
  • 拓展
  • 结尾

背景

今天的需求就是在一串字符串中提取包含,省、市、区,该字符串不是一个正常的地址;,如下字符串

"安徽省、浙江省、江苏省、上海市,冷运标快首重1kg价格xx元,1.01kg(含)-5kg(不含)续重价格xx元/kg,5kg(含)以上续重价格xx元/kg。广西壮族自治区"

能够提取['安徽省','浙江省','江苏省','上海市','广西壮族自治区']

库(jieba)

库的话,是第三方库【jieba】,所以需安装,安装如下:

pip install jieba

代码

# -*- coding: UTF-8 -*-
'''
@Project :拆分 
@File    :test.py
@IDE     :PyCharm 
@Author  :一晌小贪欢(278865463@qq.com)
@Date    :2023/10/11 15:01 
'''
import jieba
text = "安徽省、浙江省、江苏省、上海市,冷运标快首重1kg价格xx元,1.01kg(含)-5kg(不含)续重价格xx元/kg,5kg(含)以上续重价格xx元/kg。广西壮族自治区"seg_list = jieba.lcut(text)
province = ""
city = ""
district = ""add_list = []for word in seg_list:if "省" in word:province = word# 省# print(province)add_list.append(province)elif "市" in word:city = word# 市# print(city)add_list.append(city)elif "区" in word:district = word# 区# print(district)add_list.append(district)print(add_list)

输出

['安徽省', '浙江省', '江苏省', '上海市', '广西壮族自治区']

拓展

还有一个库也是非常好用的,就是,第三方库 【 jionlp】,也可以将一串字符串提取出包含,省、市、区,但是,该字符串需要是一个正常的地址;,如下图:

在这里插入图片描述

结尾

希望对大家有帮助

致力于办公自动化的小小程序员一枚

都看到这了,关注+点赞+收藏=不迷路!!

http://www.lryc.cn/news/190188.html

相关文章:

  • MuLogin防关联浏览器帮您一键实现Facebook账号多开
  • 【C语言】每日一题(半月斩)——day4
  • Are you sure you want to continue connecting (yes/no) 每次ssh进
  • 网络与信息系统安全设计规范
  • 在Linux怎么用vim实现把一个文件里面的文本复制到另一个文件里面
  • CCAK—云审计知识证书学习
  • 3.springcloudalibaba gateway项目搭建
  • Debezium日常分享系列之:Debezium 2.3.0.Final发布
  • js为什么是单线程?
  • centos安装redis教程
  • 把短信验证码储存在Redis
  • 【已编译资料】基于正点原子alpha开发板的第三篇系统移植
  • 地下城堡3魂之诗食谱,地下城堡3菜谱37种
  • HDMI 基于 4 层 PCB 的布线指南
  • 理解Go中的布尔逻辑
  • rv1126-rknpu-v1.7.3添加opencv库
  • 【Redis】Redis持久化深度解析
  • c/c++--字节对齐(byte alignment)
  • 算法进阶——字符串的排列
  • js中 slice 用法用法全解析
  • Typora安装教程
  • Pytorch中张量的维度扩张与广播操作示例
  • 身份证号码,格式校验:@IdCard(自定义注解)
  • 【Java】instanceof 关键字
  • Android 13.0 recovery出厂时正在清理字体大小的修改
  • 京东商品数据:8月京东环境电器行业数据分析
  • elasticsearch(ES)分布式搜索引擎04——(数据聚合,自动补全,数据同步,ES集群)
  • webdriver.Chrome()没反应
  • java html转word、pdf(包含图片)
  • 不容易解的题10.10