当前位置: 首页 > news >正文

深度学习速通系列:超长法律文件隐私过滤(基于预训练模型Bert)

法律文件隐私过滤

网上使用bert的中文模型进行命名识别教程少的可怜,摸索了一周的时间,硬是把法律文书的人名全部识别出来了,目前可以达到98.9999%(开玩笑的,不过准确率保守估计是有90%以上).注意:这个法律文书目前只是针对裁决书,其他还没测试过,可支持超长文本识别

github仓库地址

欢迎各位点个☆Star!!!

使用的模型

bert-base-chinese-ner 下载路径:https://hf-mirror.com/ckiplab/bert-base-chinese-ner (国内镜像,不用魔法也能访问)
下载好,直接放在当前目录下

使用步骤

1.先去下载模型,放在当前目录下
2.将里面的text改成你的文本,"text=''' 你的法律文书内容''' "
3.全局搜索from_pretrained,后面的两处路径都改成模型的绝对路径
4.启动person_filterling.py文件
5.在当前目录找到一个.docx文件,直接打开,就可以看到识别后的文件了

提醒

虽然项目只是针对了法律文书进行了调整,也可以尝试使用其他类型文本,效果应该也是可观的

http://www.lryc.cn/news/468658.html

相关文章:

  • 【数据结构与算法】之队列详解
  • python最新h5st4.9.1调用源码(2025-10-25)
  • 微软投资比特币:将总资产1%投资于BTC?股东投票决定最终结果!
  • vue中标签的ref和id的用法和区别优缺点
  • Python基础知识-文件篇
  • MacOS 环境下 VSCode 的 C++ 环境搭建
  • WPF样式
  • Vue Router 如何配置 404 页面?
  • 【C++:智能指针】
  • onlyoffice docker启用jwt并生成jwt
  • 希尔贝壳受邀参加首届“数据标注产业大会暨供需对接会”
  • 35.第二阶段x86游戏实战2-C++遍历技能
  • Jenkins发布vue项目,版本不一致导致build错误
  • vue3使用webSocket
  • 957种卫星参数文档的分享下载
  • 负载均衡详解:背景、实现技术、作用范围与常用算法
  • CCAA:产品认证基础3(产品认证方案)
  • go语言中的Scan()和Scanln()输入函数
  • UML外卖系统报告(包含具体需求分析)
  • net Core Data Protection 数据保护 加密 编码 哈希 FromServices
  • 4K手机壁纸之动漫系列
  • 关于eclipse的workspace
  • Vue引入高德地图自定义信息窗体绑定点击事件无效解决方案
  • 私域朋友圈运营
  • 【Vue】word / excel / ppt / pdf / 视频(mp4,mov) 预览
  • 如何加密电脑磁盘?电脑本地磁盘加密方法介绍
  • 1688、淘宝、京东搜索商品聚合接口技术实现与代码示例
  • 视频智能分析平台LiteAIServer烟火识别软件引领烟火检测与识别的智能新纪元
  • VUE前端按钮添加遮罩层
  • 列出机器学习方向的创新点