当前位置：首页 > news >正文

深度学习速通系列:超长法律文件隐私过滤(基于预训练模型Bert)

news 2025/8/22 4:47:58

法律文件隐私过滤

网上使用bert的中文模型进行命名识别教程少的可怜,摸索了一周的时间,硬是把法律文书的人名全部识别出来了,目前可以达到98.9999%(开玩笑的,不过准确率保守估计是有90%以上).注意:这个法律文书目前只是针对裁决书,其他还没测试过,可支持超长文本识别

github仓库地址

欢迎各位点个☆Star!!!

使用的模型

bert-base-chinese-ner 下载路径：https://hf-mirror.com/ckiplab/bert-base-chinese-ner （国内镜像，不用魔法也能访问）
下载好，直接放在当前目录下

使用步骤

1.先去下载模型,放在当前目录下
2.将里面的text改成你的文本,即"text=''' 你的法律文书内容''' "
3.全局搜索from_pretrained,后面的两处路径都改成模型的绝对路径
4.启动person_filterling.py文件
5.在当前目录找到一个.docx文件,直接打开,就可以看到识别后的文件了

提醒

虽然项目只是针对了法律文书进行了调整,也可以尝试使用其他类型文本,效果应该也是可观的

http://www.lryc.cn/news/468658.html

相关文章：

【数据结构与算法】之队列详解

python最新h5st4.9.1调用源码(2025-10-25)

微软投资比特币：将总资产1%投资于BTC？股东投票决定最终结果！

vue中标签的ref和id的用法和区别优缺点

Python基础知识-文件篇

MacOS 环境下 VSCode 的 C++ 环境搭建

Vue Router 如何配置 404 页面？

【C++:智能指针】

onlyoffice docker启用jwt并生成jwt

希尔贝壳受邀参加首届“数据标注产业大会暨供需对接会”

35.第二阶段x86游戏实战2-C++遍历技能

Jenkins发布vue项目，版本不一致导致build错误

vue3使用webSocket

957种卫星参数文档的分享下载

负载均衡详解：背景、实现技术、作用范围与常用算法

CCAA：产品认证基础3（产品认证方案）

go语言中的Scan()和Scanln()输入函数

UML外卖系统报告（包含具体需求分析）

net Core Data Protection 数据保护加密编码哈希 FromServices

4K手机壁纸之动漫系列

关于eclipse的workspace

Vue引入高德地图自定义信息窗体绑定点击事件无效解决方案

私域朋友圈运营

【Vue】word / excel / ppt / pdf / 视频(mp4,mov) 预览

如何加密电脑磁盘？电脑本地磁盘加密方法介绍

1688、淘宝、京东搜索商品聚合接口技术实现与代码示例

视频智能分析平台LiteAIServer烟火识别软件引领烟火检测与识别的智能新纪元

VUE前端按钮添加遮罩层

列出机器学习方向的创新点