当前位置: 首页 > news >正文

7、脏话检测

6、片花关联长视频

脏话检测功能本身远不如上一篇介绍的片花关联长视频有技术挑战性,不过还是值得说说,因为这是我们采用技术方式提高工作效率的第一次尝试。

游戏解说是审核难度比较大的一类短视频内容,一方面是时间比较长,很多游戏一局下来要5分钟以上,超过10分钟甚至15分钟的情况也很普遍,需要的审核时间比较长;主要的风险是容易出现主播说脏话的情况,而且这种情况的出现非常随机,可能这个主播的心态一直都很平和,突然被人一枪爆头,就忍不住飙出来一句 @#$%^& ,因为时间比较短很容易被跳过,可内容中存在这种情况是坚决不能上电视大屏的,又必须把这种内容找出来。大家碰到这种情况很多时候都是宁可错杀也不要错放,这又导致大屏可用的游戏解说内容比较少,不能满足业务发展的需求。

最早我们是从账号维度进行管理,对于习惯性飙脏话的主播,会在前端高亮显示,提醒审核人员注意,这个方法有一点效果,但还不能让人满意,一是管理的颗粒度比较粗,容易出现误杀或误放,二是账号维护的工作量也不小,只能针对一些头部账号,而且账号维护有滞后性,把一个账号加入告警名单之前可能很多问题内容已经被放过去了。

后面我们考虑能不能通过技术手段辅助审核,如果要识别字幕计算量太大,而且很多脏话并不出现在字幕上,于是想到了音频识别的方案。首先抽取视频的音频信息,进行语音识别,把音频转成文字,再从文字中识别关键词,如果命中了关键词,会返回疑似在某个位置可能存在脏话。

前端的审核界面也对脏话识别的结果做了处理,在视频的进度条上用特殊标记加了提醒,表明这个位置疑似存在脏话,需要人工判断,并且增加了快捷键可以直接跳到下一个告警位置,以方便审核人员快速判断。

通过上面的方式,游戏解说内容的审核效率和正确率都有了明显的提升。

http://www.lryc.cn/news/178441.html

相关文章:

  • Godot信号教程(使用C#语言)| 创建自定义信号 | 发出自定义信号 | 使用代码监听信号
  • 分布式文件存储系统minio、大文件分片传输
  • 在 msys2/mingw 下安装及编译 opencv
  • java 根据身份证号码判断性别
  • 信息服务上线渗透检测网络安全检查报告和解决方案4(XSS漏洞修复)
  • 【SQL】mysql创建定时任务执行存储过程--20230928
  • 安全基础 --- MySQL数据库解析
  • 软件设计师考试学习3
  • 使用LDA(线性判别公式)进行iris鸢尾花的分类
  • 王学岗生成泛型的简易Builder
  • kafka消息队列简单使用
  • 性能优化实战使用CountDownLatch
  • 基于视频技术与AI检测算法的体育场馆远程视频智能化监控方案
  • leetcodetop100(29) K 个一组翻转链表
  • 最新影视视频微信小程序源码-带支付和采集功能/微信小程序影视源码PHP(更新)
  • C++:vector 定义,用法,作用,注意点
  • Firecamp2.7.1exe安装与工具调试向后端发送SocketIO请求
  • MySQL到TiDB:Hive Metastore横向扩展之路
  • 算法通关村-----寻找祖先问题
  • Sentinel结合Nacos实现配置持久化(全面)
  • Verilog中什么是断言?
  • Oracle分区的使用详解:创建、修改和删除分区,处理分区已满或不存在的插入数据,以及分区历史数据与近期数据的操作指南
  • SLAM从入门到精通(amcl定位使用)
  • 【C/C++】C/C++面试八股
  • Scala第八章节
  • k8s-实战——kubeadm二进制编译
  • vite 和 webpack 的区别
  • 传统遗产与技术相遇,古彝文的数字化与保护
  • 多维时序 | MATLAB实现WOA-CNN-GRU-Attention多变量时间序列预测(SE注意力机制)
  • 1042 字符统计