当前位置: 首页 > news >正文

BERT(从理论到实践): Bidirectional Encoder Representations from Transformers【3】

这是本系列文章中的第3弹,请确保你已经读过并了解之前文章所讲的内容,因为对于已经解释过的概念或API,本文不会再赘述。

本文要利用BERT实现一个“垃圾邮件分类”的任务,这也是NLP中一个很常见的任务:Text Classification。我们的实验环境仍然是Python3+Tensorflow/Keras。


一、数据准备

首先,载入必要的packages/libraries。

import tensorflow as tf
import tensorflow_hub as hub
import tensorflow_text as text
import numpy as np
import pandas as pd
import seaborn as snfrom sklearn.metrics import confusion_matrix, classification_report
from sklearn.model_selection import train_test_split
from matplotlib import pyplot as plt

接下来,导入数据,这是一个CSV文件,里面包含了很多邮件文本(参见【1】)。

df = pd.read_csv("spam.csv")
df.head(5)

这里我们输出前5条数据作为演示:

http://www.lryc.cn/news/273857.html

相关文章:

  • 静态网页设计——校园官网(HTML+CSS+JavaScript)
  • phpstudy_pro 关于多版本php的问题
  • TemporalKit的纯手动安装
  • 人生重开模拟器
  • 优化算法3D可视化
  • 魔术表演Scratch-第14届蓝桥杯Scratch省赛真题第1题
  • LLM 中的长文本问题
  • 深入了解Swagger注解:@ApiModel和@ApiModelProperty实用指南
  • Linux学习第48天:Linux USB驱动试验:保持热情,保持节奏,持续学习是作为一个技术人员应有的基本素质和要求
  • 数据库索引简析
  • leetcode贪心(单调递增的数字、监控二叉树)
  • 如何在win7同样支持Webview2 在 WPF 中使用本地 Webview2 ,如何不依赖系统 Runtime
  • 【docker】网络模式管理
  • LiveGBS国标GB/T28181流媒体平台功能-国标级联中作为下级平台对接海康大华宇视华为政务公安内网等GB28181国标平台查看级联状态及会话
  • 技术发展驱动编程语言走向
  • tp5+workman(GatewayWorker) 安装及使用
  • vscode安装Prettier插件,对vue3项目进行格式化
  • macOS跨进程通信: XPC 创建实例
  • Ubuntu18.04 升级Ubuntu20.04
  • 自动化测试怎么做?看完你就懂了。。。
  • 小秋SLAM入门实战opencv所有文章汇总
  • 2023年终总结(脚踏实地,仰望星空)
  • Transforer逐模块讲解
  • macOS进程间通信的常用技术汇总
  • 高德地图信息窗体设置
  • isEmpty 和 isBlank 的用法区别,居然一半的人答不上来.....
  • 数据分析求职-简历准备
  • 亚马逊店铺遇到账号申诉模版分享
  • 2023年广东省网络安全A模块(笔记详解)
  • 竞赛保研 基于机器视觉的银行卡识别系统 - opencv python