当前位置: 首页 > news >正文

python生成词云图

生成词云图的话需要先对数据进行分词处理 , 分词方法点击查看


import pandas as pd
from collections import Counter
from wordcloud import WordCloud
import matplotlib.pyplot as plt# 假设您已经按照之前的步骤处理了数据,并且处理后的数据保存在'comments_processed.csv'文件中
# 读取处理后的数据
df = pd.read_csv('comments_processed.csv', encoding='utf-8-sig')# 假设处理后的词汇存储在'connected_words'列中
words = ' '.join(df['connected_words'].values)
cleaned_stt = ' '.join(words.strip().split())# 使用 split() 方法将字符串分割为列表
word_list = cleaned_stt.split(' ')
word_counts = Counter(word_list)# 提取前20个高频词(如果词的数量少于20个,则提取所有)
top_words = word_counts.most_common(80)# 准备用于生成词云的数据
# 将高频词和它们的词频分开
top_words_list, top_words_freq = zip(*top_words)# 将词频列表转换为字典,用于wordcloud的权重参数
word_freq_dict = dict(top_words)
word_freq_dict1 = {'性能': 3351, '外观': 1086, '舒适': 806, '环保': 591, '智能': 433, '越野': 416, '坐在': 400, '前排': 389, '东西': 367, '拥挤': 360, '座椅': 338, '很大': 305, '储物': 304, '不错': 303, '车子': 277, '足够': 266, '腿部': 263, '舒服': 242, '设计': 238, '车内': 231}
word_freq_dict.update(word_freq_dict1)
print(word_freq_dict)
# 创建词云对象,并指定字体(确保支持中文)
wordcloud = WordCloud(width=1200, height=800, background_color='white',font_path=fr'fonts\xiawuxiheixinban.ttf'  # 或者其他支持中文的字体文件路径).generate_from_frequencies(word_freq_dict)# 显示词云图
plt.figure(figsize=(8, 8), facecolor=None)
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.tight_layout(pad=0)plt.show()
http://www.lryc.cn/news/358060.html

相关文章:

  • 【使用ChatGPT构建应用程序】应用程序开发概述:1. 管理秘钥、2. 数据安全、3. 与应用程序解耦、4. 注意提示语的注入攻击
  • 【JavaScript脚本宇宙】不可或缺的Web开发工具:图表和可视化
  • 自然语言处理(NLP)中的迁移学习
  • PLC集成BL121PO网关优化智能电网的远程管理PLC转OPC UA协议
  • 爬虫案例(读书网)
  • Linux系统编程(五)多线程创建与退出
  • 计算机毕业设计 | SpringBoot个人博客管理系统(附源码)
  • 字母的大小写转换
  • JTW结构
  • debian11安装留档@VirtualBox
  • SpringBoot——整合Thymeleaf模板
  • 电商推荐系统+电影推荐系统【虚拟机镜像分享】
  • (函数)判断素数(C语言)
  • git 学习随笔
  • 【因果推断python】1_因果关系初步1
  • (函数)颠倒字符串顺序(C语言)
  • 自定义数据集上的3D目标检测:使用OpenPCDet训练CenterPointPillar模型
  • 音乐传奇告别之作:《杰作》未解之谜❗❗
  • 【Postman接口测试】第四节.Postman接口测试项目实战(上)
  • opencv学习备份
  • Unity 中获取调用者方法名
  • k8s集群中pod的容器资源限制和三种探针
  • tar 详细说明
  • 渗透测试工具Cobalt strike-2.CS基础使用
  • 【UE5.1 角色练习】08-物体抬升、抛出技能 - part2
  • Java面试题--JVM大厂篇(1-10)
  • 【知识拓展】机器学习基础(一):什么是预处理对象、模型对象 、pipeline、Tokenizer
  • Linux dig 命令
  • 后台接口返回void有设置response相关内容,前端通过open打开接口下载excel文件
  • scp问题:Permission denied, please try again.