当前位置: 首页 > news >正文

【Python】20大报告生成词云

这个我其实写过一篇类似的博客,但是那个的文件对象是.csv,对应到.docx文件的话,就不太适用了。如下:

Python生成词云-CSDN博客

代码:

import jieba
import os
import wordcloud
import numpy as np
from PIL import Image
from docx import Document# 从Word文档中提取文本
doc_path ="E:\\code\\二十大报告实录.docx"
doc = Document(doc_path)
txt = ""
for one_pare in doc.paragraphs:txt = txt + one_pare.text# 读取形状图片
img_path =r"wujiaoxing.png"
img = Image.open(img_path)
mk = np.array(img)# 配置词云对象参数
w = wordcloud.WordCloud(font_path="msyh.ttc", mask=mk, background_color="white")# 使用jieba进行分词
words = jieba.lcut(txt)
abc = " ".join(jieba.lcut(txt))# 生成词云
w.generate(abc)# 保存词云图像文件
output_path = os.getcwd() + r"cloud0.jpg"
w.to_file(output_path)# 显示词云图像
img = Image.open(output_path)
img.show()

这个容易出错的点就在于img_path。

生成结果:

http://www.lryc.cn/news/226101.html

相关文章:

  • 目标检测YOLO实战应用案例100讲-基于无人机的轻量化目标检测系统设计
  • ansible-第二天
  • 【测试工具】UnixBench 测试
  • 软件测试金融项目,在测试的时候一定要避开的一些雷区
  • 顺序图——画法详解
  • easyexcel==省市区三级联动
  • Linux进程控制(二)--进程等待(一)
  • 【C++】C++11常用特性梳理
  • 修改iframe生成的pdf的比例
  • C++之list的用法介绍
  • Mybatis-plus 内部提供的 ServiceImpl<M extends BaseMapper<T>, T> 学习总结
  • yolov5 利用Labelimg对图片进行标注
  • 完整版付费进群带定位源码
  • 华为L410上制作内网镜像模板01
  • linuxC语言缓冲区及小程序的实现
  • MySQL数据库基本操作-DDL 数据库基础知识
  • 基于JavaWeb+SpringBoot+Vue摩托车商城微信小程序系统的设计和实现
  • idea代码快捷键Mac版
  • 分享76个Python管理系统源代码总有一个是你想要的
  • Springboot养老院信息管理系统的开发-计算机毕设 附源码27500
  • 在虚拟机中安装vim和net-tools,mysql
  • 【Excel】函数sumif范围中符合指定条件的值求和
  • k8s上对Pod的管理部分详解
  • 4.4.2 结构可以将 string类作为成员吗
  • npm install 安装总结
  • 二十三种设计模式全面解析-组合模式与享元模式的结合应用:实现对象的共享和高效管理
  • jenkins分步式构建环境(agent)
  • 前端开发学习指南
  • 环境变量小节
  • React Native适配Xcode 15 iOS 17.0+