当前位置: 首页 > news >正文

Python中统计单词出现的次数,包含(PySpark方法)

'''
思路:
定义一个函数,使用open函数,将文本内容打开。
定义一个空字典和空列表,进行循环及条件判断操作
'''
def count_word(file_path):dict_data = {}			#定义一个空字典f = open(file_path,"r",encoding="UTF-8")list_data = f.read()list_data = list_data.split()		#默认是空格为分隔符for i in list_data:if i in dict_data:dict_data[i] += 1else:dict_data[i] = 1f.close()while True:word = input("please input your word(input 'q' or 'Q'):")if word == 'Q' or word == 'q':print("Bye~")breakif dict_data.get(word) == None:print(f"{word}'s count is 0")breakelse:print(f"{word}'s count is {dict_data.get(word)}")count_word("C:/1.txt")

效果图:

在这里插入图片描述

利用PySpark第三方库,进行统计(人机交互暂未编写):

# 1.构建执行环境入口对象
from pyspark import SparkContext,SparkConf
import os 
os.environ['PYSPARK_PYTHON'] = "python.exe文件位置"
conf = SparkConf().setMaster("local[*]").setAppName("test_spark")
sc = SparkContext(conf = conf)# 2.读取数据文件
rdd = sc.textFile("C:/1.txt")# 3.获取全部单词,默认以空格为分隔符
word_rdd = rdd.flatMap(lambda x:x.split(" "))# 4.将单词转换为二元元祖
word_withone_add = word_rdd.map(lambda word:(word,1))# 5.分组求和
result_add = word_withone_add.reduceByKey(lambda a,b:a+b)# 6.打印出结果
print(result_add.collect())
http://www.lryc.cn/news/173354.html

相关文章:

  • 探讨基于IEC61499 的分布式 ISA Batch 控制系统
  • 图论16(Leetcode863.二叉树中所有距离为K的结点)
  • 【小沐学C++】C++ MFC中嵌入64位ActiveX控件(VS2017)
  • Linux常用命令—find命令大全
  • form组件的封装(element ui ) 简单版本
  • 树形DP杂题
  • Webpack使用plugin插件自动在打包目录生成html文件
  • 图像处理与计算机视觉--第一章-计算机视觉简介-10问
  • LeetCode 80. 删除有序数组中的重复项 II
  • 【前端面试题】浏览器面试题
  • PHP 生成 PDF文件
  • 讲讲项目里的仪表盘编辑器(一)
  • 解决方案 | 如何构建市政综合管廊安全运行监测系统?
  • JCEF中js与java交互、js与java相互调用
  • 9.20 校招 实习 内推 面经
  • 基于JAVA+SpringBoot+Vue+协同过滤算法+爬虫的前后端分离的租房系统
  • 【Android Framework系列】第16章 存储访问框架 (SAF)
  • Antdesign 4中让分页组件居中显示的方法
  • 【笔记】ubuntu 20.04 + mongodb 4.4.14定时增量备份脚本
  • c++实现的一个定时器实例
  • Python线程和进程
  • 算法 寻找峰值-(二分查找+反向双指针)
  • 【数据结构】—交换排序之快速排序究极详解,手把手带你从简单的冒泡排序升级到排序的难点{快速排序}(含C语言实现)
  • 【c#-Nuget 包“在此源中不可用”】 Nuget package “Not available in this source“
  • 【数据结构】二叉树之堆的实现
  • 电工-三极管输入输出特性曲线讲解
  • 深入解析容器与虚拟化:技术、对比与生态
  • 制作游戏demo的心得
  • Web Tour Server窗口闪现
  • Linux下的基本指令