python的第三方库(五分钟小白从入门到精通)
第三方库的介绍
第三方库是Python官方以外的机构基于Python语言创建的具有特定功能的模块(代码文件)。由于项目开发在不同领域有不同的需求,例如Python语言可应用于数据分析领域、图形用户界面领域、游戏领域、机器学习领域、办公领域、数据可视化领域等,Pvthon官方提供的库无法满足各个领域的全部需求。因此需要众多的第三方组织机构(可以是任何一家公司或个人团队)开发出具有有效功能的代码文件(在某个领域可以运用的具有特定功能的代码文件,例如处理Excel表格的代码文件有由Eric Gazoni(埃里克·加索尼)、CharlieClark(查利·克拉克)开发的openpyxl库,里面包含处理Excel表格文件的大量功能代码),并使该代码文件开源共享使用。
不同领域的第三方库
从不同的领域出发可以将第三方库划分为多种库。接下来将从不同领域出发介绍可使用的第三方库。
图形用户界面领域的第三方库有PyQt5、PyGTK、wxPython、Kivy、Dabo等。其中PyQt5库是非常成熟的图形用户界面开发库,可以跨平台(Windows、Linux、macOS)使用,是基于Ot库结合Python语言实现的
一种库。0t库同时支持Python、C++语言。
办公领域的第三方库有openpyxl、python-docx、PyPDF2、pdfminer、python-pptx等。其中openpyxl库用于处理Excel文件。python-docx库用于处理Word文件。PyPDF2库和pdfminer库都用于处理PDF文件。python-pptx库用于处理PPT文件。
网络爬虫领域的第三方库有requests、scrapy、selenium、BeautifulSoup等。requests库用于爬取网络资源。scrapy库是一种高级Web爬虫框架,可以批量爬取大量资源。selenium库用于模拟浏览器访问网络资源。BeautifulSoup库用于解析HTML网页信息。
数据分析领域的第三方库有numpy、scipy、pandas等。numpy库擅长处理数组,虽然Python语言中自带了处理数组的功能,但numpy库在处理大量数组时速度更快,大大提高了科学计算能力。scipy库基于numpy库,增加了丰富的常用数学库函数。pandas库也基于numpy库,用于高效处理大量数据游戏领域的第三方库有PyWeek、pygame、Panda3D、Cocos2d、PySoy等。
数据可视化领域的第三方库有Matplotlib、seaborn、HoloViews、Plotly等。其中Matplotlib库是使用较为广泛的数据可视化库,使用几行代码即可实现曲线图、条形图、散点图等的绘制。
机器学习领域的第三方库有scikit-learn、Theano、Tensorplow等。其中Tensorplow库可用于实现神经网络和深度学习算法。
Web网页领域的第三方库有Django、Pyramid和Flask。其中Django库是用于创建Web应用框架的第三方库,该库的功能较为成熟且使用方便。
更多领域的第三方库本书不再一一列举,本书主要从办公领域出发介绍如何利用代码提高办公效率,因此用于办公领域的部分第三方库,本书后期会详细介绍。如果读者想从事Python项目开发,却不知该选择哪个领域,可以关注一下机器学习领域(人工智能)、数据分析领域(通常包含数据可视化领域)、游戏领域、网络爬虫领域、办公领域、图形用户界面领域、Web网页领域,其中机器学习领域、数据分析领域往往对数学的要求较高,需要有一定的数学基础的人才。目前市场需求较大的领域为图形用户界面领域和Web网页领域,且对数学的要求不高,接收跨专业人才。想要完成一个完整的项目并不是仅仅掌握其中某一个领域的知识即可,例如开发一个类似淘宝的电商购物App,至少需要掌握Web网页领域、数据分析领域和图形用户界面领域的知识。
第三方库的安装
第三方库的安装方法有3种,分别是pip工具安装方法、自定义安装方法和文件安装方法。其中pip工具安装方法最为简单,只需要一行命令即可实现第三方库的下载和安装。pip是Python自带的工具,在安装Python时,pip工具也被自动安装到计算机中。本书中所有的第三方库均可通过pip工具进行安装,因此本小节主要演示如何使用pip工具安装第三方库,其他的安装方法在后面的章节中遇到时再详细介绍。读者需要掌握本小节介绍的pip工具安装方法。
在使用pip工具前需要启动计算机中的命令提示符窗口,Windows系统用户启动命令提示符窗口
由于pip是连接的国外的网站进行包的下载,所以有的时候会速度很慢。 我们可以通过如下命令,让其连接国内的网站进行包的安装:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名称
https://pypi.tuna.tsinghua.edu.cn/simple 是清华大学提供的一个网站,可供pip程序下载第三方包
PyCharm也提供了安装第三方包的功能:
pip工具除了8.5.3~8.5.4小节介绍的命令外,还有以下的一些常用命令:
pip uninstall 库名 #卸载第三方库
pip list #展示已安装的全部第三方库
pip show 库名 #展示指定库的详细信息
pip download 库名 #下载第三方库安装包但不安装
pip -h #获取p1p使用帮助
Pyinstaller 库
PyInstaller是一个十分神奇的第三方库,它能够在Windows、Linux、 Mac OS X 等操作系统下将 Python 源文件打包,通过对源文件打包, Python 程序可以在没有安装 Python 的环境中运行(包括引用的第三方库),也可以作为一个独立文件方便传递和管理。
在命令提示符窗口中输入以下命令并按Enter键即可下载并安装Pyinstaller库
pip install Pyinstaller
Pyinstaller 库的使用
在Pyinstaller命令后加入一个参数-F,可以使打包后只产生一个dist文件夹,且文件夹中只存在一个打包后的可执行文件,命令的具体形式如下:
Pyinstaller-i图标文件地址+图标文件名称-F代码文件路径+代码文件名