当前位置: 首页 > news >正文

Python计算加速利器

2ba2b7b1ec86b8d687a7fc5e3d0aae50.png

迷途小书童的 Note

读完需要

6

分钟

速读仅需 2 分钟

1

   

简介

Python 是一门应用非常广泛的高级语言,但是,长久以来,Python的运行速度一直被人诟病,相比 c/c++、java、c#、javascript 等一众高级编程语言,完全没有优势。

那么真的没有办法提升 Python 程序的运行速度吗?相信看完本文,你应该会有答案。

2

   

示例

这里以找出 1000000 以内的质数为例,分别计算下需要花费多长的时间?

首先来回顾下什么是质数?

质数(Prime number),又称素数,指在大于 1 的自然数中,除了 1 和该数本身外,无法被其他自然数整除(也可定义为只有 1 与该数本身两个因数)。举个例子,比如说数字 7,从 2 开始一直到 6,都不能被它整除,只有 1 和它本身 7 才能被 7 整除,所以 7 就是一个质数。

下面来看看 python 的代码实现

import math
import timedef is_prime(num):if num == 2:return Trueif num <= 1 or not num % 2:return False# 从3开始,到int(根号num)+1,步长是2,如3,5,7 ...for i in range(3, int(math.sqrt(num)) + 1, 2):if not num % i:return Falsereturn Truedef run_program(N):for i in range(N):is_prime(i)if __name__ == '__main__':N = 1000000start = time.time()run_program(N)end = time.time()print(end - start)

执行代码,可以看到在我的老旧 i5 机器上总共花费了 5 秒多

cc337f17258677d8f6138383b8a80820.png

3

   

改进

大家都知道解释型语言,解释器不产生目标机器代码,而是产生中间代码,解释器通常会导致执行效率较低。

因此,问题就变成了,能不能将 python 代码翻译成机器码?那执行效率肯定就会大大提升了

numba 就是这么一款工具,它是 python 的即时编译器(just-in-time compiler),它使用 LLVM 将 python 代码翻译成机器码,特别是在使用 numpy 数组以及循环操作上,效果最佳。

numba 的使用比较简单,我们不需要更换 python 的解释器,只需要将 numba 的装饰器写在 python 方法上,当这个带有 numba 装饰器的方法被调用时,就会被 just-in-time 即时编译为机器代码,然后执行。目前 numba 支持在 X86、ARM 等多种架构上进行动态编译。

使用 numba 之前,我们需要安装这个库

pip install numba或者
conda install numba

下面来看看 numba 版本的质数问题

import math
import time
from numba import njit@njit(fastmath=True, cache=True)
def is_prime(num):if num == 2:return Trueif num <= 1 or not num % 2:return Falsefor i in range(3, int(math.sqrt(num)) + 1, 2):if not num % i:return Falsereturn True@njit(fastmath=True, cache=True)
def run_program(N):for i in range(N):is_prime(i)if __name__ == '__main__':N = 10000000start = time.time()run_program(N)end = time.time()print(end - start)

执行上述代码,可以看到,速度提升了 4 倍左右,不到 1 秒,效果还是非常明显

27db7e14b4eee05f434aaf4143d21b73.png

最后,作为横向比较,我们使用 c++ 语言,也写一个类似的程序

#include <iostream>
#include <cmath>
#include <time.h>using namespace std;bool isPrime(int num)
{if (num == 2) return true;if (num <= 1 || num % 2 == 0) return false;double sqrt_num = sqrt(double(num));for (int i = 3; i <= sqrt_num; i += 2) {if (num % i == 0) return false;}return true;
}int main()
{int N = 1000000;clock_t start, end;start = clock();for (int i=0; i < N; i++) isPrime(i);end = clock();cout << (end - start) / ((double)CLOCKS_PER_SEC);return 0;
}

编译后执行,可以看到,只花了 0.4 秒

bd722fb89ff42861b03cb2d5a3a47ed5.png

4

   

小结

从上面的对比示例中可以看到,使用了 just-in-time compiler 后(numba、pypy 都是类似的实现),代码的执行效率已经直逼 C++ 等编译型语言了。

5

   

参考资料

  • https://numba.readthedocs.io/en/stable/index.html ( https://numba.readthedocs.io/en/stable/index.html )

6

   

免费社群

d0fe77a07144be506f06b8aa786f6184.jpeg

http://www.lryc.cn/news/146556.html

相关文章:

  • PyTorch 深度学习实践 第10讲刘二大人
  • Linux特殊指令
  • MPI之主从模式的一般编程示例
  • 基于野狗算法优化的BP神经网络(预测应用) - 附代码
  • C语言面向对象的编程思想
  • MPI之非阻塞通信中通信完成检测接口简介
  • Excel:如何实现分组内的升序和降序?
  • 深度学习论文: Segment Any Anomaly without Training via Hybrid Prompt Regularization
  • 【算法训练-字符串】一 最长无重复子串
  • 【数据结构】手撕顺序表
  • 景联文科技数据标注:人体关键点标注用途及各点的位置定义
  • typescript基础之never
  • 电子电路学习笔记之NCP304LSQ37T1G ——超低电流电压检测器
  • 【计算机组成原理】一文快速入门,很适合JAVA后端看
  • 10万字智慧政务大数据平台项目建设方案222页[Word]
  • Python-主线程控制子线程-4
  • 设计模式二十二:策略模式(Strategy Pattern)
  • 【c语言】结构体内存对齐,位段,枚举,联合
  • 干货丨软件测试行业迎来新时代,AI将成为主流技术?
  • MacOS goland go1.21 debug问题
  • python 笔记(1)——基础和常用部分
  • kafka架构和原理详解
  • wsl Ubuntu中非root的普通用户怎么直接执行docker命令
  • Web开发模式、API接口、restful规范、序列化和反序列化、drf安装和快速使用、路由转换器(复习)
  • <AMBA总线篇> AXI总线协议介绍
  • 一个简单的Python网络爬虫教程
  • YARN资源管理框架论述
  • Unity查找资源依赖关系
  • 【操作系统】聊聊局部性原理是如何提升性能的
  • 多线程应用——单例模式