当前位置: 首页 > news >正文

生信数据分析高效Python代码

1. Pandas + glob获取指定目录下的文件列表

import pandas as pd
import globdata_dir = "/public/data/"
# 获取文件后缀为.txt的文件列表
df_all = pd.concat([pd.read_csv(f, sep='\t') for f in glob.glob(data_dir + '*.txt')])
print(df_all)

2. 使用 enumerate 函数获取索引和值

# A-K 字母列表
letter = [chr(ord('A') + i) for i in range(0, 11)]# 输出索引和值
for idx, value in enumerate(letter):print(f"{idx}\t{value}")

3. 使用 zip 函数同时遍历多个列表

# 0-10 数字列表
number = [n for n in range(0, 11)]
# A-K 字母列表
letter = [chr(ord('A') + i) for i in range(0, 11)]for number, letter in zip(letter, number):print(f"{letter}: {number}")# 0: A
# 1: B
# 2: C
# 3: D
# 4: E
# 5: F
# 6: G
# 7: H
# 8: I
# 9: J
# 10: K

4. 内置函数map + filter 过滤数据

number = [n for n in range(0, 11)]# 获取平方数
squared_numbers = list(map(lambda x: x**2, number)
print(squared_numbers) 
# [0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]# 获取偶数
even_numbers = list(filter(lambda x: x % 2 == 0, number))
print(even_numbers)
# [0, 2, 4, 6, 8, 10]

5. 使用concurrent.futures模块实现循环的并发处理,提高计算效率

import concurrent.futures
def square(num):return num ** 2with concurrent.futures.ThreadPoolExecutor() as executor:res = list(executor.map(square, number))print(res)

6. 使用asyncio模块实现异步处理,提高并发性能

import asyncio
import math
async def sqrt(num):return math.sqrt(num)async def calculate():run_tasks = [sqrt(num) for num in number]results = await asyncio.gather(*run_tasks)print(results)asyncio.run(calculate())

7. 程序运行分析装饰器

import timedef analysis_time(func):def warpper(*args, **kwargs):start_time = time.time()res = func(*args, *kwargs)end_time = time.time()print(f"{func.__name__} program run time: {end_time - start_time}s")return resreturn warpper# 并行计算
import concurrent.futures
def square(num):return num ** 2@analysis_time
def calulate(number):with concurrent.futures.ThreadPoolExecutor() as executor:res = list(executor.map(square, number))return resprint(calulate(number))
# calulate program run time: 0.002947568893432617s
# [0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
http://www.lryc.cn/news/255104.html

相关文章:

  • Spring Kafka常用配置详解
  • 跨域的多种方案详解
  • Java / Scala - Trie 树简介与应用实现
  • JS/jQuery 获取 HTTPRequest 请求标头?
  • Leetcode—2034.股票价格波动【中等】
  • 【Linux】diff命令使用
  • 讯飞星火认知大模型与软件测试结合,提升软件质量与效率
  • 【Flink on k8s】- 4 - 在 Kubernetes 上运行容器
  • 软件重装或系统重装后避免重复踩坑
  • 【Jmeter】JSON Extractor变量包含转义字符,使用Beanshell脚本来消除
  • GO设计模式——5、建造者模式(创建型)
  • 《LeetCode力扣练习》代码随想录——字符串(反转字符串II---Java)
  • WMMSE方法的使用笔记
  • MySQL核心知识点整理大全1-笔记
  • 理解输出电压纹波和噪声:来源与抑制
  • uni-app 微信小程序之好看的ui登录页面(二)
  • Textual Inversion
  • 笙默考试管理系统-MyExamTest----codemirror(47)
  • JVM中 Minor GC 和 Full GC 的区别
  • 二十一章(网络通信)
  • [linux运维] 利用zabbix监控linux高危命令并发送告警(基于Zabbix 6)
  • 手机升级到iOS15.8后无法在xcode(14.2)上真机调试
  • 安装TensorFlow2.12.0
  • elasticsearch 索引数据多了怎么办,如何调优,部署?
  • 人工智能企业引入S-SDLC,推动安全能力大跃升,保障AI技术体系深化落地
  • Docker的数据卷
  • 第二十一章总结博客
  • 学习php中使用composer下载安装firebase/php-jwt 以及调用方法
  • 『TypeScript』深入理解变量声明、函数定义、类与接口及泛型
  • 如何优雅使用 vue-html2pdf 插件生成pdf报表