当前位置: 首页 > news >正文

python列表处理方法

原始文件:
id	start	end
a1	10	19
a1	25	34
a2	89	124
a2	149	167
a2	188	221
目的文件:
a1	1	10
a1	16	25
a2	1	36
a2	61	79
a2	100	133

解释说明:
原始文件是gff3文件的一部分,第一列id是基因的名字,第二列和第三列分别是外显子在全基因组上的起始位置和终止位置,目的文件中第一列是基因名字,第二列和第三列分别是外显子相对于单个基因的起始位置和终止位置。

接下来是代码:
# 加工gff3为了计算出内含子和外显子的位置
import pandas as pd
list1=[]
list2=[]
b=open("47out1.txt","w")
with open("47.txt","r") as f1:df1=pd.read_table(f1,index_col=0)df1["id1"]=df1.indexdf1["id1_start_end"]=df1["id1"]+","+df1["start"].astype(str)+","+df1["end"].astype(str)df2=df1.iloc[:,[3]]df3 = df2.groupby("id").apply(lambda x: x["id1_start_end"].tolist())for i in range(len(df3)):list1.append(",".join(df3[i]))for i in list1:i=i.strip().split(",")# " ".join(i)for j in range(0, len(i)):if i[j]==i[0]:list2.append(i[j])elif i[j]!=i[0]:list2.append(str(int(i[j]) - int(i[1]) + 1) )
for i in range(len(list2)):if i % 3 == 0:b.write(str(list2[i])+"\t"+str(list2[i+1])+"\t"+str(list2[i+2])+"\n")# print(list2[i],list2[i+1],list2[i+2])
http://www.lryc.cn/news/110653.html

相关文章:

  • 【Java】快速入门JVM
  • C#之Winfrom自定义输入框对话框。
  • docker制作镜像
  • 广西茶叶元宇宙 武隆以茶为媒 推动茶文旅产业融合发展
  • alibaba.excel库使用
  • 机器学习模型选择评估和超参数调优
  • 深入浅出 Typescript
  • Vue3和TypeScript项目-移动端兼容
  • 基于STM32CubeMX和keil采用通用定时器中断实现固定PWM可调PWM波输出分别实现LED闪烁与呼吸灯
  • mysql大表的深度分页慢sql案例(跳页分页)
  • 集中/本地转发、AC、AP
  • Spring集成Seata
  • 三种方式创建对象的几种方式及new实例化时做了什么?
  • vue2-vue实例挂载的过程
  • C++ 右值引用案例
  • 2.文件的逻辑结构
  • 20天学rust(一)和rust say hi
  • 牢记这16个SpringBoot 扩展接口,写出更加漂亮的代码
  • c++两种设计模式 单例和工厂模式
  • 2023-08-05——JVM 栈
  • Camera之PhysicalCameraSettingsList/SurfaceMap/CameraMetadata/RequestList的关系(三十二)
  • 【ONE·Linux || 基础IO(二)】
  • 【LeetCode 算法】Power of Heroes 英雄的力量
  • 合宙Air724UG LuatOS-Air script lib API--ntp
  • LangChain+ChatGLM大模型应用落地实践(一)
  • PSO粒子群优化算法
  • 记一次 .NET某医疗器械清洗系统 卡死分析
  • C# 基于Rijndael对文件进行加解密
  • Elasticsearchr入门
  • 【ARM】imx6ul移植kernel记录,恩智浦github提供的最新kernel(2023年7月31)