大家好,欢迎来到IT知识分享网。
目的
如题
脚本
import sys,os,re
def process_file(reader):
”’Open, read,and print a file”’
names=[]
index=0
dict={}
for line in reader:
if line.startswith(‘>’):
if index >=1:
names.append(line)
index =index+1
name=line[:-1]
seq = ”
else:
seq +=line[:-1]
dict[name]=seq
return dict
if __name__ == “__main__”:
input_file=open(sys.argv[1],”r”)
reader=input_file.readlines()
items=process_file(reader)
for key in items:
length=int(len(items[key]))
print(“%s\t%d” %(key,length))
input_file.close()
运行
将fasta序列放在脚本的相同目录下
在terminal输入代码
python stat_length.py HHGassembly.fasta > HHG.len &
结果
tab分隔
第一列是序列文件中contig/scaffold/chromosome的名字,带“>”符合
第二列是大小
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/11060.html