1{% note purple no-icon %} 下面是测试下载拟南芥的数据文件,对于批量下载来讲还是比较麻烦的,可以查看files.xml文件, 将这些curl 放到一个bash文件里也可以实现批量下载。 {% endnote %}curl 'https://genome.jgi.doe.gov/portal/ext-api/downloads/get_tape_file?blocking=true&url=/PhytozomeV12/download...
JGI里Phytozome后面的v10或者v11或者v12是什么意思,数字越大越新吗不同的版本,越大越新;选择最新的...
parse('./'+PHYTOALL+'.xml') #读取并使用ElementTree解析PhytozomeV12.xml文件,并命名为xmlDoc folderl1 = xmlDoc.findall('folder') #使用findall功能找出子一级folder列表 print('目前数据库中有以下版本:\n') #print('The database have these Versions:\n') number=1 for folderl1x in folderl1: ...
curl 'https://genome.jgi.doe.gov/portal/ext-api/downloads/get-directory?organism=PhytozomeV12' -b cookies > all.xml 整理表格,只保留所有基因组序列链接(事实上,这里可以抓取自己想要的各个文件的links,比如所有CDS,比如所有蛋白...) perl-lne'if(/^<folder\s+name="(\S+)"/){if($1 eq "assemb...
curl'https://genome.jgi./portal/ext-api/downloads/get-directory?organism=PhytozomeV12'-b cookies > all.xml 整理表格,只保留所有基因组序列链接(事实上,这里可以抓取自己想要的各个文件的links,比如所有CDS,比如所有蛋白...) perl -lne'if(/^<folder\s+name="(\S+)"/){if($1 eq "assembly"){$...