UCSC里面下载非常方便,只需要根据基因组简称来拼接url即可: http://hgdownload.cse.ucsc.edu/goldenPath/mm10/bigZips/chromFa.tar.gz http://hgdownload.cse.ucsc.edu/goldenPath/mm9/bigZips/chromFa.tar.gz http://hgdownload.cse.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz http://hgdownload.cs...
samtools faidx hg19.fa ## 显示生成 hg19.fa.fai samtools faidx hg38.fa ===dict结尾=== gatk CreateSequenceDictionary -R hg19.fa -O hg19.dict 欢迎同行一起交流讨论 微信forensic_JS QQ1956238898
% 每次下载hg19的基因组序列都很心累, 搞个自动化的 clear all; clc; close all; url_base = 'http://hgdownload.soe.ucsc.edu/goldenPath/hg19/chromosomes/'; chr_list = {}; for i = 1:22 chr_list = [chr_list, {['chr', num2str(i)]}]; end chr_list = [chr_list, {'chrX', 'chr...
目前我知道的最简单的办法的,从GATK bundle中下载。比如hg19整个基因组的文件。下面是一步到位的命令,包括了fasta,fai,dict文件。 1 wget -c ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/hg19/ucsc.hg19* GATK bundle还提供一下其他文件,可以看看(ftp://ftp.broadinstitute.org/bundle),比如dict文...