1.获取转录本序列 gffread GRCh38.gtf -g GRCh38.fa -w GRCh38.transcripts.fa 获取CDS序列 gffread GRCh38.gtf -g GRCh38.fa -x GRCh38.cds.fa 获取蛋白序列 gffread GRCh38.gtf -g GRCh38.fa -y GRCh38.protein.fa 4.提取基因启动子序列 首先确定启动子区域,这里定义转录起始位点上游1000 bp和下游50...
使用gffread 提取基因组序列信息 需求:提取 1 号染色体的 21856782-21856982 和 43942666-43942866 区间的 fa 序列; 需要准备的test.gff3文件如下所示,第一列是染色体号,第二列和第三列的内容随意,第四列和第五列是提取的开始位置和终止位置,第六列和第八列内容随意,第七列是基因组的正负链,第九列序列的信息...