访问NCBI FTP 站点:https://ftp.ncbi.nlm.nih.gov/gene/DATA/ 进入GENE_INFO/Plants/,下载
把 gene: 还有transcript: cds: 删除试试吧:
上面第一个是gff文件,用到的命令就是课程里面的: perl ../script/get_gene_exon_from_gff.pl -...
熟悉GSEA软件的都知道,它只需要GCT,CLS和GMT文件,其中GMT文件,GSEA的作者已经给出了一大堆!就是记录broad的Molecular Signatures Database (MSigDB)已经收到了18026个geneset,但是我奇怪的是里面竟然没有包括cancer testis的gene set,MSigDB的确是多,但未必全,其实里面还有很多重复。而且有不少几乎没有意义的gene se...
前面都一帆风顺,但是到第二步 得到geneID和gene类型的对应关系时,遇到了钉子 进入帖子说的网站,发现是这样的 于是根据自己的理解,点进去人类的GTF下载界面,发现是这样的 下载了Homo_sapiens.GRCh38.96.gtf.gz这个文件到shell然后解压,如图 好像跟老师原帖里的gtf不太一样,但我的感觉是,既然是这个网站,又是唯一的...
1.) 输入文件MD5值进行查询 第二步:如果无法确定原文件是否损坏,只能通过查询与原文件有关联的其它文件来找到合适的 E_WGENEP.CAT 原文件。 使用方法:打开 E_WGENEP.CAT 文件所在文件夹,查看在这个文件夹里面的所有文件,将和 上面列出的关联文件名字相同的文件拖放到MD5工具里,计算它们的MD5值,然后将这些MD5...
补充两张提取IDlist.txt时用到的两个文件 希望老师解答一下
有学员反映在学习GEO芯片数据挖掘,利用差异基因进行蛋白质互作网络分析的过程中,获得的info文件中之涉及了String_id,利用Cytoscape进行绘图的过程中无法知道对应的具体基因ID是什么或者Gene Symbol是什么,这些并不能直观显示。可以通过以下方法进行解决: 1、输入文件为差异表达分析的结果文件,文件中第一列是基因ID,有时会...