①metadata表格:下拉见细节描述中有模板表格下载,下载后依据上传数据类型填写表格,具体参数比较容易理解,比如RNA-seq模板 metadata RNA-seq填写模板 ②processed-data处理后数据:基因表达量文件(readcount或FPKM),需要换成文本txt格式; ③raw file对应原始数据raw data中的压缩包名称,以fq.gz结尾,由于是双端测序,因此...
TSA:Submit computationally assembled, transcribed RNA sequences after submitting unassembled reads to SRA. GEO:Submit RNA-seq, ChIP-seq, and other types of gene expression and epigenomics datasets. 也就是我们常用的基因表达数据,这里可以上传处理后的数据,如count和TPM,FPKM等 BioProject & BioSample:这是...
做单细胞转录组测序的原始数据,一般都是上传到NCBI的GEO数据库的。 GEO数据库长这个样子: 拉到下面可以看到sample和project,是存放原始数据(fastq测序文件)所在。 但原始测序数据一般比较大,特别是scRNAseq,一个样本的双端测序数据文件压缩后至少50G起。另外就是拿到原始测序数据,需要跑cellranger比对, 一方面不是所有...
生信入门第七课:使用FastQC软件进行测序原始fastq数据质控 生信入门第八课:RNA-seq比对、定量和差异分析 生信入门第九课:PCA、相关性、热图和火山图及代码详解 生信入门第十课:Clusterprofiler GO和KEGG富集分析R代码详 生信入门第十一课:基因集富集分析原理和R代码 生信入门第十二课Cytoscape绘PPI网络图并用cytohubb...
RNA-seq入门实战(一):上游数据下载、格式转化和质控清洗 本节概览:1.在文章中找到 GEO accession number, 从NCBI获取数据SRR号2.在linux... 嘿嘿嘿嘿哈阅读 18,427评论 0赞 58 RNA-seq入门实战(二):上游数据的比对计数——Hisat2+ featureCounts... 本节概览:hisat2 + featureCounts:获取hisat2索引文件,hi...
生信入门第六课:测序下机数据fastq文件介绍 生信入门第七课:使用FastQC软件进行测序原始fastq数据质控 生信入门第八课:RNA-seq比对、定量和差异分析 生信入门第九课:PCA、相关性、热图和火山图及代码详解 生信入门第十课:Clusterprofiler GO和KEGG富集分析R代码详解 生信入门第十一课:基因集富集分析( Gene Set Enrichme...
完成上述操作后,页面自动跳转到高通量测序数据上传界面。按照提示准备好三种文件。 第一种文件 Metadata spreadsheet,主要记录RNA-seq实验的目的、方法、处理过程,以及统计预备上传的所有文件的信息和文件的MD5值等等。网站提供了相应的案例模版(同一页面具有下载链接),此步骤一定要基于模版,根据自己实验的实际情况填写所有...
接下来以某RNA-seq数据上传为例展示,点击上传高通量数据类型。 以上传高通量数据为例 2.1 上传数据要求 根据网站要求,需要上传3种数据,包括: 信息表(Metadata spreadsheet),这个由GEO网站提供,需下载填写; 一些重要的处理后数据(Processed data files),如基因表达值矩阵等; ...
公众号后台回复“数据上传”获取表格 ②点击Processed data files或下拉界面至Processed data files。仔细阅读以下内容并按照要求准备好已处理的数据文件。RNA-seq提供表达谱结果表(FPKM或TPM表);Merip-seq、Chip-seq提供定量数据的peak文件等,常用格式bedGraph等。
RAW FILES:原始数据详细信息。 PAIRED-END EXPERIMENTS:双端测序序列详细信息,此项可不填。 Processed data files 经过处理的数据是GEO提交的必要部分,GEO会审核客户上传的处理过的数据,以此来检验相关文章结论的真实可靠性。RNA-seq可以上传基因表达量文件,ChIP-seq可以上传WIG、bigWig、bedGraph等(生信分析过程中这些...