做单细胞转录组测序的原始数据,一般都是上传到NCBI的GEO数据库的。 GEO数据库长这个样子: 拉到下面可以看到sample和project,是存放原始数据(fastq测序文件)所在。 但原始测序数据一般比较大,特别是scRNAseq,一个样本的双端测序数据文件压缩后至少50G起。另外就是拿到原始测序数据,需要跑cellranger比对, 一方面不是所有...
1.进入NCBI官网National Center for Biotechnology Information (nih.gov),登录账号 2.在下方选项中点击“submit”,下拉至“other tool-GEO”,点击“learn more” 3.选择“Submit high-throughput sequencing" 4.完成下图3项数据准备工作: 上传所需文件 ①metadata表格:下拉见细节描述中有模板表格下载,下载后依据上传...
TSA:Submit computationally assembled, transcribed RNA sequences after submitting unassembled reads to SRA. GEO:Submit RNA-seq, ChIP-seq, and other types of gene expression and epigenomics datasets. 也就是我们常用的基因表达数据,这里可以上传处理后的数据,如count和TPM,FPKM等 BioProject & BioSample:这是...
生信入门第七课:使用FastQC软件进行测序原始fastq数据质控 生信入门第八课:RNA-seq比对、定量和差异分析 生信入门第九课:PCA、相关性、热图和火山图及代码详解 生信入门第十课:Clusterprofiler GO和KEGG富集分析R代码详 生信入门第十一课:基因集富集分析原理和R代码 生信入门第十二课Cytoscape绘PPI网络图并用cytohubb...
1.统一格式的转录组数据来啦 GEO是NCBI旗下的网站,为了提高存量RNA-seq数据的利用率,SRA 和 GEO 团队搭建了一套流程,统一计算 RNA-seq 基因表达矩阵,方便进行差异分析和可视化。 2.范围 提交给 GEO 的人类和小鼠 RNA-seq数据,人类数据已经可用,小鼠数据官方说2023年秋季上线,但今天(2023.12.27)目前暂时还不能用...
上传的数据类型多样,可能不能直接比较,例如RNA-seq和RIP-seq都在矩阵里,但是不好直接比较。 3)Normalized矩阵文件并非充分标准化的。 对生信数据分析行业带来的冲击: 1)GEO的RNA-seq分析几乎要变得免费,无门槛了 2)有了表达矩阵,直接省了下载、比对的时间,极大提高了工作效率 ...
GEO数据库 | GEO2R 更新 bulk RNA-seq 数据处理 by 被炸熟的虾 GEO2R最初是NCBI GEO团队针对上传到GEO的芯片数据开发的一款在线差异分析、可视化作图工具。 其后台调用芯片分析的经典包Limma,通过数据清洗,差异分析等过程,最后获得用户可以直接使用的差异基因列表。
这里就看看测序方面,而且是RNA-seq的,如下: 既然给出了测序数据,那么我们就可以完完全全的重复该流程。 首先进入GEO数据库找到它: 仅仅是信号bw格式文件都是4.1Gb了,而且作者没有提供表达矩阵供我们下载,所以我们需要自行下载测序数据; 数据量不小,按照我在生信技能树的教程,首先应该是学习了解GEO和SRA数据库: ...
除SRA数据库之外,GEO数据库也是目前文章投递过程中要求进行数据上传的数据库之一。 网上关于GEO数据库的上传教程良莠不齐,推荐使用下面的方法快速上传自己的数据到GEO。 第一步 向GEO提交联系信息 正常登录NCBI,如果是首次进入GEO,页面会出现两个选项,如下图: 对于之前从未上传数据到GEO的同学,请选择第二个选项。
RNA-seq 数据分析流程 相关软件安装 下载数据 sra转fastq格式 数据质控 数据质控,过滤低质量reads,去接头 比对 首先下载参考基因组及注释文件,建立索引 比对 sam文件转bam 为bam文件建立索引 reads的比对情况统计 计数counts 差异基因分析 RNA-seq 数据分析流程 ...