ChIP-seq数据 …… 数据组织结构 在GEO数据库中,数据的组织结构是非常清晰的,主要包括以下几个部分: GEO Series (GSE) GSE代表整个实验的元数据和汇总数据,通常包含实验的基本信息、样本描述以及相关的基因表达数据。我们通常下载的是GSE数据,它包含了多个GSM数据。 GEO Samples (GSM) GSM表示一个特定的生物样本。
之前写的的CHIP-seq和RNA-seq很多练习的数据都是从GEO数据库下载的。但是从来没有细致的了解过GEO这个数据库。趁着还没复工,再多学一点新知识~这次的笔记是生信技能树的视频笔记,视频是对公众开放的,地址如下: 生信技能数b站视频地址:https://space.bilibili.com/338686099/channel/detail?cid=95141 ...
单细胞RNA-seq数据(scRNA-seq) RNA-seq数据 miRNA表达数据 ChIP-seq数据 …… 数据组织结构 在GEO数据库中,数据的组织结构是非常清晰的,主要包括以下几个部分: GEO Series (GSE) GSE代表整个实验的元数据和汇总数据,通常包含实验的基本信息、样本描述以及相关的基因表达数据。我们通常下载的是GSE数据,它包含了多个...
他们对两种不同的因子(NFkB-II和Pol II)进行RNA-seq和ChIP-seq。这导致4个子系列(2个用于RNA-seq,2个用于ChIP-seq) 一个更简单的例子,如GSE994,使用Affymetrix微阵列比较来自当前和以前吸烟者的样本 提交给NCBI GEO的数据既可以是"raw",也可以是"proceseed"。我们暂且把重点放在基因表达数据上。"proceseed"的...
GEO可上传的数据类型种类主要集中在芯片和高通量数据,比如芯片数据的四大主流:Affymetrix、Agilent、Nimblegen、Illumina,高通量的RNA-Seq、ChIP-Seq、ATAC-Seq等。另外还有RT-PCR、SAGE数据可以上传 2 提交高通量测序数据须知 重点需要提交三部分: 实验总览(metadata spreadsheet):参考样本https://www.ncbi.nlm.nih.gov...
ChIP-Seq数据:必须包含有关于peak丰度的文件(如WIG, bigWig, bedGraph) 所有处理过的文件描述都必须体现在metadata文件中 如果提交了WIG, bedGraph, GFF, GTF文件,格式需要参考:UCSC file format FAQ 原始数据(raw data files):GEO的原始数据也是会提交给SRA ...
20231127从表达矩阵处理单细胞数据-第二场直播 GEO数据库开始处理数据,使用harmony去除批次效应,同时演示如何获取最优聚类个数,提取某个亚群 9658 4 31:34 App 使用igv手把手教你读懂、理解m6a-seq、rip-seq 、chip-seq等表观数据的peaks含义,以及制作峰度图 2328 7 1:03:19 App 单细胞直播一-从pbmc理解seurat...
(2)准备好三个文件:Metadata spreadsheet(元数据表格)、Processed data files(已处理的数据文件)、Raw data files(原始数据文件)。 ①点击Metadata spreadsheet或下拉界面至Metadata spreadsheet,再点击Download metadata spreadsheet下载模板。 下载的模板中附有RNA-s...
如果不是特别重要的数据,建议还是上传了立即release,否则还得单独写email去release。 多个fastq最好下载meta文件到本地,filename要拓展一下,否则后果很严重,很多fastq会被直接忽略。 顺序一定要对,先申请bioproject,然后biosample(关联一下),最后申请SRA(也要关联),一定要下载SRA meta的文件,拓展filename。
下载第一个红标区域的metadata spreadsheet template 如图所示为ChIP-seq数据提交模板,加粗蓝色栏为必填,未加粗的蓝色栏为选填栏目,鼠标悬停在右上角红色三角出会有当前栏目的填写说明。 注意事项:双端测序在表格最后一栏需要再填写一遍,同时需要提供average insert size 和 standard error ...