2 质控(使用FastQC分析序列质量) 处理任何样本之前的第一步是分析数据的质量。fastq 文件中包含质量信息,指的是每个碱基检出的准确度(% 置信度)。FastQC 查看样品序列的不同方面:接头污染、序列重复水平等 # 激活用于rna-seq的小环境 conda activate rna # 使用fastqc(若未安装,使用conda安装即可) # 查看fastqc是...
1. 原始数据质量查看 查看上一步qc1文件夹下的multiqc_report.html质控汇总网页文件,主要关注测序质量与测序接头这两项内容,可以发现该数据质量较好,平均质量均在30以上,接头含量也很低。 具体内容分析见: 20160410 测序分析——使用 FastQC 做质控 - 知乎 (zhihu.com) 小L生信学习日记-3丨原始数据质量如何判断?-...
RNA-seq上下游分析snakemake流程 学习完snakemake后写的第一个流程是RNA-seq上游定量和下游的质控和差异分析。 使用fastp处理fastq文件,在使用START比对到基因组同时得到raw count,使用非冗余外显子长度作为基因的长度计算FPKM、TPM,同时也生成了CPM的结果。 非冗余外显子长度计算可以参考之前的推文转录组实战02: 计算非...
转换为sort.bam文件之后就可以进行下一步分析 3.基因表达水平定量 用htseq count来计算比对数目:即有多少个reads比对上了外显子基因,此时还需要基因功能注释文件。 基因注释文件下载:从NCBI等网站中可以获取。下载后为gtf文件。 1.首先检查HTseq有没有下载,没有下载需要自行下载。 sudo apt install python-htseq ...
一、上游处理流程 上游处理步骤包括质量检测、质量控制、比对、定量[2],每一步处理数据的目的都是不同,也有相关的软件与之对应。通过质量检测,原始数据的各种问题将会呈现出来,接下来的质量控制就是为了解决原始数据的质量问题。比对是将reads比对到染色体或者基因,并生成sam或者bam文件记录比对情况以及质量。定量既是统...
④SRA数据下载 主要参考:SRA文件的下载(prefetch)和解压SRA文件(fastq-dump)) 本案例所使用的方法为SRA Toolkit - prefetch 快速下载NCBI SRA数据 如果本案例中的方法无法运行,具体请参看郜鹏志师哥整理的《BaP_的RNA-seq上游流程.md》这份笔记(二.数据准备/01.从GEO中下载SRA数据) 首先下载最新发布的sratoolkit(...
RNA-seq上游流程课程笔记链接: https://pan.baidu.com/s/1VCdFGJX5dth4RkiSpG01LQ 提取码: bpbp, 视频播放量 295、弹幕量 1、点赞数 10、投硬币枚数 6、收藏人数 18、转发人数 2, 视频作者 生信宝库, 作者简介 生信宝库科研团队,一群热爱分享的小伙伴。,相关视频:RNA-seq
自学转录组上游分析,总结的代码如下 ###第一步:创建分析所用的文件夹 mkdir rna-seq cd rna-seq mkdir {sra,clean_data,fastqc,refastqc,align,count} ###测序数据放在sra中,这里从NCBI下载了SRA数据###第二步:第一次质量控制(fastqc && multiqc) cd "/public/home/lxwang/Znk/rna-seq/fastqc/" fastqc...
二、在GitHub上的上游分析教程 链接:RNA-seq Work Flowgithub.com/twbattaglia/RNAseq-workflow#9a...