所以对于这样的lncRNA-seq数据,走我们标准的RNA-seq定量流程,针对gencode数据库的gtf文件拿到表达矩阵即可,这个表达矩阵里面就包含了lncRNA和mRNA,可以分开走走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下: 第一讲:GEO,表达芯片与R 第二讲:从GEO下载数据得到表...
因为我们使用的是dUTP链特异性测序,pair-end的read1与gene方向相反,read2与基因方向相同,与下表中评估的结果一致。 03、lncRNA识别与分析 组装得到转录本以后,接下来我们就可以识别lncRNA啦~ 对于lncRNA的预测,首先是对转录本进行初筛,得到可能是lncRNA的候选转录本,这里我就不多做赘述了。对于候选的转录本,我们...
当然实验目的若只需要定量已知基因,也可以选择free-alignment 的流程工具如kallisto/Salmon/Sailfish,其优点是可用于RNA-seq的基因表达的快速定量,但是对于小RNA和表达量低的基因分析效果并不好(2018年刚发表的一篇文章对free-alignment 的工具进行了质量评估,doi: https://doi.org/10.1101/246967)。基于比对的流程,比...
自学lncRNA-seq数据分析的路径清晰且系统,以标准RNA-seq定量流程为起点,针对gencode数据库的gtf文件获取包含lncRNA和mRNA的表达矩阵。利用这一矩阵,可以进行火山图、热图、GO/KEGG数据库注释等分析,以深入了解表达差异。无论是通过芯片还是测序技术进行lncRNA分析,目标都是揭示表达差异,了解lncRNA与mRNA...
直接借鉴里面的分析pipeline 1. 构建index 这里用的是lncRNAKB这个数据库,省了不少事,既然NC都用了,那我们也用这个吧。http://psychiatry.som.jhmi.edu/lncrnakb/ 直接下载fasta和gtf文件,然后构建索引。 1 2 3 4 5 6 # hisat2提供了两个python脚本将GTF文件转换成hisat2-build能使用的文件 ...
CLIP-seq实验流程如下:RNA pull-down:是先将RNA进行标记(如生物素探针标记),再与细胞裂解液共同孵育,从而形成RNA-蛋白质复合物,之后再分离复合物得到蛋白质,通过western blot 或mass Spectrometry检测蛋白质的技术。RNA pull-down实验流程如下:RIP技术: RIP技术(RNA Binding Protein Immunoprecipitation,RNA结合...
cd cpc-0.9-r2/data formatdb -i (your_fasta_file) -p T -n prot_db #运行CPC: cd cpc-0.9-r2/bin/run_predict.sh (input_seq) (result_in_table) (working_dir) (result_evidence)run_predict.sh #建议将原始文件分割成比较小的文件去跑会快很多 # CNCI的安装:CNCI使用了SVM(支持向量机)分...
circRNA-seq分析的一般流程 ceRNA-芯片分析的一般流程 首先lncRNA是Non-coding RNAs的一种 长链非编码RNA(long noncoding RNA,lncRNA) 长度>200bp的RNA,由RNA聚合酶Ⅱ转录,lncRNA具有保守的 二级结构, 大部分不编码蛋白质,也有报道,其可以编码多肽,多 肽大部分无功能。
拟南芥、水稻和玉米RNA-Seq,包括三个生物学重复(GSE76798) 2.主要分析流程 (1)全基因组lincRNA的鉴定(具体流程见图1); (2)lincRNA中TE的含量、种类等特征; (3)拟南芥中TE-lincRNA的表达谱特征; (4)转基因验证TE-lincRNA对非生物胁迫的响应;
https://github.com/Dukunbioinfo/R-scripts-for-RNA-seq image.png 一些python脚本 https://github.com/Dukunbioinfo/RNA-seq image.png 还有一个gtf文件的处理工具 https://github.com/Dukunbioinfo/in-house-gtftools 可以操作 stringtie 软件的输出结果,一个很有用的功能是根据gtf文件中的class code来提取...