承接上节RNA-seq入门实战(零):RNA-seq流程前的准备——Linux与R的环境创建 一、从NCBI获取数据SRR号 数据的文章来源: Formative pluripotent stem cells show features of epiblast cells poised for gastrulation | Cell Research (nature.com) 在文章的Data availability 下找到GEO accession number: GSE154290 进入...
nohup bash 00_prefetch.sh >log_00 2>&1 & 查看一下系统任务运行情况和test项目下的文件结构 任务运行没问题,等待数据下载完毕,暂时去relax一下吧ヽ(~▽~)ノ 当cat log_00出现以下downloaded successfully字样时表示下载完成,再检查数据下载情况,确认下载完成没问题后就可以进行下一步文件格式转化啦 log_00 ...
nohup bash 00_prefetch.sh >log_00 2>&1 & 查看一下系统任务运行情况和test项目下的文件结构 任务运行没问题,等待数据下载完毕,暂时去relax一下吧ヽ(~▽~)ノ 当cat log_00出现以下downloaded successfully字样时表示下载完成,再检查数据下载情况,确认下载完成没问题后就可以进行下一步文件格式转化啦 prefetch.l...
nohupbash01_sra2fq_qc1.sh>log_012>&1 & 等待任务完成,查看一下raw文件夹下数据 tree raw 四、质控清洗 1. 原始数据质量查看 查看上一步qc1文件夹下的multiqc_report.html质控汇总网页文件,主要关注测序质量与测序接头这两项内容,可以发现该数据质量较好,平均质量均在30以上,接头含量也很低。 具体内容分析见...
设置好用户名和密码进入Ubuntu后,需要设置一下用户权限 启用root需要设置密码:sudo passwd root 添加用户至root组:usermod -aG sudo username 切换root用户:su 退出root:exit 软件镜像源设置 一般选择国内的清华镜像,ubuntu | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror,Ubuntu 的软件源...
一、从featureCounts输出文件中获取counts矩阵 1. 读取counts.txt构建counts矩阵,进行样品的重命名和分组 ###环境设置rm(list=ls())options(stringsAsFactors = F)library(tidyverse) # ggplot2 stringer dplyr tidyr readr purrr tibble forcatslibrary(data.table) #多核读取文件setwd("C:/Users/Lenovo/Desktop/test...
基因集富集分析(Gene Set Enrichment Analysis, GSEA)是一种计算方法,用来确定一组先验定义的基因集是否在两种生物状态之间显示出统计学上显著的、一致的差异。 官网地址:GSEA (gsea-msigdb.org) 基本原理: 使用预定义的基因集(通常来自功能注释或先前实验的结果),将基因按照在两类样本中的差异表达程度排序,然后检验...
Cytoscape是一个开源软件平台,用于可视化分子相互作用网络和生物通路,并将这些网络与注释、基因表达谱和其他状态数据集成。Cytoscape还可以使用Apps实现一些附加功能,大多数Apps可以免费从Cytoscape应用程序商店获取。 Cytoscape 2. 数据导入 2.1 蛋白互作节点信息导入 ...