基因数据分析:将s2步骤获得的数据结果进行基因数据分析,分析内容选自基因预测、基因丰度统计、核心基因和泛基因分析;优选的,基因预测的操作包括:利用metagenemark软件对contigs进行基因预测,获得基因序列,然后采用cd-hit软件,将基因序列相似度大于95%,序列比对区域大于90%的基因聚类为一个cluster,95%identity、90%coverage,...
本发明涉及用于检测潜在存在于分析样品中的感兴趣生物物种(SOI)的方法,所述SOI具有已知或部分已知的基因组,所述样品包含不同生物物种的混合物,所述方法包括:a)从样品中提取核酸;b)对a)中提取的核苷酸序列进行测序;c)基于排序结果:(i)基于序列参考数据库分配步骤b)产生的序列;(ii)确定分配给SOI的序列量(R<subg...
一种宏基因组或宏转录组测序数据自动化分析方法,包括以下步骤:获取测序数据:获取待分析样本的宏基因组或宏转录组测序下机数据,以基因序列信息匹配微生物类型,得到初始菌种列表;crp数据库过滤:将上述初始菌种列表中的各菌种与预设临床可报病原体数据库中的菌种进行比对,保留记载于所述临床可报病原体数据库中的菌种和...
1、为了实现上述目的,本发明的目的在于提供一种宏基因组测序数据分析方法,reads比对到基因组上的离散程度联合属内最高reads数比值,作为数据过滤条件,设置阈值,降低假阳性。 2、本发明目的之二在于提供一种宏基因组数据分析计算机介质,包括数据过滤模块,运行本发明提供的数据分析方法,降低假阳性。 3、同时,本发明的目的...
1、为了解决现有技术存在的问题,本发明提供一种甲基化组学和宏基因组学分析方法(multimodal analysis of methylomics and metagenomics in one tube,mammot)。 2、本发明基于单样本全基因组亚硫酸盐测序(whole genome bisulfitesequencing,wgbs),整合了甲基化组学和微生物宏基因组学,提供一种分析方法,其尤其适用于脓毒...
4.目前,宏基因组测序平台主要为illumina为代表的二代高通量测序平台(nexseq/hiseq 2500/3000/4000),宏基因组测序数据主要的生物信息分析流程包括:序列质控、物种注释、组装、基因预测和功能注释。 技术实现要素: 5.本发明所要解决的技术问题是如何建立基于二代测序宏基因组数据的数据分析装置或方法。
19.本发明公开了上述的病原微生物宏基因组生信分析参考品在用于评估宏基因组检测生物信息分析流程的灵敏度、特异度、召回率和/或准确性中的应用。 20.与现有技术相比,本发明具有以下有益效果:本发明的一种病原微生物宏基因组生信分析参考品的制备方法,通过大样本的数据收集,针对不同样本类型的临床样本、不同类型的...
本发明的目的之四采用如下技术方案实现:一种基于肠道菌群宏基因组数据库的分析方法,包括如下步骤:接收步骤:接收用户的检索需求;匹配步骤:根据用户的检索需求与构建的宏基因数据库进行匹配以得到检索的匹配结果;输出步骤:输出匹配结果。进一步地,所述宏基因数据库包括人类肠道宏基因组的表型信息表、质控信息表、物种丰度...
图1为本发明实施例2的流程示意图。 具体实施方式 为了弥补以上不足,本发明提供了一种用于宏基因组测序数据的微生物物种与功能组成分析方法以解决上述背景技术中的问题。 一种用于宏基因组测序数据的微生物物种与功能组成分析方法,包括下列步骤: 1)切除原始数据中的接头序列片段、低质量片段,滤除过短序列、含模糊碱基...
利用近期快速发展的机器学习(machine learning)算法随机森林(random forest)建立分类模型对传统的差异菌群分析做补充,将宏基因组学基本otu聚类分析和数据多维度统计相结合,组成宏基因组数据特征菌筛选创新方法。 4.考虑到微生物组数据的特殊性,比如,属于组成数据(compositional data)、数据异质性(heterogeneous)高、稀疏性...