CMap数据库作为潜在药物研究的强大工具,能够进一步推动组学研究成果的临床转化。在非常多的组学文献中[1-4],都通过CMap数据库比对自己项目的基因表达谱数据来获得潜在小分子化合物药物列表,并通过系列的基础实验验证潜在药物的治疗效果(如下图,作者通过CMap筛选得到三种潜在药物Sulconazole、Menadione、GW8510,后续开展细胞...
CMap数据库介绍 今天为大家介绍的是一个潜在药物数据库——Connectivity Map(简称CMap)基因表达数据库,由美国癌症研究所(National Cancer Institute,NCI)的癌症系统生物学中心(Cancer Systems Biology Consortium)创建。根据不同干扰物(涵盖小分子等)处理人类细胞后的基因表达差异,建立一个干扰物、基因表达和疾病相互关联的...
近期,在风湿免疫领域权威期刊《Annals of the Rheumatic Diseases》(一区,IF = 20.3)上发表了一篇基于 GBD 数据挖掘的论文,「好 City」到飞起,再次印证了 GBD 数据库的学术价值和应用潜力。 他们是如何做到的?别急,现在就让我们跟...
KEGG富集分析的结果文件 通过目的基因集和背景文件,完成富集分析后我们会得到下方格式的结果文件。 ID :KEGG pathway IDDescription :KEGG Pathway ID 的描述GeneRatio :本次富集实验注释到该 KEGG Pathway 的基因数/本次富集实验注释到 KEGG Pathway 数据库的基因总数BgRatio :基因组中能注释到该KEGG Pathway的基因数...
以下是使用HPA数据库,并从中获得目标免疫组化图片的具体操作步骤: 1.目标检索: 1. 首先打开HPA网站(https://www.proteinatlas.org/),在搜索栏输入目标基因或蛋白名称,如本例中的“NDUFAF6”,而后点击“Search”。 图3:HPA数据库首页检索 页面跳转至搜索结果,包括对该基因或蛋白的描述,以及各种图谱结果(Tissue...
海量数据库挖掘是一种从大量数据中提取有价值信息的技术,主要包括数据预处理、模式发现、知识表示和结果评估。数据预处理是整个过程的基础,能够有效处理数据中的噪声和缺失值,提高数据质量。模式发现则是通过算法从数据中找出潜在的模式和关系,这部分是数据挖掘的核心。知识表示则是将发现的模式转化为易于理解和应用的形...
公共数据库挖掘虽然快捷,但要想得到有意义的研究结果,需要针对数据可能出现的偏倚、数据缺失等问题进行处理。对于这些问题,我们可以采用的统计学方法有很多,但要想找到最合适的一种很难。老郑解读 我认为,公共数据库挖掘,最重要的是它的数据真实性。在这一点上,是自己小规模采集的数据不可比的,也是能够发文的...
Microsoft Naive Bayes 算法,当然后续还补充了一篇结果预测篇,所涉及的应用场景在前几篇文章中也有介绍,有兴趣的同学可以点击查看,本篇我们将总结的算法为Microsoft时序算法,此算法也是数据挖掘算法中比较重要的一款,因为所有的推算和预测都将利用于未来,而这所有的一切都将有一条时间线贯穿始终,而这将是时序算法的...
KEGG数据库:KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库提供了关于基因组、代谢通路和药物相互作用的信息。它不仅可以帮助研究人员理解生物通路的机制,还能为药物开发和疾病研究提供重要的数据支持。 生信数据库的挖掘方法有哪些? 在生物信息学研究中,挖掘数据库中的数据是非常关键的一步。有效的挖掘方法可以帮...
生信专栏 |GEO数据库挖掘(一):数据查询与下载+读取 在最后我们得到了列名是样本名,行名是探针ID的矩阵: 这一节,我们来实操如何实现基因symbol ID转换,我也会针对大家找注释文件的各种情况,逐一介绍,话不多说,直接开始! 开始实操 Step1...