Pubchem CID,即PubChem Compound ID,是PubChem数据库的化合物登录号,由纯数字组成,例如D-葡萄糖(D-Glucose)的Pubchem CID是5793。 1.2.5 CAS Registry Number CAS注册号是某种化合物唯一且明确的标识符,是美国化学学会CAS注册数据库的注册号。CAS注册号是数字标识符,最多由10个数字组成,用连字符分为三部分,其...
逐个部分来看,首先是第一部分——服务本身的HTTP地址,对所有PUG REST请求都是通用的。 下一部分是输入,这里表示“我想在PubChem化合物数据库中查找名称为'vioxx'的记录。” 需要注意的是,在这里有些微妙之处,即名称必须已经存在于PubChem数据库中,并且一个名称可能对应多个化合物标识符(CID)。但底层原则是基于名称...
cid:化合物的PubChem化合物标识符。 inchikey:化合物的InChI Key。 例如,如果要通过名称搜索化合物,可以使用以下代码: 例如,如果要通过名称搜索化合物,可以使用以下代码: 遍历搜索结果并处理所需的化合物信息。例如,可以打印每个化合物的CID和分子式: 遍历搜索结果并处理所需的化合物信息。例如,可以打印每个化合物的...
名称匹配:准确性与多样性 尽管通过名称查找化学物质方便快捷,但请注意,化学名称与结构的匹配可能不够精确,一个名称可能对应多个记录。例如,"葡萄糖"可能对应四个CID,全名同义词匹配搜索结果也相似。PUG REST默认要求完全匹配,但允许指定仅匹配名称中的单个单词,以获取最佳匹配结果。实例:药物名称批量...
Pubchem CID HMDB ID SMILES InChI InChIKey 01 CAS Registry Number CAS Registry Number是我们向供应商采购代谢物的关键依据(以保障买到正确的代谢物)。CAS Registry Numberd的本质是代谢物到美国化学学会CAS注册数据库注册获得的注册号。 CAS Registry Number的格式为“[0-9]{2-7}-[0-9]{2}-[0-9]”,第...
database = pd.DataFrame({'formula': formula, 'cid': cid}) database.to_csv('pubchem_data.csv', index=False) if __name__ == '__main__': main() ``` 这个程序首先定义了两个函数:`fetch_pubchem_data`用于从PubChem的API获取数据,`parse_file`用于解析SDF文件并将数据转换为DataFrame。主函...
允许按名称、子结构和相似性进行化学搜索、化学标准化、化学文件格式之间的转换、化学性质的描述和检索。 PubChemPy功能 通过名称,SMILES,InChI和SDF搜索PubChem物质和化合物数据库。 检索给定输入结构的标准化化合物记录。 在SDF,SMILES,InChI,PubChem CID等之间转换。 检索计算的属性,指纹和描述符。 生成2D和3D坐标...
PubChem,即有机小分子生物活性数据,是一种化学模组的数据库,由美国国家健康研究院( US National Institutes of Health,NIH)支持,美国国家生物技术信息中心负责维护。 PubChem数据库包括 3个子数据库: PubChem BioAssay 库用于存储生化实验数据,实验数据主要来自高通量筛选实验和科技文献; PubChem Compound 库用于存储整...
#将CID列表转换为DataFrame cid_df = pd.DataFrame({'cid': cids}) print(cid_df) ``` 3. 编写脚本,利用conda环境中的库批量向PubChem API发送请求,获取SMILES信息: 使用PubChem PUG REST API批量下载SMILES信息。以下是一个Python代码示例: python import requests import pandas as pd # PubChem PUG RES...
PubChemPy提供了一种在Python中与PubChem进行交互的方法。 它允许按名称,子结构和相似性进行化学搜索,化学标准化,化学文件格式之间的转换,化学特性的描述和检索。 >> > from pubchempy import get_compounds , Compound >> > comp = Compound . from_cid ( 1423 ) >> > print ( comp . isomeric_smiles ...