最近帮他们抓取pubchem上的一些数据,pubchem是一个开放的数据库,爬起来难度不是很大,网上也有一个库叫pubchempy,之前也用来抓取过化合物的结构信息。今天主要是来看看如何通过网站的api来自定义抓取。 首先打开网址:https://pubchem.ncbi.nlm.nih.gov/ 通过cid来搜索,输入9809 进去之后获得这个地址:https://pubch...
可以使用此 API ( volkamerlab.github.io)自动化并处理大量数据。 但是尝试API接口之后只能获取到一些静态的信息,像下图中的信息是通过动态加载得到的,API接口无法得到,只好进行爬虫了。以下是具体实现的Python代码。 以下代码读取csv文件中的CID后到对应的PubChem网页中检查是否有“Interactions and Pathways”信息,有...
可以使用此 API ( volkamerlab.github.io)自动化并处理大量数据。但是尝试API接口之后只能获取到一些静态的信息,像下图中的信息是通过动态加载得到的,API接口无法得到,只好进行爬虫了。 添加图片注释,不超过 140 字(可选)以下是具体实现的Python代码。以下代码读取csv文件中的CID后到对应的PubChem网页中检查是否有“...
在使用PubChem REST API时,我们需要指定搜索条件。默认情况下,PubChem会搜索所有三个主要部分:物质、生物活性和文献。但是,我们可以使用不同的参数来限制搜索结果。python#搜索名称中包含“aspirin”的化合物compounds = pcp.get_compounds('aspirin','name')#搜索具有给定CID的化合物compound = pcp.Compound.from_...
Python OntoJog ontologypubchemcurationbioassay UpdatedNov 16, 2022 Java Tools for exploring Pubchem databases pythonmongodbpubchem UpdatedApr 9, 2023 Python omnaest/PubChem4J Sponsor Star1 REST API client for the pubchem api javarestpubchem ...
在实现PubChem爬虫之前,我们需要准备好Python环境、安装必要的库并获取相应的API密钥。接着,我们可以按照以下步骤来实现爬虫:1.构造请求URL;2.发送HTTP请求并获取响应;3.解析HTML代码并提取所需信息;4.存储数据。5.爬虫注意事项 在编写PubChem爬虫时,需要注意以下几点:1.遵守网站的使用条款;2.控制请求频率,...
PubChemPy是一个Python库,用于访问PubChem数据库中的化学信息。在PubChemPy中,可以使用搜索类型选项来指定搜索的类型,以便更精确地查找所需的化合物。 要在PubChemPy...
右键点击页面,选择"检查"(推荐使用谷歌浏览器),然后切换到"Network"选项。刷新页面后,你会看到一个带有'heading'参数的链接。点击它,获取到的数据API地址便展现在眼前,复制并打开新的页面查看。API返回的json数据结构较为复杂,需要逐步解析。例如,如果你需要抓取大量化合物的数据,可以编写循环,将...
使用pubchempy库提供的API,对筛选出的化合物名称进行批量查询。pubchempy库能够简化与PubChem数据库的交互,并直接返回化合物的CID。示例代码:pythonfrom pubchempy import get_cidscids = get_cids 这段代码将返回一个字典,其中键是化合物名称,值是对应的CID。如果某个化合物名称在PubChem中不存在...
Python wrapper for the PubChem PUG REST API. Contribute to mcs07/PubChemPy development by creating an account on GitHub.