利用RDKit实现有机分子SDF文件与SMILES的相互转换 徐哈哈 AI for Science 28 人赞同了该文章 1. 介绍 SDF (Structure Data File)是常见的化学数据文件,SMILES (Simplified Molecular Input Line Entry Specification)是一种用ASCII字符串明确描述分子结构的规范。它们被广泛应用于计算化学,化学信息学等领域。本文将...
SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。 基于RDKit的Python脚本:sdf格式转smiles格式 代码语言:javascript 复制 #!usr/bin/python3# python sdftosmiles.py molecules.sdfimportsys from ...
基于RDKit的Python脚本:sdf格式转smiles格式 #!usr/bin/python3 # python sdftosmiles.py molecules.sdf import sys from rdkit import Chem def converter(file_name): mols = [ mol for mol in Chem.SDMolSupplier( file_name ) ] outname = file_name.split(".sdf")[0] + ".smi" out_file = ...
SDF文件中有比SMILES更丰富的结构信息,如果将SDF文件转化为SMILES必然会引起信息的损失,因此一般我们只有希望提升存储效率等情况下需要用到这一转化。RDKit中的MolToSMILES模块为我们提供了实现这一转化的接口,在此之前,我们需要利用MolFromMolFile这一模块将SDF文件中存储的分子信息转变为RDKit中的Mol对象。 mol = Che...
SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。转换成二维图形可以使用Helson的“结构图生成算法”(Structure Diagram Generation algorithms)。 基于RDKit的Python脚本:sdf格式转smiles格式 #!usr/bin/python3# python sdftosmiles.py molecules.sdfimportsysfromrdkitimportChemdefconverter(...
Description: Substance_000000001_000025000.sdf.zip I downloaded a sdf file from PubChem and I want to convert sdf to SMILES, but I have some problems. I am very anxious, I hope to get help. RDKit Version:2018.09.1 Platform:macOS High Sie...
读取SDF中的属性并输出为CSV项目 不必使每个化合物的属性具有相同的属性(输出不为空的属性)。 import pandas as pdfrom rdkit import Chemimport argparsefrom collections import defaultdict def main()... 将化合物格式SDF文件转换为CSV文件。 读取SDF中的属性并输出为CSV项目 ...
1. 导入要匹配的结构化数据 目的是按照列名Filename匹配所有sdf文件转换成smiles写入第四列 2. 一个简单的脚本 python extrat.py for_extrat.csv 调用 importnumpyasnpimportpandasaspdfromopenbabelimportpybel# from rdkit import Chem# from rdkit.Chem import MolToSmiles, MolFromXYZFile, MolFromXYZBlock, ...
from rdkit import Chem suppl = Chem.SDMolSupplier(sys.argv[1]) for mol in suppl: if mol: print(Chem.MolToSmiles(mol),mol.GetProp("_Name")) By default, Chem.MolToSmiles produces canonical isomeric SMILES. Here's the query I use to get drugs from ChEMBL. ...
我为一个分子生成了一堆构象异构体。对于每个一致的,我想将坐标保存在 SDF 文件中。我尝试了以下操作,但 sdf 文件中的坐标与符合者的坐标不同。 fromrdkitimportChemfromrdkit.ChemimportAllChemfromrdkit.Chem.EnumerateStereoisomersimportEnumerateStereoisomersfromrdkit.Chem.EnumerateStereoisomersimportStereoEnumeration...