Chem import Draw, rdDepictor, rdMolDescriptors import warnings warnings.filterwarnings("ignore") 载入数据 #Load SMILES df = pd.read_csv('data.csv') SMILES = df['CAN_SMILES'].values SMILES转numpy # convert to array SMILES = np.asarray(SMILES) SMILES_train, SMILES_test = train_test_...
读取DataFrame中的SMILES:AddMoleculeColumnToFrame(frame, smilesCol, molCol, includeFingerprints) frame:DataFrame对象 smilesCol:SMILES所在列 molCol:新列名,将存放产生的rdkit mol对象 includeFingerprints:是否生成指纹 顺便计算下分子量:Descriptors.MolWt()...
我们可以认为SMILES是分子图的一种字符串表达,RDKit提供了利用ETKGD[1]方法将存储在SMILES中的二维结构信息转化为三维结构的接口。具体的,我们利用EmbedMolecule模块将二维分子图转化为三维分子坐标,如果有必要我们可以再利用MMFFOptimizeMolecule模块对分子结构进行简单优化,最后利用MolToMolFile模块将三维结构信息存储到SDF...
将smiles转换为RDKit 的Mol对象 PandasTools.AddMoleculeColumnToFrame(frame=df, smilesCol='smiles') df.head() df['calc_SA_score'] = df.ROMol.map(sascorer.calculateScore) x = df.sa_score y = df.calc_SA_score with mpl.style.context('seaborn'): plt.plot(x, y, 'o') plt.xlabel('gi...
将SMILES转换为RDKit的Mol对象 代码语言:javascript 复制 data_logp['molecules']=data_logp.SMILES.apply(Chem.MolFromSmiles)data_logp.head() 计算描述符 代码语言:javascript 复制 data_logp.loc[:,'MolLogP']=molecules.apply(Descriptors.MolLogP)data_logp.loc[:,'HeavyAtomCount']=molecules.apply(Descripto...
Chem import Draw, rdDepictor, rdMolDescriptors import warningswarnings.filterwarnings("ignore") 载入数据 代码语言:javascript 复制 #Load SMILESdf = pd.read_csv('data.csv')SMILES = df['CAN_SMILES'].values SMILES转numpy 代码语言:javascript 复制 # convert to arraySMILES = np.asarray(SMILES)...
将SMILES转换为RDKit的Mol对象 data_logp['molecules']=data_logp.SMILES.apply(Chem.MolFromSmiles) data_logp.head() 计算描述符 data_logp.loc[:,'MolLogP']=molecules.apply(Descriptors.MolLogP) data_logp.loc[:,'HeavyAtomCount']=molecules.apply(Descriptors.HeavyAtomCount) ...
Description: RDKit Version: 2018.09.2, also 2019.03.dev1 Platform: Linux/python 3.6.8, also MacOS 10.14.3/python 3.7.2 I was surprised that the results of AllChem.MolFromSmiles with sanitize=True can differ subtly from the results of All...
笔者在根目录下创建了个 debug 文件夹,并在里面创建了 test.cpp 和 CMakeLists.txt 两个文件。test.cpp 自然是用于调试的文件,新建 main 函数,传入苯的 SMILES,将其转化成 RWMol 对象。非常简单的操作,仅仅是用于证明可以进入调试状态。 #include <GraphMol/SmilesParse/SmilesParse.h> ...
查看该子结构:MolFragmentToSmiles() 这只不过是一句正确的废话,根据SMRATS查询,返回的肯定是对应的结构了>>> print(Chem.MolFragmentToSmiles(mol, atomsToUse=hit_at, rootedAtAtom=0)) >>> print(Chem.MolFragmentToSmiles(mol, atomsToUse=hit_at, rootedAtAtom=9)) ClccO OccCl ...