作为评测分子对接中打分函数的数据集,CASF2016将打分函数的能力分为四个部分:Scoring、Ranking、Docking、Screening。这四个部分的区别见下文。 首先需要注意的是,CASF2016可以直接用来评测打分函数。也就是说,你需要评测的目标程序不需要有生成构象(也就是所谓采样)的能力。在CASF2016的数据集中,已经给出了对接好的...
本文中作者开发了一个用于训练和测试机器学习打分函数的数据集ToCoDDB,该数据集覆盖靶点广且包含分子数多。该数据集收录的活性分子来源于公开数据集,阴性样本由ToCoDecoy算法产生,可以分为两类包括根据拓扑结构产生的与已知活性化合物结构不相...
该文章提出了一种用于机器学习打分函数(machine-learning scoring functions, MLSFs)训练和测试的无隐藏偏差(hidden bias)数据集构建新方法。该方法引入四种技巧来消除隐藏偏差,针对特定靶标的活性分子,基于条件分子生成和分子对接,可以基于已知的活性分子高效地生成相应的诱饵分子(假定的负样本,decoys),为MLSFs的训练和...
Journal of Medicinal Chemistry 作者比较了TocoDecoy、传统数据集DUD-E以及适用于机器学习打分函数评价的无隐藏偏差数据集LIT-PCBA。和另外两个数据集相比,TocoDecoy表现相当或更少的隐藏偏差。在模拟虚拟筛选实验中,在不同数据集上训练的模型...
2022年6月,浙江大学智能创新药物研究院侯廷军研究员团队、中南大学曹东升团队和腾讯量子实验室提出了一种用于机器学习打分函数训练和测试的无偏数据集构建新方法TocoDecoy。该方法有效去除了数据集中的隐藏偏差,基于分子生成模型和分子对接技术使得数据集的可扩展性大大提升。对比传统的数据集DUD-E和适用于机器学习打分函数...
日一二三四五六 27282930123 45678910 11121314151617 18192021222324 25262728293031 1234567 随笔档案 评论排行榜 1. Kesci: Keras 实现 LSTM——时间序列预测(12) 2. 卷积神经网络特征图可视化(自定义网络和VGG网络)(1) 3. Opencv-Python 图像透视变换cv2.warpPerspective(1) ...
本项目以支持向量机(SVM)技术为核心,利用酒店评论数据集进行了情感分析模型的训练。通过使用Word2Vec生成词向量,该项目实现了一个打分推荐系统,其中服务器端提供数据,而客户端则查询数据。 首先,项目使用了酒店评论数据集,这些评论包括了来自不同用户的对酒店的评价。这些评论被用来训练情感分析模型,该模型能够分析文本...
来源:腾讯科技 微软发布“史无前例”恶意软件数据集 一个“史无前例”的恶意软件感染数据集亮相了。这个数据集来自微软,毕竟,他们的重要产品Windows,大概是全球遭受病虫害最频繁的软件了。同时推出的,还有一场Kaggle竞赛:让你训练机器学习算法,来预测一台电脑是不是感染了恶意软件,俗称“中毒了没”。本文...
狗熊会在10月底邀请大家进行“颜值”打分,我们收集到了103143份打分,非常感谢各位志愿者的付出,现在我们将这个数据集分享给大家(但是数据质量确实不太好,请大家留心)。 另外,有12位热心朋友,为我们贡献了1000+打分数据,为了表示感谢,狗熊会特别赠送布丁老师的力作《R语言:从数据思维到数据实战》(签名版)!请这12位朋...
新数据集小,和原数据集类似,因为数据集小,不建议fine-tune, 防止过拟合,建议直接那fc前的特征,训练一个线性分类器 新数据集大,和原数据集类似,可以直接fine-tune 新数据集小,和 Keras - 加载预训练模型并冻结网络的层 目录 加载预训练模型: 冻结网络层: 冻结预训练模型中的层 加载所有预训练模型的层 在...