(A) LA-ESM2, (B) LA-ProtTrans, (C) LA-ESM-MSA, (D) ULDNA, (E) PredDBR;橙色表示DNA分子,灰色表示蛋白质分子;红色、蓝色和绿色分别表示假阳性位点(非DNA结合位点被错误地预测为结合位点)、真阳性位点(被正确预测的DNA结...
转录因子结合位点(TFBS)是TF结合的DNA片段,通常在4-30bp范围内。转录因子通常同时调节多个基因,在某种程度上,其在不同基因上的结合位点是保守的,但并不完全相同。因此,DNA-蛋白质结合的准确预测对于理解转录因子的生理作用,表征基因组的特定功能特征以及阐明在复杂生物体中如何精心编排高度特异性的序列表达程序...
更重要的是,该研究证明了多种蛋白质大语言模型在蛋白质-DNA结合位点预测中的潜在有效性和互补性。然而,该研究也存在一些不足和挑战。例如:目前使用的线性特征融合策略容易造成信息冗余,该策略将在后续研究工作中被进一步地优化;再者,考虑到蛋白质结构预测方法(如AlphaFold和ESMFold)的快速发展,后续可能在蛋白质-DNA结...
分分 类 号:TP391 研究生学号:2018532082 单位代码:1 0 1 8 3 密密 级:公公开开吉林大学 硕士学位论文(学术学位) 基于深度学习蛋白质-ATP 和蛋白质-DNA 结合位点的预测研究 Research on Prediction of protein-ATP and protein-DNA binding sites based on deep learning 作作者姓名:裴志尧 专专 业业: ...
本发明涉及一种预测DNA蛋白质结合位点的集成学习方法,其包括以下步骤:获取DNA结合蛋白质位点的蛋白质序列数据;对DNA结合蛋白质位点的蛋白质序列数据预处理;使用onehot编码方式构建输入数据;将提取的特征合并,构建每个蛋白质序列上氨基酸的特征,将其作为输入数据;使用SMOTE算法对正样本数据进行过采样;根据正样本大小将负...
一种预测DNA蛋白质结合位点的集成学习方法本发明涉及一种预测DNA蛋白质结合位点的集成学习方法,其包括以下步骤:获取DNA结合蛋白质位点的蛋白质序列数据;对DNA结合蛋白质位点的蛋白质序列数据预处理;使用one‑hot编码方式构建输入数据;将提取的特征合并,构建每个蛋白质序列上氨基酸的特征,将其作为输入数据;使用SMOTE算法...
基于自注意力残差网络的DNA-蛋白质结合位点预测方法专利信息由爱企查专利频道提供,基于自注意力残差网络的DNA-蛋白质结合位点预测方法说明:本发明公开了一种基于自注意力残差网络的DNA‑蛋白质结合位点预测方法,包括:对ChIP‑seq...专利查询请上爱企查
本发明公开了一种基于自注意力残差网络的DNA‑蛋白质结合位点预测方法,包括:对ChIP‑seq数据集进行同源性去除,对DNA序列进行编码,将DNA序列中的碱基转换为特征向量;对数据集进行随机下采样构建全局训练数据集Init‑Dataset;构建基于自注意力机制与残差结构的深度学习网络;将全局训练数据集输入基于自注意力机制与残差...
综述生物信息学方法在判断DNA结合蛋白质和预测结合位点中的应用研究进展.蛋白质与DNA间的相互作用是基因表达调控的分子生物学基础,因此DNA结合蛋白的判断以及DNA与蛋白质间作用位点的预测一直以来都是分子生物学和生物信息学的前沿领域.采用生物信息学方法进行这类判断和预测,具有省时,省力的特点,近年来吸引了众多科学家...
^▲●一▲一基于离散增量结合二次判别法预测蛋白质相互作用及DNA甲基化位点PredictionofProtein-ProteinInteractionandDNAMethylationSitesBasedonIncrementofDiversityCombinedwithQuadraticDiscriminantAnalysis研究生姓名:***教师姓名:***古科技大学数理与生物工程学院包头014010,中国Candidate:LiuJiaSchoolofMathematics,Physicsandbiol...