首先,提取了蛋白质序列的三类特征:氨基酸的伪马尔科夫转移概率,氨基酸 含量和氨基酸位置。深入分析了三类特征之间的关系,建立了氨基酸的伪马尔科夫 转移概率与氨基酸含量之间的数学关系式。进一步融合三类特征构成440维特征向 量用以表征蛋白质序列。然后,基于“向量之间的欧氏距离越大(小),序列的相似性 ...
其次,基于IM-Psepssm,提出三种新的特征描述方法,挖掘不同残基间的关联信息,并与改进IM-Psepssm进行对比分析.第三,鉴于蛋白质序列固有的关键信息位点,将其融入位置特异性得分矩阵(PSSM),提出新的分段增强组成(P-PSSM-En Com)特征描述方法.最后,通过对基准数据集中数据长度分布概率分析,基于PSSM,对不同分割点的子...
1.一种蛋白质序列特征可视化提取方法,其特征在于依次包括如下步骤: 1)对蛋白质序列中的氨基酸进行数字编码,通过编码模型将蛋白质字符序列转换成反映蛋白质序列理化性质的三条不同的数字序列; 2)基于偏序理论构建三个反映蛋白质序列单个性质的哈斯矩阵,这三个哈斯矩阵中的元素只有“0”和“1”二个数字,再通过变换将...
蛋白质序列在频率域上的一种特征提取方法
要深入了解它的原理之后。然后靠自己的经验会比较快的组合出特征提取+分类方法的组合
本发明涉及一种蛋白质序列特征可视化提取方法,主要包括首先对蛋白质序列中每个氨基酸进行数字编码,通过编码模型将蛋白质字符序列转换成反映蛋白质序列理化性质的三个数字序列,再基于偏序理论构建三个哈斯矩阵,通过变换将这三个哈斯矩阵转换成一个改进的哈斯矩阵,这个改进的哈斯矩阵中的元素由"0","1","2","3","4"...
1.一种基于多模态蛋白质序列的特征提取与编码方法,其特征在于,所述方法包括:步骤A、分别基于蛋白质氨基酸序列的相对突变率、亲水特性以及疏水特性对蛋白质序列进行特征提取,获取三种模态的蛋白质特征;步骤B、对所述三种模态的蛋白质特征分别进行深度多项式网络编码,分别得到三种高级的特征表达;步骤C、将所述三种高级的特...
本发明涉及一种蛋白质序列特征可视化提取方法,主要包括首先对蛋白质序列中每个氨基酸进行数字编码,通过编码模型将蛋白质字符序列转换成反映蛋白质序列理化性质的三个数字序列,再基于偏序理论构建三个哈斯矩阵,通过变换将这三个哈斯矩阵转换成一个改进的哈斯矩阵,这个改进的哈斯矩阵中的元素由"0","1","2","3","4"...
本发明公开了一种基于多模态蛋白质序列的特征提取与编码方法及系统,方法包括:分别基于蛋白质氨基酸序列的相对突变率,亲水特性以及疏水特性对蛋白质序列进行特征提取,获取三种模态的蛋白质特征;对所述三种模态的蛋白质特征分别进行深度多项式网络编码,分别得到三种高级的特征表达;将三种高级的特征表达经过级联后再次进行深度...
向量序列傅里叶变换信噪比针对不同蛋白质选取不同的氨基酸指数进行蛋白质研究,提取氨基酸序列的位置和排列信息在频率 上的特征频谱作为特征向量,通过计算特征向量的距离考察蛋白质的相似性.这是一种非比对相似性的判别方法.蛋白质组的聚类结果表明,蛋白质序列在频率域上 的特征提取方法具有一定的应用价值和生物学意义....