在进行基因组数据分析时,常常要用到基因组CDS和蛋白文件,有时候注释或下载的基因组没有蛋白文件,需提取并转换,用gffread提取时容易出问题,可能造成移码等,因此使用TBtools进行提取并转换。 Step1. 根据注释文件提取cds文件 得到的cds文件如下: step2. 将cds序列转换为蛋白序列 得到的protein文件如下: 仅供自己方便查阅...
Step1. 根据注释文件提取cds文件 图源:TBtools GUI 工具使用说明手册-20180905 得到的cds文件如下: step2. 将cds序列转换为蛋白序列 使用Sequence Toolkit中的 ORF Prediction——> Batch Translate CDS to Protein,这一步要注意的是输入和输出文件路径中不能有中文,否则会报错,我的报错如下: 更换路径后成功提取,结...