首页 > 编程知识 正文

king prediction,pca特征提取

时间:2023-05-05 19:59:44 阅读:216155 作者:85

PSSP之特征提取(PSSP protein secondary structure prediction) One-hot encoding AACPSSM encodingSVM 分类优化之特征清洗

One-hot encoding AAC

维度为20+3(BXZ)。

PSSM encoding fasta文件psi-blast程序+protein db(nr db 40G 下载失败 uniref50 6G 下载成功)makeblastdb.exe (uniref50 格式化成功 耗时 4846 secords)python批量 cmd操作(待续)data_process.py SVM 分类

多核组合rbf+lin 效果好

优化之特征清洗 加上标志位 或是化学性能的特征 还有加上3个AAC 再用数据库uniref50跑一下pssm 还是自己的程序跑出来PSSM 比较靠谱 而且 看了很多论文也用了uniref50说明他还是有点靠谱的 还有就是归一化特征 我去我之前LSTM跑的文本分类里去找一下灵感 还有就是划窗操作 吧PSSM用滑动窗口处理下 看看会不会有优化效果 给PSSM的值归一化

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。