首页 > 编程知识 正文

hdfs文件拆分,sdf文件是什么

时间:2023-05-06 12:18:45 阅读:184314 作者:3478

1. OpenBabel拆分sdf文件

使用openbabel来拆分大的sdf文件为单独的sdf文件,可下载安装openbabel

babel test_opt.sdf --split -aT -osdf

将会输出以每个分子第一行中定义的分子名称为file name
后期实测并不好用,很多sdf为空

2. shell脚本拆分含有多个sdf小分子的大文件

下面为提交拆分计算的qsub脚本split_sdf.qusb

#!/无奈的橘子/bash#PBS -q q_share#PBS -V#PBS -N split#PBS -l nodes=1:ppn=28#PBS -o /home/murphy/sdf/split.log#PBS -j oecd /home/murphy/sdf/#读取大的sdf文件中以`$$$$`为分割段落的行数cat part1.sdf|grep -n "\$\$\$\$"|awk -F ':' '{print $1}' >end_num.txt#循环读取分割行数来拆分sdf文件,并以每个分割后的sdf文件的第一行重新命名该文件j=1for i in `cat ./end_num.txt`do sed -n "${j},${i}p" part1_5000.sdf >${i}.sdfj=$[$i + 1]file_name=`sed -n '1p' ${i}.sdf`mv ${i}.sdf ${file_name}.sdfdonerm -f ./end_num.txt 3. 删除sdf文件中的分子属性信息

sdf文件中的分子属性如下所示

<r_lp_tautomer_probability>
1

3.1 sed删除所有属性 sed '/>.*>/,+2d' test.sdf 3.1 OpenBabel 删除指定属性 babel -isdf test.sdf --delete “r_lp_tautomer_probability” -osdf test_delete.sdf

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。