Amber残基重新编号
使用Amber的tleap对蛋白进行处理之后,残基编号会从1开始,并且去掉了链ID。虽然可以通过简单计算得到新结构与原始结构的残基编号的对应关系,但在某些情况特别是蛋白比较复杂时,这种对应关系也会变得复杂。本文总结了多种能够对tleap处理之后的蛋白进行重新编号的方法:
# tleap 处理过程 1. 原始结构(ori.pdb) 1
2
3
4
5
6
7
8
9
10
11
12# 三条链,每条链的残基编号为2,3,4
grep CA ori.pdb
ATOM 2 CA ALA A 2 -0.001 0.064 -0.491 1.00 0.00 C
ATOM 12 CA ARG A 3 3.662 0.442 -1.288 1.00 0.00 C
ATOM 36 CA SER A 4 6.039 3.309 -0.708 1.00 0.00 C
ATOM 47 CA ALA B 2 9.740 3.624 -1.342 1.00 0.00 C
ATOM 57 CA ARG B 3 12.083 6.546 -0.928 1.00 0.00 C
ATOM 81 CA SER B 4 15.814 6.812 -1.390 1.00 0.00 C
ATOM 92 CA ALA C 2 18.134 9.772 -1.149 1.00 0.00 C
ATOM 102 CA ARG C 3 21.884 10.008 -1.436 1.00 0.00 C
ATOM 126 CA SER C 4 24.188 12.990 -1.375 1.00 0.00 C
- tleap 处理 pdb4amber 去除氢原子,得到 ori_noH.pdb tleap 加氢,得到 leap.prmtop,leap.inpcrd,leap.pdb
1
pdb4amber -i ori.pdb -o ori_noH.pdb --nohyd --dry
1
tleap -f leap.in
parmed 方法
parmed 处理,得到
leap-update.prmtop,会记录读取的pdb中的残基编号、链ID、occupancy、bfactor、原子编号等信息,记录在
leap-update.prmtop 文件的末尾 1
parmed -O -i parmed.in -n > parmed.log
1
ambpdb -p leap-update.prmtop -ext -c leap.inpcrd > new_addH.pdb
RelabelChains.py 方法
使用AmberUtils的RelabelChains.py脚本也可以将
leap 得到的 leap.pdb 转换为重新编号的 new_addH2.pdb 1
RelabelChains.py leap.pdb new_addH2.pdb ori.pdb
awk 方法
awk 方法可以利用从 pdb4amber 输出的 ori_noH_renum.txt
文件中得到残基编号的映射关系,目前此脚本非常不智能 1
res_renum.awk leap.pdb > new_addH3.pdb
使用的文件
1 | cat > leap.in |
Ref: - parmed - RelabelChains.py - PDB 文件格式说明