这个是帮师妹写的一个用于处理clusta序列比对的处理脚本,对序列比对的结果进行处理,统计出所有位置上对应的氨基酸残基种类数目,从而得出哪些位置为保守的,哪些位置为不保守的(种类数目越多,认为是不保守位置)

使用方法如下:

1
2
3
4
5
6
7
8
9
10
11
12
Usage: aln.py [options] arg
Options:
-h, --help show this help message and exit
-n NUMPROTEIN, --num=NUMPROTEIN
设置序列比对中蛋白数量
-p PARAGRAPH, --paragraph=PARAGRAPH
设置一共有多少段内容
-f PATHFILE, --file=PATHFILE
设置读入文件路径
-s SAVEFILE, --save=SAVEFILE
设置保存文件名

例如:

1
python .\aln.py -n 100 -p 16 -f .\seqdump.aln -s .\save.csv

结果可用统计软件进行处理

脚本下载: aln