作业帮 > 综合 > 作业

perl 计算氨基酸对的频率

来源:学生作业帮 编辑:搜狗做题网作业帮 分类:综合作业 时间:2024/08/05 11:30:23
perl 计算氨基酸对的频率
我的源文件seq如下:

现在要做如下处理,计算每一行间隔为k的氨基酸对出现的频率.比如,第一行,间隔为三(k=3)的氨基酸对是,NR,GT,LQ,IT,需要统计这么些个氨基酸对出现的频率并输出.总次数很好算,直接利用length($seq)-k-1.
可是,我没有办法统计氨基酸对出现的次数,还是举第一行的例子,就是我没很好的办法实现统计NR出现过几次,这样我就没法计算NR对出现的频率了

perl 计算氨基酸对的频率
#!/usr/bin/perl
use strict;
use warnings;
open (IN, "amin.txt"); ##输入文件
open (OUT,">result.txt"); ##输出文件
my $k=3;
print OUT "Row_Number\tAmino-acid-pair\tcounts\n"; ##结果文件格式 行 氨基酸对 本行出现次数
my %amin;
my $line=1;
while(){
chomp;
my $seq=$_;
for(my $i=0;$i