hmmer搜索同源基因

仅供参考,另外运行过程中生成的hmm文件和out文件可能不在HMMER文件夹中,而可能存在于用户名的文件夹中,所以很麻烦,找不到的可以在电脑全局搜索你的磁盘,hmm文件和out文件都可以用notepad++打开。

用序列搜索序列:

建立hmm模型:

1.将完全比对好的序列,我用clustalx生成clustal文件,后缀是aln

2.用在线网站把比对后的文件转换成stockholm格式:

http://sequenceconversion.bugaco.com/converter/biology/sequences/clustal_to_fasta.php

3.打开windows终端命令界面,直接把hmmbuild.exe程序拖进窗口,会出现这样的情况:

C:\\Users\\Ailin>E:\\hmmer3.0_windows\\hmmbuild.exe

可以直接用,例子: C:\\Users\\Ailin>E:\\hmmer3.0_windows\\hmmbuild.exe name.hmm E:\\hmmer3.0_windows\\name.stockholm(其中E:\\hmmer3.0_windows\\sample.stockholm也是直接拖过来的)

其命令其实是这样的:hmmbuild name.hmm name.stockholm

但是我的电脑要加环境变量才能读取数据,拖进去直接就有环境变量。

搜索同源序列:

C:\\Users\\Ailin>E:\\hmmer3.0_windows\\hmmsearch.exe E:\\hmmer3.0_windows\\name.hmm E:\\hmmer3.0_windows\\name.fa>name.out

其命令其实是:hmmsearch name.hmm name.fa>name.out

hmmsearch直接拖进去后,空格,直接拖进去hmm文件,空格,再直接拖进去需要寻找序列的库,最后加上>name.out/name.fa即可

用Pfam的domain搜索统所需的序列:

首先知道你要寻找的domain的Pfam编号,用序列在结构域预测工具中都能搜索的到。

进入pfam关键词搜索你的编号,点击左边Alignments,在Format an alignment中的format中选择stockholm。下载的是txt文件,但是直接改后缀就可以了。

其余步骤和上述一样。


分享到:


相關文章: