作为一名生物科研狗,在饱受实验折磨的同时,相信大家也都多少会受到一些生信软件的“宠爱”。比如需要做序列比对,却不知道该用什么软件,不知道怎么设参数、不懂怎么读结果。
今天我们详细地给大家介绍一款必会比对程序BLAST的用法,再给大家说一说几种常用比对软件的优缺点,方便大家自己选择。
BLAST(BasicLocalAlignmentSearchTool)可以说是短序列比对中最常用的比对工具了,它不仅支持核酸和蛋白的双序列比对,而且可以在蛋白质数据库或DNA数据库中进行相似性比较,找到与查询序列相似的序列。
NCBI上的在线BLAST具有四种功能模块:NucleotideBLAST(核酸序列比对到核酸库)、ProteinBLAST(蛋白序列比对到蛋白库)、BLASTX(核酸序列比对到蛋白库)、TBLASTN(蛋白序列比对到核酸库)。
使用方法:
B可以选择不同的比对选项,对应于我们前面介绍的五种功能
D可以接受各种格式的查询序列,可以一个序列号(NM_)或者是FASTA序列
E可以限定查询序列中的某个片段,比如“fromto”就是查询-bp位置的序列
G可以选择进行多序列比对,并且可以更改序列输入方式
A可以选择所要查询的数据库
B可以输入物种名称,它会显示下拉条目可以进行选择
C可以用来排除一些不想要的信息
D对于特定数据库可以进行一些搜索限制,比如输入“biomol_mrna[prop]AND:[slen]”可以限制搜索-bp长度的序列
E可以根据需要选择不同的速度或者灵敏度
F按钮执行BLAST搜索
G可以打开一个折叠页面,可以进行更为详细的参数设置(如下图)
H可以设定数据库中最大的匹配目标数
I允许BLAST自动优化30个碱基/残基或更短的查询设置
J是一个期望阈值的设置,可以过滤掉不太重要的匹配
K设置初始序列匹配的大小,设置越小越敏感
L限制了最大匹配数,默认设置“0”表示无限制
F和G是得分参数,对BLAST的敏感度也会有影响,不过一般情况下可以设为默认值。
比对结果:
左边图中显示一些关于比对的信息
JobTitile默认情况下显示第一个查询的序列id,也可以提交前对其进行自定义。
RID显示分配给此搜索的唯一标识符,DownlodALL可以将完整的搜索结果保存为所需的格式XML(XML2)、JSON和CSV
Program列出进行的搜索,在本例中为BLASTN提供参考文献
Database是搜索的数据库,可以查看详细信息
QueryID显示结果的查询序列id
右图中的可以选项参数用于过滤结果
Organism允许设置物种名
PercentIdentity允许设置同一性程度进行过滤,比如94.74%到94.76%
EValue允许通过期望值进行过滤,比如设置0.到5e-(5x10-).
Description是BLAST结果默认显示选项,可以通过旁边的按钮切换
以上结果是默认按E值由高到低进行排序的,单击后面的每条accession号可以直接跳转到对应的核酸库或蛋白库中。
Graphics可以链接到基于图形序列的匹配显示(如下图)
Distancetreeofresults可以以距离树的形式显示比对结果(如下图),如果比对的是蛋白序列的话还会有一个Multiplealignment用于系统发育分析。
Alignments选项下包含查询序列和数据库序列之间的详细比对信息。
BLAST功能强大,使用方便,但是也存在一些缺点,它的分析速度比较慢,比对结果现不够直观,不利于后续的处理,比对不能显示基因内含子、外显子及基因定位等等。
BLAT(TheBLAST-LikeAlignmentTool)也是一款常用的序列比对工具,对于DNA序列,BLAT是用来设计寻找95%及以上相似至少25个碱基的序列。对于蛋白序列,BLAT是用来设计寻找80%及以上相似至少20个氨基酸的序列。
相比于BLAST,BLAT比对更简单方便,速度更快,还可以输出更为易读的比对结果,可以很容易的找到exons和introns。BLAT也同样可以处理DNA,RNA和蛋白质序列的比对。线上BLAT工具在
转载请注明:http://www.0431gb208.com/sjszlfa/1275.html