bubble popblast2关卡包4第99...

程序下载后去掉后缀变成.zip格式解压!!!!!!

程序下载后去掉后缀变成.zip格式,解压!!!!!!

蓝球为4,黄球为3,绿球为2,红球为1,空白为0(空白可以不输)

依次输入即可空白可以不输

有的关卡解决不了,因为BubbleBlast2游戏有时不按套路出牌无语啊

仔细看,就会发现 2个子弹碰到黄球直接炸了(理论上变成红球)

还有 1个子弹碰到绿球直接炸了(完全不可能的事嘛)请仔细看

源序列文件(多条fasta)创建数据庫

4、在当前目录下,将数据文件格式化:

运用新建的数据库进行比对

5、将待进行blast的文件转化为test.fa文件,拷贝文件内容如下:

你***的blast路径為 /opt/blast/1、把BLAST的压缩文件解压然后将bin目录下的文件拷贝至/usr/local/bin下;---目的:所有用户,不管其当前路径是什么均可以在命令行下直接调用blast包中的程序,而无需指定该程序的路径解释:系统的PATH环境变量中包含/usr/local/bin在命令行下调用blast包中的程序时,系统会去/usr/local/bin路径下寻找相应的命令程序建议:簡单起见你可以略过这一步,除非你希望当使用其他用户登录后也可以直接输入程序名来使用你***的blast2、制作软链接,将解压后的文件中bin目录链接至/home/username下eg:ln -s /home/username/blast/bin;---目的:为第3步所做的准备工作建议:简单起见,你可以略过这一步3、在当前用户目录下编辑bashrc文件,在文件中加叺export

建库的过程是建立目标序列的索引文件所用程序是formatdb。程序允许的输入格式FASTA或者ASN.1格式通常我们使用FASTA格式的序列作为输入。用于建库的FASTA序列是db.seqformatdb的基本命令是:

常用的参数有以下几个:

-p (T/F):-p参数的意义是选择建库的类型,"T"表示蛋白库"F"表示核酸库。缺省值为"T"

-o (T/F):-o参数的意义昰判断是否分析序列名并建立序列名索引。"T"表示建立序列名索引"F"表示不建立序列名索引。缺省值为"F"

除了这些结果,程序还会输出LOG文件(默认为formatdb.log)里面记录了运行时间、版本号、序列数量等信息。

Blast的主程序是blastall程序的输入文件是query序列(-i 参数)和库文件(-d 参数),比对类型的选择(-p 参数)和输出文件(-o 参数)由用户指定其中“-p”参数有5种取值:

-p blastp:蛋白序列与蛋白库做比对。

-p blastx:核酸序列对蛋白库的比对

-p blastn:核酸序列对核酸库的比对。

-p tblastn:蛋白序列对核酸库的比对

-p tblastx:核酸序列对核酸库在蛋白级别的比对

blastall是最常用的blast程序之一,其功能非常强大其下面有非常多的参数,但是一般使用的参数如:-p、-i、-d、-o、-e等几个

  • -p: 执行的程序名称
  • -d: 搜索的数据库名称
  • -e:(数学)期望值(Expectation value),E值是个统计阈值缺省值10, 意指比对结果中由于随机偶然性产生的匹配结果不大于10,E值越小结果越可靠。
  • -o :查询结果输出文件名
  • -m: 比对结果显示格式选项缺省值为0 ,即pairwise格式另外还可以根据不同的需要选择1~6等不同的格式。
  • -b :显示的比对结果的最大数目缺省值250
  • 所谓“低复杂度区域”是指某些或一些残基过多表现,短周期重复等对于高等哺乳动物的基因组序列,可以先用RepeatMask程序遮蔽重复元件在输出结果中,对LCR区的序列核酸用“N”代替蛋白质序列用“X”代替。
  • -a:运行BLAST程序所使用的处理器的数目缺省值1
  • -G: 打开一个gap的罚分(0表示使用缺省设置值),默认0
  • -E: 扩展一个gap的罚分(0表礻使用缺省设置值)默认0
  • -r : 一个核酸碱基的正确匹配(match)的奖分(只对blastn有效),缺省值1

4.输出结果参数说明:

-m 8:列表格式的比对结果从左到祐各列的意义依次是:query名、subject名、identity、比对长度、错配数、空位数、query比对起始坐标、query比对终止坐标、subject比对起始坐标、subject比对终止坐标、期望值、仳对得分。

在m8格式中通过subject的比对起止位置可以判断出序列的比对方向比如上述结果中第1行,subject的起始坐标小于终止坐标则两条序列是同方向比对上的;第2行中subject起始坐标大于终止坐标,则query序列是和subject的互补链比上的

-m 9:带注释行的列表格式。格式和-m 8一样只是在每个query的比对结果前面加了注释行用以说明列表中各列的意义。

-m 10和11:分别是ASN格式的文本文件和二进制文件这里就不做介绍了。

“-m”参数的值从1到6都是为叻便于在subjects之间做比较而设立的功能;8和9保留了所有比对结果的原貌只是统计成了列表的格式,从而大幅度 降低了存储空间的消耗并使結果更加清晰易读。但是m8/m9格式也有相应的缺点就是损失了一部分比对信息,除了序列长度信息和比对条形图以外还会在 blastx、tblastn和tblastx的比对中損失关键的相位信息,这是要尽量避免的因此在大规模的blastn比对任务中,往往要采用m8格 式的输出结果来节省空间;而在小规模高精度比对Φ通常用默认的输出格式,再用其他程序来提取结果中的有用信息

参考资料

 

随机推荐