glimmer基因预测软件下载|glimmer基因预测软件下载

这是glimmer基因预测软件，基因预测软件，命令行下运行 glimmer2.exe就可以了。

软件介绍

Glimmer是用于原核生物基因组预测的工具，只要输入原核生物基因组即可得到其基因信息。不过该软件最终结果只是基因的位置信息，需要额外程序将基因从基因组上提取出来，并翻译成对应的氨基酸序列。

使用案例

下面我们拿结核分枝杆菌H37RV的基因组来做下练习，Glimmer做基因预测一般需要2个步奏。
首先是建立预测的模型，第二步是利用模型来对基因组进行基因预测。模型也叫训练集，也就是先让软件了解基因的一些特征，这样软件就能根据已知的信息，来推测未知的信息。
建立模型采用build-icm程序来完成。build-icm的输入有三种。
1、某基因组的已知信息；
2、通过long-orfs产生的长的无重叠的orfs；
3、高度相似的物种的基因。
这里面我们选用自身作为训练集来作为模型。
那么就使用long-orfs产生训练集，那么作为long-orf的训练集，我们首先要将输入文件格式化到一条。
听到这里大家可能有些乱了。下面我们具体来演示一遍大家就明白了。
首先我们将多条fasta文件合并成一条，用于long-orfs程序。
这里面采用sed 命令。
sed -e '/>/d' K12.fna |tr -d '\n' |awk 'BEGIN {print ">wholefile"}{print $0}' >wholefile
这样就可以用作long-orfs的输入了。
运行long-orfs产生无重叠的orfs
long-orfs -n -t 1.15 $wholefile $tagname.longorfs 1>/dev/null 2>/dev/null
然后运行extract来提取训练集
extract -t $wholefile $tagname.longorfs > $tagname.train 2>/dev/null
这样训练集就处理好了。
产生训练集有收那种方法，这里面我们用的是第二种方法，通过long-orfs产生。
如果有某基因组的已知基因，或者高度相似的物种基因不用以上三个步骤
接下来我们运行bulid-icm通过训练集，来生产预测的模型，用于基因预测
build-icm -r $tagname.icm < $tagname.train 1>/dev/null 2>/dev/null
最后我们就可以直接运行glimmer3来完成基因预测。
glimmer3 -o50 -g110 -t30 [options]

结果说明

生成*.detail *.predict
那么*.predict就是我们最终得到的预测基因文件，它其实只是一个列表，我们打开看一下。也是以“>"进行分割，
基因的各列信息分别为：
Column 1 预测基因编号，此编号和*.detail文件里编号一致。
Column 2 基因的开始位置。
Column 3 基因的结束位置。为终止密码子的最后一个碱基位置，也就是说包含终止密码子。
Column 4 阅读框。
Column 5 基因的“raw”分值。

软件截图

glimmer基因预测软件

标签：

人气软件

下载地址Android版iPhone版Mac版iPad版

glimmer基因预测软件
883玩网口号：伸出你的我的手 — 分享！

更多

相关文章

网友评论

更多>>猜你喜欢

glimmer基因预测软件

相关软件

软件介绍

使用案例

结果说明

软件截图

glimmer基因预测软件

下载周排行

下载总排行

装机必备软件