883玩网:您身边最放心的安全下载站! 软件发布

您当前所在位置:首页 > 软件下载 > 应用软件 > 教育教学 → glimmer基因预测软件

glimmer基因预测软件

glimmer基因预测软件

版本

  • 软件大小:6 MB
  • 软件语言:简体中文
  • 软件类型:国产软件
  • 软件授权:免费软件
  • 更新时间:2017-02-22
  • 软件类别:教育教学
  • 应用平台:WinXP,Win7,Win8,windows10,其他
网友评分:

相关软件

6 MB

软件介绍人气软件精品推荐相关文章网友评论下载地址

这是glimmer基因预测软件,基因预测软件,命令行下运行 glimmer2.exe就可以了。

软件介绍

Glimmer是用于原核生物基因组预测的工具,只要输入原核生物基因组即可得到其基因信息。不过该软件最终结果只是基因的位置信息,需要额外程序将基因从基因组上提取出来,并翻译成对应的氨基酸序列。

使用案例

下面我们拿结核分枝杆菌H37RV的基因组来做下练习,Glimmer做基因预测一般需要2个步奏。
首先是建立预测的模型,第二步是利用模型来对基因组进行基因预测。模型也叫训练集,也就是先让软件了解基因的一些特征,这样软件就能根据已知的信息,来推测未知的信息。
建立模型采用build-icm程序来完成。build-icm的输入有三种。
1、某基因组的已知信息;
2、通过long-orfs产生的长的无重叠的orfs;
3、高度相似的物种的基因。
这里面我们选用自身作为训练集来作为模型。
那么就使用long-orfs产生训练集,那么作为long-orf的训练集,我们首先要将输入文件格式化到一条。
听到这里大家可能有些乱了。下面我们具体来演示一遍大家就明白了。
首先我们将多条fasta文件合并成一条,用于long-orfs程序。
这里面采用sed 命令。
sed -e '/>/d' K12.fna |tr -d '\n' |awk 'BEGIN {print ">wholefile"}{print $0}' >wholefile
这样就可以用作long-orfs的输入了。
运行long-orfs产生无重叠的orfs
long-orfs -n -t 1.15 $wholefile $tagname.longorfs  1>/dev/null 2>/dev/null
然后运行extract来提取训练集
extract -t $wholefile $tagname.longorfs > $tagname.train  2>/dev/null
这样训练集就处理好了。
产生训练集有收那种方法,这里面我们用的是第二种方法,通过long-orfs产生。
如果有某基因组的已知基因,或者高度相似的物种基因不用以上三个步骤
接下来我们运行bulid-icm通过训练集,来生产预测的模型,用于基因预测
build-icm  -r $tagname.icm < $tagname.train 1>/dev/null 2>/dev/null
最后我们就可以直接运行glimmer3来完成基因预测。
glimmer3 -o50 -g110 -t30  [options]

结果说明

生成*.detail  *.predict
那么*.predict就是我们最终得到的预测基因文件,它其实只是一个列表,我们打开看一下。也是以“>"进行分割,
基因的各列信息分别为:
Column 1 预测基因编号,此编号和*.detail文件里编号一致。
Column 2 基因的开始位置。
Column 3 基因的结束位置。为终止密码子的最后一个碱基位置,也就是说包含终止密码子。
Column 4 阅读框。
Column 5 基因的“raw”分值。

软件截图

glimmer基因预测软件

标签:

人气软件

下载地址Android版iPhone版Mac版iPad版

  • glimmer基因预测软件

  • 883玩网口号:伸出你的我的手 — 分享
    更多

相关文章

网友评论

更多>>猜你喜欢