GPAT生物序列模式搜索程序
版本
软件介绍人气软件精品推荐相关文章网友评论下载地址
这是GPAT生物序列模式搜索程序,开发的基于IBM Splash算法的生物序列模式搜索程序。运行环境为LINUX,多线程运行,使用多CPU,运行速度快,特别适合序列中重复模式的定位。
生物序列中存在的模式一直是生物学家感兴趣的问题,许多序列上的模式和功能之间存在密切的相关性,例如基因序列可直接影响其编码蛋白的结构,而基因上游序列则可直接影响基因表达调控。为了减少实验代价并尽量获取分子功能信息,许多工作集中在研究序列的规律进而把已知的功能。
目的获取IBMSPLASH算法核心代码,为进一步开展生物序列模式识别研究提供一个高效算法引擎。方法基于SPLASH算法开发核心代码,运用开源软件工具,开发、调试和优化程序。结果开发出GNUPattern(Gpat)程序,高效实现了SPLASH算法的核心部分,并提供全部源码,其他研究人员可以在GNU许可协议下修改该程序。结论Gpat成功地实现了SPLASH算法,并为下游生物序列模式识别研究提供铺垫。
生物序列数据挖掘的主要目的是识别序列中的功能元素、研究序列间的相互关系等等。生物序列模式挖掘和生物序列聚类是生物序列数据挖掘中重要的两个研究内容。生物序列模式挖掘是识别功能元素进而了解序列功能等的关键技术, 序列模式还能够描述序列特征,作为生物序列聚类相似性度量设计的依据;生物序列模式挖掘也是生物序列关联分析的基础。生物序列聚类是研究序列间相互关系进而解释进化关系等的主要手段,其结果是具有共同特征的序列簇;另外在这样的簇中挖掘序列模式能进一步提高序列模式挖掘结果的准确率,从而更好的指导功能元素的识别;生物序列聚类也可作为分类、异常挖掘等的预处理步骤。
标签:
人气软件
下载地址Android版iPhone版Mac版iPad版
相关文章
网友评论
更多>>猜你喜欢