1、软件为中文版本(非订阅版),具有中文界面和操作提示,方便技术人员准确、快捷地对生物信息数据进行比较筛查、分析研究、监测溯源,同时具备中英文双语言切换功能。可构建基于项目导向的多用户关系型数据库,数据库支持文本、数字、日期等格式的字段存储;数据库管理员可针对字段进行权限设置,限制其它用户对数据库字段进行编辑更改;内置高级搜索引擎,可实现样本字段信息及实验数据的快速检索查询等;支持多类型实验数据存储的多数据库系统,支持数据库层级划分,可更直观地展示多样本重复实验;支持Excel、csv、txt、XML等多种数据格式的数据导入及导出。
2、指纹数据模块:可用于处理电泳数据(包括凝胶电泳和毛细管电泳)、色谱数据、光谱数据等,实现用户对可变数目串联重复序列(VNTR)、多位点串联重复序列分析(MLVA)、基于CECE的异源双链分析(HAD)、金黄色葡萄球菌A蛋白分型(spa-typing)、AFLP标记辅助育种(AFLP-basedbreeding)等实验进行数据存储与分析。
3、特征数据模块:支持自定义各种类型(二进制或连续性)的特征数据,包括生化以及形态学特征数据、酶动力学测试数据、抗生素抗性分析以及基因芯片中的各个基因表达量数据等。根据实验情况用户可以从一到成千上万个特征数据的自定义且特征数据容量的大小不受限制。同时特征数据模块也被用来存储其它实验分析过程中的数据结果,例如在MLVA分析中存储可变数目串联重复序列的个数;MLST中的等位基因数目;抗生素抗性以及HIV抗药性分析中的抗性数据等。可用于处理特征字符数据,包括抗生素敏感性实验数据、生化指标、微阵列芯片数据、酶活测试和代谢活性数据等。
4、序列数据模块:支持EMBL、GenBank等数据库中的数据直接导入;支持FLATA、FASTA、高通量测序数据等多种类型的序列数据导入;可以直接导入核酸和氨基酸序列;支持Sanger测序数据处理和拼接;支持完整的IUPAC代码一致性命名;支持序列编辑功能;支持SNP检测和分析(结合树状分析和网络推理模块、基因组分析工具模块);强大的自动化批量组装用于高通量序列数据处理;支持BAM和SAM格式的序列分析数据导入;支持交互式探索的环状基因组草图展示;支持多测序数据分析平台的FASTQ格式的序列数据导入,例如GenomeAnalyzer、MiSeq或HiSeq(Illumina),SOLiD平台(AppliedBiosystems),IonTorrentPGM(LifeTechnologies),PacBioRS(PacificBiosciences)以及HeliScope测序平台(HelicosBioSciences);支持氨基酸序列及核酸序列的BLAST分析;支持OpenReadingFrame框架分析功能;支持基于NCBI数据库的在线BLAST分析;支持限制性内切酶位点分析、引物设计、序列比对、突变位点查找等功能。
5、分类鉴定模块:以利用监督式学习(朴素贝叶斯、支持向量机等)对数据进行分类、数据库筛选、决策网络构建和菌种分类鉴定等。
6、树状分析及网络推理模块:能对关系数据库中的多种实验数据进行聚类分析。BioNumerics通过把关系数据库中的各种记录之间,各种实验之间,用多种有效的聚类算法实现多种聚类分析,包括皮尔逊积差相关性分析、余弦相关性分析、Dice、Nei、Li、Jaccard、JeffreyX、Ochiai相关性分析;支持UPGMA、WPGMA、FurthestNeighbor、NearestNeighbor、Ward、Centroid、Median等多种聚类分析算法。
7、具有基因组分析工具模块:提供基因组和染色体比对分析、基因注释、wgSNP分析等功能。支持自定义二级分析框架(如cgMLST、rMLST等)地构建。配合表型分析插件,可以获取分离菌的血清型、病毒性和耐药性等数据。支持N个染色体序列的NxN相似性矩阵的比对分析;支持基因组序列注释;支持全基因组的SNP位点提取及数据分析。
8、数据挖掘模块:为用户提供高维分析交互视图,用户可以直接在视图上选择,添加或删除条目,将其它数据库字段信息显示为颜色或标签,差异特征关联等。其它还包括方差分析、多维尺度分析(Multi-DimensionalScaling,MDS)、主成分分析(PrincipalComponentsAnalysis,PCA)等。
转载请注明:http://www.0431gb208.com/sjsbszl/1273.html