摘要:目的聚类分析中适宜类别数的确定和结果的验证一直是难以解决的问题,而在生物信息学研究中这一矛盾尤为突出,本文试图将数据挖掘技术引入这一领域,以期能有所帮助.方法以甲型流感病毒的H3序列为例,按照数据挖掘的思想将其拆分为训练集和验证集,然后使用两阶段聚类法和自组织图进行聚类分析,利用验证集对聚类结果进行验证,并进行各类的特征描述.结果两阶段聚类法可自动搜索适宜的类别数,两种聚类方法结果相互验证,以及验证集的结果验证都证实了聚类结果的准确性.结论
数据挖掘方法体系中的智能聚类技术可以满足基因序列数据聚类问题的需求,其相关技术可较好的解决类别数判定、结果验证等问题,值得在该领域中推广.
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,欢迎来CDA社区交流学习。(仅供学术交流用。)