《现代电子技术》2006年第24期摘录:神经网络的特征映射聚类算法研究
-
如发现有乱码,请点击下面链接浏览原文
正文摘录:
2006年第24期总第239神经网络的特征映射聚类算法研究林金山,林敏(福建莆田学院福建莆田351100)摘要:自组织特征映射作为一种神经网络方法,在数据挖掘、机器学习和模式分类中得到了广泛应用。他将高维输入空间的数据映射到一个低维、规则的栅格上,从而可以利用可视化技术探测数据的固有特性。说明自组织特征映射神经网络的工作原理和具体实现算法,并在对已有神经网络聚类分析方法概括和总结的基础上,结合一些实验数据、仿真数据对自组织特征映射算法进行研究,得出了一些有意义的结论。关键词:数据挖掘;神经网络聚类;自组织特征映射;可视化技术中图分类号:TPl83文献标识码:A文章编号:1004ResearchinClusteringofSOFMNeuralNetworkLINJinshan,LINMin(PutianUniversity,Putian,351100,China)Abstract..Asamethodofneuralnetwork,theSelf—OrganizingFeatureMap(SOFM)isanexcellenttoolfordatamining,machinelearningandpatternclassification.Itprojectsinputspaceonprototypesofalow—dimensionalregulargridthatcanbeeffectivelyutilizedtovisualizeandexplorepropertiesofdata.Inthispaper,thetheoryandalgorithmofSOFMareconsidered.Andonthebasisofanalysisandsummaryofcurrentneuralnetworkclustering,researchesinalgorithms0fseIf一0rganizedmappingwithsomeexperimentaldataofsimulation,at1astgetsseveralmeaningfulconclusions.Keywords:datamining;neuralnetworkclustering;self—organizedfeaturemap;visualizedtechnology随着科学技术的高速发展,以及各种资源数量的不断噌多,为了提高效率,信息处理已经成为当前最重要的研究内容,其中涉及到信息抽取、自然语言理解、自动聚类和分类、自动摘要、自动标注和主题识别、信息结构分析以及史本生成。其中关于自动聚类方面的研究较为深入,而且聚类技术已成为信息处理的核心技术”]。从20世纪40年l弋至今,国内外的研究者提出了很多聚类算法,如基于层欠的、基于平面分割、基于密度、基于规则和模型基于网格阳子空间的算法等,在这些众多的算法中,大多数算法都需要事先人为地给出一些参数,而且时空效率也有待于进一步提高。然而,在没有先验知识的情况下,人为地确定塞些参数是十分困难的。为了解决这个难题,需要研发新内聚类算法,在保证不降低时空效率和信息处理性能的前是下,力图减少或避免需要事先人为确定的参数。神经网络聚类是模型聚类的一种,神经网络聚类方法壬将每个聚类描述成一个例证”’。每个例证作为聚类的一个“典型”;他不必与一个示例或对象相对应。可以根据行对象与哪个例证最相似(基于某种距离计算方法)而将收稿日期:2006一08—30他分派到相应的聚类中。可以通过聚类的例证来预测分派到该聚类的一个对象的属性。比较著名的神经网络聚类算法有:竞争学习和自组织特征映射。自组织特征映射(Self—OrganizingFeatureMap)神经网络作为聚类技术的一种,首先由芬兰人Kohonen于1981年开始研究,因此也称为Kohone自组织特征映射0’。因其变换的保拓特性,有时又称为拓扑有序映射(topologicallyorderedmap)。本文在对已有神经网络聚类分析方法概括和总结的基础上,结合一些实验数据仿真数据对自组织特征映射算法进行研究,得到了一些有意义的结论。2神经网络聚类神经网络聚类的自组织特征映射方法(SOFM),涉及到神经单元的竞争。2.1基于自组织特征映射方法的神经网络(SOFM)基于自组织特征映射方法的神经网络聚类(SOFM),聚类过程也是通过若干单元对当前对象的竞争来完成0。’。与当前对象权值向量最接近的单元成为赢家或激活单元。为变得与输入对象更接近,获胜单元以及最近的邻居调整他们的权值。SOMs方法假设在输入对象中有一些布局和次序,SOMs方法将最终利用这些空间中的结41
阅读此文(图):
点击此处在线翻阅