当前位置:大学毕业论文> 本科论文>材料浏览

关于聚类分析算法论文范文写作 改进的聚类分析算法在科研立项管理中的应用相关论文写作资料

主题:聚类分析算法论文写作 时间:2024-03-27

改进的聚类分析算法在科研立项管理中的应用,这篇聚类分析算法论文范文为免费优秀学术论文范文,可用于相关写作参考。

聚类分析算法论文参考文献:

聚类分析算法论文参考文献 聚类分析论文医药类期刊国家级教育类期刊交通类期刊

摘 要:针对目前的科研项目管理信息系统仅对科研项目进行低水平管理,无法区分、甄别科研内容等问题,对k-means聚类分析技术进行改进,并进一步将该项技术应用于科研立项管理中,通过对科研立项申报书进行聚类分析,得出立项申请中相似的项目和创新的项目,为科研立项提供智能型的决策支持,避免了重复立项和重复研究,使得计算机应用技术更好地服务于科研项目管理.

关键词:聚类分析;k-means聚类算法;科研项目管理

中图分类号:TP391 文献标识码:A

文章编号:2096-1472(2016)-06-13-04

Abstract:For current low-level management of scientific research project information and incapability to distinguish or identify the contents of research projects,the paper improves the k-means clustering analysis technique,and further applies this technique into research project initialization management.Through clustering analysis of research project initialization declaration documents,decision-makers can find out the repetitive studies and the innovative projects.It intelligently supports the decision-making in project initialization by oiding repetitive projects and studies,and makes it possible for computer application technology to better serve scientific research project management.

Keywords:clustering analysis;k-means clustering algorithm;scientific research project management

1 引言(Introduction)

随着计算机应用技术的飞速发展,计算机信息系统已经渗透到人们生活、工作的各个方面,但是在科研管理中计算机信息系统的应用程度还仅仅停留在对科研项目进行查询、删除、维护等基本操作上.而实际应用中,随着科研项目数目的日益庞大,研究内容的日益繁复,如何对科研项目的内容进行深度分析,以避免在科研中普遍存在的重复立项和低水平重复研究等问题,是对计算机信息系统提出的更高要求.

聚类分析技术是数据挖掘中最常用的工具,可以对大量数据进行聚类,考察数据间的相似度或相异度.若将聚类分析技术应用于科研项目管理的计算机信息系统中,在科研立项环节对立项申请书进行聚类分析,找到众多申请项目中的相似性项目和创新性项目,避免重复立项和重复研究,为科研项目管理系统提供科学的、合理的立项决策支持,使得科研项目管理信息系统更加智能、功能更加强大,是一个亟待研究的课题.

2 聚类分析技术(Clustering)

2.1 聚类分析概述

聚类分析技术是数据挖掘领域最为常见的技术之一,用于发现数据库中未知的对象类,其核心是聚类[1].所谓聚类即“物以类聚”,首先考察对象之间的相似度或相异度,然后将相似的对象划分在同一个组内,相异的对象划分在不同的组内,保证同一组内的数据对象尽可能的相似,不同组内的数据对象尽可能的相异,最终形成若干个类(或者簇)[2,3].

聚类分析的定义如下:给定数据集合V{vi|i等于1,2,等,n},vi为数据对象,根据数据对象vi间的相似度或者相异度,将数据集合V{vi|i等于1,2,等,n}分成k组Cj(j等于1,2,等,k),并满足:

该过程称为聚类分析,Cj(j等于1,2,等,k)称为簇(类)[4,5].

2.2 k-means聚类分析算法

聚类分析的方法有层次聚类方法、划分聚类方法、基于密度的聚类方法、基于网格的聚类方法等.其中划分聚类中k-means算法具有算法思想简单、收敛速度快、可伸缩性好等优点,应用非常广泛.

k-means聚类算法的基本思想是:以数据对象之间的欧式距离作为相似度或者相异度来考察数据对象,距离越近的数据对象其相似性就越大,距离越远的数据对象其相异度越大,相应的簇是由离得近的数据对象组成.

算法的基本步骤包括:

(1)人为设定簇的个数k值.

(2)随机选取k个对象作为这k个类的初始聚类中心.

(3)计算其他对象到k个初始聚类中心的距离,然后按照就近原则分配对象.

(4)根据公式1重新计算每个类的质心,若给定簇Ki等于{ti1,ti2,等,tim},则簇的质心定义为:

其中,m代表簇Ki中数据对象的个数,代表第j个对象到簇Ki的聚类中心的距离[6].

(5)重复步骤(3)和步骤(4),直至簇的质心不再变化或达到终止条件为止.

k-means算法思想简单,可伸缩性好,收敛速度快,适用于处理庞大的样本数据.但从k-means聚类算法存在着比较显著的缺点,其一,算法的第一步需人为设定簇的数目k,很显然k值很难在聚类前估计,对聚类结果影响也比较大;其二,算法随机选取k个初始聚类中心,一旦初始聚类中类中心选择不当,很难得到令人满意的聚类结果.

结论:关于聚类分析算法方面的论文题目、论文提纲、聚类分析算法论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

聚类分析算法
公允价值计量属性的应用——以我国金融行业为例赵婷(重庆理工大学会计学院,重庆 400054)摘要:公允价值对金融行业的影响不容忽视。以我。

谱聚类算法其在SAR图像分割中应用
摘 要:谱聚类算法作为一种高效的智能聚类算法被广泛地研究与应用,它与传统的聚类算法相比,具有明显的优势。文章首先对谱聚类理论进行了概述,介绍了图。

一种改进模糊聚类算法
摘 要:针对模糊C-均值聚类算法不能很好对非椭球形分布,或结构形状不对称分布的数据进行聚类的问题,文章提出了一种基于点密度的模糊C-均值聚类算法。

聚类稳定性分析方法增强单类学习算法
作者简介:熊玉玲,2003年毕业于湘潭大学信息与计算科学专业;2013~2016,人民大学统计学院;现任职于百度地图大数据团队,专注于交通大数据。

论文大全