数据挖掘论文(聚类分析及其应用)

时间:2023-03-26 08:08:11 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
聚类

内容摘要:



姓名:周建刚 学号:2009018397 班级:信息091

本文主要阐述了聚类方法及在金融投资、股市、证券投资等方面的一些应用。运用聚类分析模型帮助投资者正确的理解和把握金融投资、股票、证券投资的总体特征,确定投资范围,并通过类的总体价格水来预测金融投资、股票价格、证券投资的变动趋势,选择有利的投资时机。

关键字:

聚类分析 金融投资 聚类方法 股市投资 证券投资 应用

正文:

聚类分析将物理或抽象对象的集合分成为由类似的对象组成的多个类的过程称为聚类。聚类分析WEB个性化应用的一种重要技术手段。作为一种无示例学习,它不需要预先定义类的特点或属性,而是从用户的访问行为中发现潜在性的知识(类或群),从而能更好的体现智能性。

3

聚类分析是对数据对象进行分类,把一组数据对象分到不同簇中。簇是一组数

据对象的集合,簇内各对象间具有较高的相似度,而不同组的对象差别较大。它具有这样的性质:在同一个簇中的数据对象彼此相似;不同簇的数据对象差别很大。

聚类分析在金融投资类方面有很大的研究价值。聚类分析和方差分析相结合进行投资分析,对股票的收益性,成长性等方面进行分析,建立较为合理的指标体系,衡量样本股票的“相似程度”再通过聚类分析为投资者确定投资范围和投资价值。结果表明该方法能帮助投资者准确了解和把握股票的总体特性,预测股票的成长能力,使投资者做出最佳的投资决策。实验研究表明此方法在金融投资分析中具有有效性和实用性。

不仅是在金融投资,在股市等方面也具有很在的研究价值。股票涨价的无常,股市的变幻莫测,投资者要想在股市投资中赢取丰厚的回报,成为一个成功的投资者,就得认真研究上市公司的历史业绩和发展前景,详细分析上市公司的财务情况,对上市公司的股票价值进行合理运算。聚类分析是一种行之有效的指导证券投资的方法。运用聚类分析模型能帮助投资者正确的理解和把握股票的总体特征,确定投资范围,并通过类的总体价格水来预测股票价格的变动趋势,选择有利的投资时机。

下面我用一个实例应用来具体观察聚类分析在前面所说的这些方面的应用。我们先假设用户A{a1a2,„„,am}向用户B{b1b2,„„,bn}推荐资源。按次序取得用户B


最后一个关键词类bn(即用户目前感兴趣的资源类),在权威用户的资源类中找到和bn资源aibnai

k

sim( bn , ai) =

bn aj||bn|| ||aj ||

b

=

i1k

ni

k

找到maxsim(bnai)

ni

a

i1

ji



b

i1

权威用户中越是相似类的近邻后继知识推荐的可能性越大, 因此推荐列表中增加一个后继知识度分量。若资源j 属于关键词集合k,

wt

|ki|mi

;pa,jwt*pa,j

推荐值排名在前N 位的, 成为用户的最终推荐列表,推荐给用户。

聚类方法目前各类文献中提出了众多聚类算法可供选择,主要的有划分方法、层次方法、基于密度的方法、基于网格的方法及基于模型的方法等。划分方法是给定要构建的划分的数K,首先创建一个初始划分,然后采用一种迭代的重定位技术,尝试通过对象在划分间移动来改进划分。一个好的划分的准则是:在同一类中的对象之间尽可能接近或相关,而不同类中的对象之间尽可能远离或不同。为了达到全局最优,基于划分的聚类穷举了所有可能的划分;层次方法层次的方法是对给定的数据对象集合进行层次的分解。层次方法有两种分解形式:凝聚和分裂。凝聚方法也称为自底向上的方法,初始将每个对象作为单独的一个组,然后相继地合并相近对象或组,直到所有的组合并为一个层次的最顶层),或者达到一个中止条件。分裂方法也称为自顶向下法,初始将所有的对象置于一个组中,在迭代的过程中,一个组被分裂为更小的组,直到最终每个对象在单独的一个组中,或者达到一个中止条件。

我们再举个例子。设有n 个样品,p 个指标,每个样品都有这p 个指标的观察值,设第 I 个样品的第j个指标的观察值为xij,把n个样品看成P维空间中的n个点,则两个样品间亲疏程度可用P维空间中两点的距离来度量。dij表示样品xixj的距离。定义距离公式,文采用明氏距离。

p

明氏(Minkowski)距离:dij(q)=

q=1时,明氏距离变为绝对距离:

[|xikxjk|]

k1

q1/q



dij(1)=|x

k1

p

ik

x

jk

|



q=2时,明氏距离变为欧式距离:


本文来源:https://www.wddqw.com/doc/d7bed319fc4ffe473368abd9.html