接着上一篇数据挖掘(DW)是什么,再描述一下数据数据挖掘(DW)所涉及的学科领域和方法很多,以下四种是非常重要的发现任务。

数据总结其目的是对数据进行浓缩,给出它的紧凑描述。数据挖掘主要关心从数据泛化的角度来讨论数据总结。数据泛化是一种把数据库中的有关数据从低层次抽象到高层次上的过程。

分类其目的是学会一个分类函数或分类模型(也称作分类器),该模型能把数据库的数据项映射到给定类别中的某一个。

聚类是把一组个体按照相似性归类,即”物以类聚”。它的目的是使属于同一类别的个体之间的距离尽可能地小,而不同类别的个体间的距离尽可能地大。

关联规则是形式如下的一种规则,”在购买面包和黄油的顾客中,有90%的人同时也买了牛奶”(面包+黄油+牛奶)。关联规则发现的思路还可以用于序列模式发现。用户在购买物品时,除了具有上述关联规律,还有时间或序列上的规律。

本文地址:数据挖掘能做什么?

Tag :, ,

暂无留言我要留言 »

必填

必填,绝不公开