- 在线时间
- 2759 小时
- 最后登录
- 2017-9-15
- 注册时间
- 2011-4-3
- 听众数
- 538
- 收听数
- 4
- 能力
- 80 分
- 体力
- 1764 点
- 威望
- 27 点
- 阅读权限
- 150
- 积分
- 5990
- 相册
- 0
- 日志
- 0
- 记录
- 5
- 帖子
- 6675
- 主题
- 3503
- 精华
- 3
- 分享
- 6
- 好友
- 1721
TA的每日心情 | 开心 2017-2-7 15:12 |
|---|
签到天数: 691 天 [LV.9]以坛为家II
 群组: 2013年国赛赛前培训 群组: 2014年地区赛数学建模 群组: 数学中国第二期SAS培训 群组: 物联网工程师考试 群组: 2013年美赛优秀论文解 |
数据挖掘利用了来自如下一些领域的思想:(1) 来自统计学的抽样、估计和假设检验,(2) 人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据,并且当数据不能集中到一起处理时更是至关重要。- A% @6 t+ x3 X) c
) \. W) j$ q- N1 A+ ^1 o" q0 ]看得出来该方法与遗传算法的联系,完全可以考虑在两者之间建立一些联系! n9 v- l1 ?. }6 q( Z) L$ q. q
1)数据挖掘能做以下七种不同事情 (分析方法):
6 M% c+ c+ W: W: E. V4 K, E/ h A% b数据挖掘0 S) K* `4 ^9 q* r; k% D3 D2 m4 `
· 分类 (Classification) + y4 t) L4 R* H" Q, }
· 估计(Estimation) + [5 v' _: }# h& a. Y6 u
· 预测(Prediction)
6 J( T. c& Q, d7 |/ `7 c0 Q· 相关性分组或关联规则(Affinity grouping or association rules) - H4 s# x) J" y; n F5 c- T
· 聚类(Clustering) 8 k1 s8 z# ?) i- f" a7 e
· 描述和可视化(Description and Visualization)
2 P% Y* Z' w, t2 o, N, p· 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)7 ~7 V Y4 b ^9 W+ n x
2)数据挖掘分类
, ~: n) C0 T+ f; w u2 N以上七种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘
* x4 f# n7 I& n { M8 g· 直接数据挖掘 8 l5 ^. `) z1 U
目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述。 : \5 s# C4 B+ b/ l3 q$ z5 q- C
· 间接数据挖掘 ) D2 D" t# W$ k6 s+ w0 c0 C: v2 i
目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系 。
: V2 N. h' e( J$ U4 z" p% ~; l· 分类、估值、预言属于直接数据挖掘;后四种属于间接数据挖掘' i3 i/ w5 G3 t7 U% w0 ~
|
zan
|