欢迎大家访问我的博客!

数据挖掘学习路线图

数据挖掘 peike 3623℃ 0评论

人一能之,已百之。人十能之,已千之,果能此道矣,虽愚必明,虽柔必强。

——《礼记·中庸》

1.What 什么是数据挖掘?

不同专家与学者对数据挖掘给出了不同的定义。

韩家炜教授指出“数据挖掘,就是从大型数据库中抽取有意义的,非平凡的,隐含的,以前未知的并且是有潜在价值的,信息或模式的过程。”J.Han and M.Kamber在《数据挖掘:概念与技术》中将数据挖掘概括为”简单地说,数据挖掘是从大量数据中提取或’挖掘‘知识。该术语实际上有点用词不当。数据挖掘应当更正确地命名为‘从数据中挖掘知识‘,不幸的是它有点长。许多人把数据挖掘视为另一个常用的术语’数据库中知识发现‘或 KDD(Knowledge Discovery in Database)的同义词。而另一些人只是把数据挖掘视为数据库中知识发现过程的一个基本步骤。”Mehmed Kantardzi指出“运用基于计算机的方法,包括新技术,从而在数据中获得有用知识的整个过程,就叫做数据挖掘。”

我们概括发现数据挖掘具有以下几个特点:

  • 大数据。我们知道小数据样本常常是无法客观的反应出真实世界的普遍特性的,因此大部分数据挖掘算法都是建立在对海量数据的挖掘与分析的基础之上。
  • 价值性。在进行数据挖掘挖掘之前要清楚的认识到一点,数据挖掘是工具,是途经,而不是最终目的。最终目的是通过数据挖掘发现数据背后隐藏的价值,为企业或者个人带来直接、间接的效益。
  • 隐含性。数据挖掘是为了反应出隐藏在海量数据背后的价值,发现深藏在数据内部的知识。

近些年来随着大数据领域越来越火,相应带动了数据挖掘概念的发展,严格地说,数据挖掘并不是一个全新的领域,组成数据挖掘的三大支柱包括统计学、机器学习和数据库等领域内的知识,其它还包含了可视化、信息科学等内容。

2. Why 为什么进行数据挖掘?

为什么要进行数据挖掘?很明显,数据挖掘的目的就是从海量的数据背后提取到有意义、有价值的信息,进而产生实际效益。要深刻的意识到一点,不要为了数据挖掘而去进行数据挖掘,我们最终的目的到底是什么?当然很多时候由于数据挖掘师经验的不足、数据质量不佳、目标不明确、优化流程阻力等内部外部因素都会对数据挖掘的实际效果造成影响。

3. How 怎样学习数据挖掘?

下图是数据挖掘工程师的典型技能树以及学习路线图。
数据挖掘学习路线图

文章发布时间: 2016-08-24 22:18

最后修改于: 2017-10-20 19:17

原始链接: http://www.peikeli.com/data-mining/road_map/

转载请注明: 万物比特 » 数据挖掘学习路线图

版权协议: 本作品采用©知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可

喜欢 (4)or分享 (0)
发表我的评论
取消评论

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址