数据挖掘的学习资源
数据挖掘(Data Mining)作为一个领域,比机器学习要大,偏应用。互联网公司也大量使用数据挖掘技术,作为即将毕业进入互联网公司从事机器学习算法开发的我,最近计划系统了解一下这方面的理论和技术。作为一个习惯,学习一个东西之前总要上网找找学习资源(网站,书籍,学术期刊会议),以保证学到的是最前沿最系统的知识,并以最高效率学习。
希望这些资源能够最终帮助自己了解这些酷炫的问题:搜索引擎是怎样工作的(为什么谷歌搜索的结果总是比百度好)?数据挖掘/机器学习在互联网公司的典型应用(例如社交网络上的大量信息腾讯和非死book是怎么使用的以产生商业价值)?各种问答机器人的原理(如小度机器人/度秘,京东智能机器人)?
wikipedia.org,历史,领域概述,资源链接:
Data mining :介绍了数据挖掘的概念、过程、学术会议、软件等,右侧有细分条目;
Category:Data mining :更多和数据挖掘有关的条目;
DMOZ关于DM :资源链接;
谷歌上不了推荐 镜像站 ,搜索和下载电子书籍推荐 Library Genesis ( 更多在线图书馆 )。
大学课程、在线教程:
Stanford课程: CS246 Mining Massive Data Sets , CS246H Mining Massive Data Sets: Hadoop Labs , CS341 Project in Mining Massive Data Sets ,配套书籍 Mining of Massive Datasets , DataMiningTalk ;
CMU课程: Data Mining: Spring 2013 , Statistics 36-350: Data Mining (fall 2009) ;
南京大学课程: Introduction to Data Mining ;
Coursera: Data Mining Specialization 。
专著、书籍:
Mining of Massive Datasets , Jure Leskovec, Anand Rajaraman, Jeff Ullman, 2015; PPT;中文译本:大数据-互联网大规模数据挖掘与分布式处理;
Data Mining: The Textbook , Charu C. Aggarwal, 2015; 资源链接;
Data Mining: Concepts and Techniques (3rd ed.), Jiawei Han, Micheline Kamber, Jian Pei, 2011; PPT;中文译本:数据挖掘:概念与技术;
Data Mining and Analysis: Fundamental Concepts and Algorithms , Mohammed J. Zaki, Wagner Meira Jr, 2014; 作者 网站;
Introduction to Data Mining , Pang-Ning Tan, Michael Steinbach, Vipin Kumar, 2006; PPT;中文译本:数据挖掘导论;
A Practical Guide to Data Mining for Business and Industry , Andrea Ahlemeyer-Stubbe, Shirley Coleman, 2014; PPT;
Data Mining: Practical Machine Learning Tools and Techniques (3rd ed.), Ian H. Witten, Eibe Frank, Mark A. Hall, 2011; PPT;中文译本:数据挖掘:实用机器学习工具与技术;
Programming Collective Intelligence: Building Smart Web 2.0 Applications , Toby Segaran, 2007; 中文译本:集体智慧编程。
学术论文:
更多会议期刊见: Google Scholar DM , Microsoft academic DM , KDnuggets DM Conferences 。
学习网站:
KDnuggets :各种资源,博文,课程、软件、Datasets等链接;
Data Sets: UCI Machine Learning Repository , Public datasets for machine learning ;
Competitions: Kaggle , DMC , Knowledge Pit , TunedIT , DrivenData ;
程序、库:
R语言 : RDataMining , inside-R ;
Hadoop : Tutorial , Hadoop at Yahoo 。