數(shù)據(jù)挖掘涵蓋面很廣,系統(tǒng)的學習個人建議依照以下路線:
1. 找一本教材,個人推薦李航的《統(tǒng)計機器學習》
2. 可以去看網(wǎng)易上關(guān)于機器學習的公開課,是Standford的Prof. Ng的視頻課程,超級棒。
3. 結(jié)合教材和視頻,將機器學習算法的公式推一遍,然后用Matlab或者python跑一跑數(shù)據(jù),找點感覺。
4. 對于數(shù)學也要加強,特別在概率論方面。
上面說的是機器學習,其實已經(jīng)包括了數(shù)據(jù)挖掘的大部分,在上面了解的差不多之后 ,可以試著去做一些有意思的項目,比如去分析女神的微博情感,或者參加一些數(shù)據(jù)挖掘比賽,kaggle上有很多比賽可以去做。