數(shù)據(jù)挖掘技術(shù)主要有決策樹 、神經(jīng)網(wǎng)絡(luò) 、回歸 、關(guān)聯(lián)規(guī)則 、聚類 、貝葉斯分類6中。
1、決策樹技術(shù)。
決策樹是一種非常成熟的、普遍采用的數(shù)據(jù)挖掘技術(shù)。在決策樹里,所分析的數(shù)據(jù)樣本先是集成為一個樹根,然后經(jīng)過層層分枝,最終形成若干個結(jié)點,每個結(jié)點代表一個結(jié)論。
2、神經(jīng)網(wǎng)絡(luò)技術(shù)。
神經(jīng)網(wǎng)絡(luò)是通過數(shù)學(xué)算法來模仿人腦思維的,它是數(shù)據(jù)挖掘中機器學(xué)習(xí)的典型代表。神經(jīng)網(wǎng)絡(luò)是人腦的抽象計算模型,數(shù)據(jù)挖掘中的“神經(jīng)網(wǎng)絡(luò)”是由大量并行分布的微處理單元組成的,它有通過調(diào)整連接強度從經(jīng)驗知識中進行學(xué)習(xí)的能力,并可以將這些知識進行應(yīng)用。
3、回歸分析技術(shù)。
回歸分析包括線性回歸,這里主要是指多元線性回歸和邏輯斯蒂回歸。其中,在數(shù)據(jù)化運營中更多使用的是邏輯斯蒂回歸,它又包括響應(yīng)預(yù)測、分類劃分等內(nèi)容。
4、關(guān)聯(lián)規(guī)則技術(shù)。
關(guān)聯(lián)規(guī)則是在數(shù)據(jù)庫和數(shù)據(jù)挖掘領(lǐng)域中被發(fā)明并被廣泛研究的一種重要模型,關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘的主要目的是找出數(shù)據(jù)集中的頻繁模式,即多次重復(fù)出現(xiàn)的模式和并發(fā)關(guān)系,即同時出現(xiàn)的關(guān)系,頻繁和并發(fā)關(guān)系也稱作關(guān)聯(lián)。
5、聚類分析技術(shù)。
聚類分析有一個通俗的解釋和比喻,那就是“物以類聚,人以群分”。針對幾個特定的業(yè)務(wù)指標(biāo),可以將觀察對象的群體按照相似性和相異性進行不同群組的劃分。經(jīng)過劃分后,每個群組內(nèi)部各對象間的相似度會很高,而在不同群組之間的對象彼此間將具有很高的相異度。
6、貝葉斯分類技術(shù)。
貝葉斯分類方法是非常成熟的統(tǒng)計學(xué)分類方法,它主要用來預(yù)測類成員間關(guān)系的可能性。比如通過一個給定觀察值的相關(guān)屬性來判斷其屬于一個特定類別的概率。貝葉斯分類方法是基于貝葉斯定理的,樸素貝葉斯分類方法作為一種簡單貝葉斯分類算法甚至可以跟決策樹和神經(jīng)網(wǎng)絡(luò)算法相媲美。
參考資料來源:百度百科-數(shù)據(jù)挖掘