一、為什么有圖卷積神經網絡?
本質上說,世界上所有的數據都是拓撲結構,也就是網絡結構,如果能夠把這些網絡數據真正的收集、融合起來,這確實是實現了AI智能的第一步。所以,如何利用深度學習處理這些復雜的拓撲數據,如何開創新的處理圖數據以及知識圖譜的智能算法是AI的一個重要方向。
深度學習在多個領域的成功主要歸功于計算資源的快速發展(如 GPU)、大量訓練數據的收集,還有深度學習從歐幾里得數據(如圖像、文本和視頻)中提取潛在表征的有效性。但是,盡管深度學習已經在歐幾里得數據中取得了很大的成功,但從非歐幾里得域生成的數據已經取得更廣泛的應用,它們需要有效分析。如在電子商務領域,一個基于圖的學習系統能夠利用用戶和產品之間的交互以實現高度精準的推薦。在化學領域,分子被建模為圖,新藥研發需要測定其生物活性。在論文引用網絡中,論文之間通過引用關系互相連接,需要將它們分成不同的類別。自2012年以來,深度學習在計算機視覺以及自然語言處理兩個領域取得了巨大的成功。假設有一張圖,要做分類,傳統方法需要手動提取一些特征,比如紋理,顏色,或者一些更高級的特征。然后再把這些特征放到像隨機森林等分類器,給到一個輸出標簽,告訴它是哪個類別。而深度學習是輸入一張圖,經過神經網絡,直接輸出一個標簽。特征提取和分類一步到位,避免了手工提取特征或者人工規則,從原始數據中自動化地去提取特征,是一種端到端(end-to-end)的學習。相較于傳統的方法,深度學習能夠學習到更高效的特征與模式。
圖數據的復雜性對現有機器學習算法提出了重大挑戰,因為圖數據是不規則的。每張圖大小不同、節點無序,一張圖中的每個節點都有不同數目的鄰近節點,使得一些在圖像中容易計算的重要運算(如卷積)不能再直接應用于圖。此外,現有機器學習算法的核心假設是實例彼此獨立。然而,圖數據中的每個實例都與周圍的其它實例相關,含有一些復雜的連接信息,用于捕獲數據之間的依賴關系,包括引用、朋友關系和相互作用。
最近,越來越多的研究開始將深度學習方法應用到圖數據領域。受到深度學習領域進展的驅動,研究人員在設計圖神經網絡的架構時借鑒了卷積網絡、循環網絡和深度自編碼器的思想。為了應對圖數據的復雜性,重要運算的泛化和定義在過去幾年中迅速發展。
二、如何基于TensorFlow使用LSTM和CNN實現時序分類任務
時序數據經常出現在很多領域中,如金融、信號處理、語音識別和醫藥。傳統的時序問題通常首先需要人力進行特征工程,才能將預處理的數據輸入到機器學習算法中。并且這種特征工程通常需要一些特定領域內的專業知識,因此也就更進一步加大了預處理成本。例如信號處理(即EEG信號分類),特征工程可能就涉及到各種頻帶的功率譜(powerspectra)、Hjorth參數和其他一些特定的統計學特征。
三、深度學習 是生成模型還是判別模型
深度學習的模型有很多,既有生成模式也有判別模式, 目前開發者最常用的深度學習模型與架構包括 CNN卷積神經網絡、DBN深度信念網絡、RNN循環神經網絡、RNTN遞歸神經張量網絡、自動編碼器、GAN 生成對抗模型等。機器學習方法可以分為生成方法(generative approach)和判別方法(discriminative approach),所學到的模型分別稱為生成式模型(generative model)和判別式模型(discriminative model)。生成方法通過觀測數據學習樣本與標簽的聯合概率分布P(X, Y),訓練好的模型能夠生成符合樣本分布的新數據,它可以用于有監督學習和無監督學習。判別模型:將跟蹤問題看成一個二分類問題,然后找到目標和背景的決策邊界。它不管目標是怎么描述的,那只要知道目標和背景的差別在哪,然后你給一個圖像,它看它處于邊界的那一邊,就歸為哪一類。
四、什么是圖神經網絡?
圖說的是計算機拓撲里面的圖 就是那個有邊和節點,有向圖,無向圖的那個。
以這種數據結構為輸入并進行處理的神經網絡就是圖神經網絡了,結構會不太一樣,但是大同小異了。
五、如何用python 自己寫一個ocr
推薦使用現有的ocr庫,沒必要自己造輪子?,F有的有三個庫都可以用來識別,也都是基于Tesseract的一個封裝。
pyocr:Tesseract 和 Cuneiform 的一個封裝(wrapper)。
pytesseract:Google Tesseract OCR 的另一個封裝(wrapper)。
python-tesseract - Google Tesseract OCR 的一個包裝類。