哪位大佬有機器學習李宏毅課程學習視頻百度云資源
鏈嘩察接橡殲:
提梁蘆沖取碼: 8e38
【點滴】學習t-SNE
學習t-SNE總結自李宏毅老師的教學視頻,主要用于處理具有多屬性、維度高的數據,以便進行數據可視化。t-SNE,即T-distributed Stochastic Neighbor Embedding,是一種非線性降維無監督機器學習方法,能將高維空間的點映射到低維空間,同時保持映射后的點之間的關系與原始數據一致。
在t-SNE中,原始樣本的相似度用指數損失函數表示,映射后的樣本相似度則使用t函數家族的一種形式。選擇t函數作為映射后相似度度量指標的原因在于,它能有效放大距離較大的樣本之間的差異,使得在低維空間中能更明顯地展示數據的分布。
通過最小化映射前后的分布差異,即通過優化問題求解KL散度,以保留原始數據結構特征并實現降維。這一優化問題可通過梯度下降方法求解。實際應用中,往往先使用PCA降維,再進行可視化。
個人理解,t-SNE似乎專注于數據可視化而非揭示降維后的數據維度含義。盡管其目標是使降維前后數據分布或距離盡可能接近,但降維后每個維度的解釋變得困難。因此,簇與簇之間的距離在可視化后是否依然保持物理意義?可視化后的簇間距離如何解釋簇分隔的屬性差異?這些都是值得探討的問題。