機器學習的入門書籍《機器學習實戰》使用的語言是python。下面介紹利用Python開始“機器學習”的準備工作。(環境:CentOS 7)
1, 兩個重要的包
NumPy 和 SciPy。主要是處理數值運算,矩陣操作等。
注:Sci是Science的縮寫。
官網介紹了安裝方法,可以手動安裝,也可以使用yum。(numpy 和 scipy 在默認的軟件源有提供)
需要說明的是,scipy是依賴numpy的,如果你手動安裝,要先安裝numpy。當然,如果使用yum,它會自動處理依賴關系。
注:可以使用 yum info *** 查看是否在軟件源提供該軟件。如
2, 2D繪圖: Matplotlib
這在yum里面也可以獲取,
?
1
sudo yum install python-matplotlib
如果以交互的方式使用matplotlib,最好使用ipython.(雖然在python shell下也能執行)
因為繪圖是個相對消耗大的操作,python會在所有操作結束后才改變圖。而ipython能做到實時改變。你也可以百度matplotlib和matlab的淵源。
3,為了更好的交互,使用 ipython
在centos 7默認的軟件源里面是沒有ipython。你可以到github上下載最新穩定版的源碼,手動安裝(解壓后 sudo python setup.py install )。當然,如果你已經安裝了pip,就可以直接安裝:
?
1
<span style=font-size:18px;>sudo pip install ipython</span>
下面,給出一個繪圖的例子。
終端輸入 ipython
輸入 %pylab<喎?/kf/ware/vc/ target=_blank class=keylink>vcD4KPHA+PGltZyBzcmM9/uploadfile/Collfiles/20141011/.png alt=\>
輸入,
?
1
2
3
In [2]: x = randn(10000)
In [3]: hist(x,100)
(注:是不是和matlab很像?)
輸出,
這是使用python進行“機器學習”最基礎的幾個軟件,隨著之后學習深入,我們再具體介紹。