読者です 読者をやめる 読者になる 読者になる

データサイエンスしてみる

新米エンジニアがデータサイエンスを勉強する。機械学習とかRとかPythonとか

Anacondaを入れてSpyderを使う

Python 機械学習

Pythonをインストールするにいろいろと調べていたのですが、今はAnacondaを使うのが一般的なようです。
Anacondaならデータ分析や機械学習に用いるさまざまなライブラリが一緒に導入できます。
pipで個別に入れるよりも安定して導入できるので、プレーンな状態から始めるのであればAnacondaを使用すべきでしょう。
今回、私がインストールしたのは"Windows 64bit python3.5"のAnacondaです。
pythonは2系と3系がありますが、ライブラリはほぼ3系に対応しているようなので3系にしました。

で、Anacondaを導入したので適当に何かテストしながらSpyderに慣れてみようと思います。

まずは簡単なデータのプロットから。

from pylab import *
ion()
x = [1, 2, 3]
y = [4,20,100]
plot(x,y)

ion()はinteractive mode onの略でこれをonにしておくとplot()したあとshow()を呼ぶ手間が省けます。
その分メモリ食うでしょうが、そのときはそのとき考えればいい気がします。

さて、早速結果を見てみましょう。
これで↓みたいになります。

f:id:Grahamian:20160817185538p:plain


せっかくなのでもう一本足してみましょう。
ついでに色を変えたり凡例つけたりx,y軸を調節してみます。

from pylab import *
ion()
x = [1, 2, 3]
y = [4,20,100]

plot(x,y,'ro-')
y2 = [0,70,80]
xlim([0,4])
ylim([0,110])

plot(x,y2,'bv-')
legend(["a","b"],loc="best")

関数名からわかるようにxlim, ylimは軸の下限上限を決めています。
axis[0,4,0,110]でも同じ意味らしいです。
legendは凡例です。

結果はこんな感じ。

f:id:Grahamian:20160817190328p:plain

しばらくはこんな感じでSpyderとpythonに慣れるために、簡単なことからやっていきたいと思います。
まあ半分写経ですけどね。