2013-02-01から1ヶ月間の記事一覧

scikit.learn手法徹底比較! 決定木編

今回は決定木を用いて手書き文字データの分類を行う.決定木の詳細はあらゆる所で解説されているので適当に調べて欲しい. このPDFを参考にしたけど, いい資料かは微妙. 決定木は各節に質問が, 葉にクラスラベルが結び付けられている木(データ構造の木)であ…

scikit.learn手法徹底比較! K近傍法編

今回はK近傍法を用いて手書き文字データを分類する.K近傍法は, あるデータのクラスを分類する際に, そのデータから距離が近い順にK個訓練集合からデータを取り出し, それらのラベルの投票によって分類対象のラベルを決定するシンプルなアルゴリズムである.一…

scikit.learn手法徹底比較! ナイーブベイズ編

scikit.learnの分類手法を比較するこの企画. 今回はナイーブベイズを検証する.ナイーブベイズはi番目の入力ベクトルの各次元が, クラスラベルが与えられると互いに独立, すなわち となると仮定する分類手法である. ただし, はの次元数, はi番目の入力ベクト…

scikit.learn手法徹底比較! SVM編

問題設定や細かい実験手法は下のページを参照. scikit.learn手法徹底比較! イントロダクション今回は言わずと知れたSVM(サポートベクターマシン)を試す. 訓練データ数を増やしていったときに, 手書き文字の分類性能がどのように推移していくかを調べる.SVM…

On Comparing Classifiers: Pitfalls to Avoid and a Recommended Approach

分類器の比較に関する注意事項をまとめた論文「On Comparing Classifiers: Pitfalls to Avoid and a Recommended Approach(SALZBERG 1997)」を読んだ. この辺はちゃんと学んで起きたかったが, 面倒で(あんまり面白くないし)放置していた. 概要としては, 「…

scikit.learn手法徹底比較! イントロダクション

MNIST手書き文字データセットを利用してscikit.learnのsupervisedな分類アルゴリズムを比較する. パラメーターチューニングや計算時間の感覚が掴みたくて, 1回やってみたかった.MNIST手書き文字データセットとは, 機械学習初学者が何故か必ず与えられると言…