動かざることバグの如し

3分経てば忘れそうなことをメモします

機械学習による分類の手法

そもそも機械学習ってなんぞ

元々:明示的にプログラムしなくても学習する能力をコンピュータに与える研究分野(アーサー・サミュエル) 現在:プログラムにデータを渡して学習・経験させたあとに未知の例を判断させる

判断をもっと崩すと分けるという動作になる

いくつかあるニュース記事を「政治」「芸能」「経済」「スポーツ」のカテゴリに分けようとする。それらの記事に出てくる頻出語100語を抽出し、同じ単語が出てくる記事は近くに、出てこない記事は遠くになるように空間上にマッピングする

イメージ f:id:thr3a:20150819010721p:plain

最近傍法(Nearest Neighbor Algorithm)

名前の通り傍(隣)に合わせる方。 未知の記事を空間上に置いた時に一番近い記事のカテゴリに決定する。

k近傍法(K-Nearest Neighbor Algorithm)

K-近傍法とかKNNとも。最近傍法では他の1つの記事しか考慮してなかったけどこれは近傍n個の記事を参考にジャンルを決定する。

未知の点を中心に任意の大きさの円を描きその円内の記事のジャンルを見る