カーネル法のもとになる考え方?

新たに観測された対象に関するd次元データ

イメージ 1

が与えられたとき、線型モデル

イメージ 2

でその対象があるクラスに分類されるか否かを予測することを試みる。

事前にl個の学習データ(x1, x2, …, xl)があるとき、その中のi番目の学習データxiと新規観測データxとの類似度はしばしば内積すなわち

イメージ 3

で表される。ここで新規観測データxl個の学習データに対する各類似度に重みαiを掛けて、

イメージ 4  

としよう。xiが対象クラスに属している場合、αiの値をなるべく大きくとるようにすれば、xiが新規観測データxに類似しているとき、wTxが高い値をとりやすくなる。先ほどの予測のためのモデルは、

イメージ 5

となる。また、xのある関数ϕが存在し、

イメージ 6

xixとの類似度を表す場合、

イメージ 7

も予測のためのモデルとなる。例え関数ϕの計算が非常に複雑でも、ϕ(xi)Tϕ(x)の計算が簡単であれば、f(ϕ(x))が簡単に求まる。