人工知能してみる

人工知能の中の人が機械学習とか統計とかAI的なことを書き連ねます

強化学習

バンディットアルゴリズム ε-Greedyモデル

前回バンディットアルゴリズムの全体について見てみました。 grahamian.hatenablog.com今回はバンディットアルゴリズムの基本であるε-Greedyモデルを見ていきます。前回、バンディットアルゴリズムでは探索と活用が重要だと言いました。 ε-Greedyモデルでは0…

バンディットアルゴリズムって何?

なんかバンディットアルゴリズムというものがすごいらしいです。 勉強したことを少し書き溜めてみます。バンディットアルゴリズムとは? 目の前にスロットが何台かあるとしましょおう。 それぞれのスロットには当たりの確率がそれぞれ設定されています。 も…