人工知能してみる

人工知能の中の人が機械学習とか統計とかAI的なことを書き連ねます

機械学習

メルカリがKaggleでコンペ始めたみたい

こんにちはGrahamianです。昨日からメルカリがKaggleで機械学習コンペティションを始めたみたいです。 mercan.mercari.comテーマ課題は Mercari SuggestPrice ということでメルカリのプライシング(価格査定)です。 データを見ると説明文、タグ、ブランド、…

SCAN: 視覚概念による抽象的な階層構成の学習

こんにちは、Grahamianです。 先日発表されたDeep Mindの論文がなかなかに衝撃的なのでザックリと紹介を書いてみます。 深く読めていないので誤りがあったら指摘願います。SCAN: Learning Abstract Hierarchical Compositional Visual Concepts deepmind.com…

予測精度はKPI足り得るのか?

こんにちはGrahamianです。 今日は予測精度について話します。プロダクト開発においてKPIの設計は非常に重要です。 最近のWEBプロダクト開発ではKPI設計が成否を分けているといっても過言ではありません。 しかし機械学習を用いるとKPIの設定が非常に難しく…

なぜ機械学習を使ったプロジェクトは失敗するのか

おはようございます。Grahamianです。 世間では猫も杓子も機械学習ですね。 あちこちで機械学習を使ったhogehogeが出ていますが成果はパッとしない印象を受けます。 それは何故なのかを考えたので書いてみます。 機械学習は得意不得意がある 機械学習はなん…

Azure Machine Learningを使ってみたら思ったよりよかった

Grahamianです。 タイトルどおりです。 数年前からクラウド機械学習サービスがでてきていましたが、そのときは全然興味ありませんでした。 データサイエンスって前処理が面倒なんで機械学習だけクラウドで出来てもなーって感じ。 とか思っていたんですが、つ…

ロボアドバイザーってどうよ?

おはようございます。 Grahamianです。今日のニュースは↓ www.fina-sol.comここ2, 3年で金融業界に一気に人工知能技術、というか機械学習プロダクトが一気に増えました。 いわゆるFintechってやつですね。金融は数字データが多いので機械学習と親和性が高い…

「AIによる高度な評価」という便利で意味のない言葉

www.fashionsnap.com某D○NAみたいなこともありましたし、こういった考え方をもったサイトが生まれるのはとても良いことだと思います。思いますが、記事中にこんな記述があります。「データとAIによりコンテンツを客観的に評価し、雑誌編集のノウハウを知る編…

人工知能が記事を書く時代になりました

jp.techcrunch.comつまるところ、企業の出す決算短信など適時開示情報をもとに各社の要約文を出力するわけですね。実際に出力されている文章をみると割りとルールベースなのかな?って感じです。 たとえば数値について言及しているあたりは企業の過去データ…

機械学習で理由も説明させる

こんにちはGrahamianです。こんなニュースがありました。 www.gizmodo.jp要約するとdeep learningの結果に対して結果の理由を添えてくれる、というもの。単層パーセプトロンのようなシンプルなものはまだ理由が考えやすかった。 これはインプットに直接重み…

バンディットアルゴリズム ε-Greedyモデル

前回バンディットアルゴリズムの全体について見てみました。 grahamian.hatenablog.com今回はバンディットアルゴリズムの基本であるε-Greedyモデルを見ていきます。前回、バンディットアルゴリズムでは探索と活用が重要だと言いました。 ε-Greedyモデルでは0…

バンディットアルゴリズムって何?

なんかバンディットアルゴリズムというものがすごいらしいです。 勉強したことを少し書き溜めてみます。バンディットアルゴリズムとは? 目の前にスロットが何台かあるとしましょおう。 それぞれのスロットには当たりの確率がそれぞれ設定されています。 も…

gensimでトピックモデルを実装してみる

自然言語処理のライブラリはpythonでは多々ありますが、gensimを今回は使います。 以前もgensimはWord2Vecを使うために使いましたね。 grahamian.hatenablog.com今回はトピックモデルを実装するために使います。 とはいえ、作るだけならコードは3行で済みま…

anacondaのlibraryをPyCharmでimportする

タイトルどおりです。 最近PyCharmを使い初めたのですが、importで詰まったので書いておきます。PyCharmで普通にプロジェクトを作成すると標準のpython環境を使おうとするみたいです。 で、CreateProjectのときにProject Interpreterからanaconda環境のpytho…

word2vecしてみる

2014年くらいに流行ったツールであるword2vecを使ってみます。 word2vecの詳細は省きますが、簡単に言うと、単語を任意のベクトルに変換するものです。 skip-gramかCountinuous Bag of Wordsモデルに基づいてベクトル化されます。 簡単に言うと、ある単語の…

主成分分析したあとSVMを回してみる

前回に引き続き、主成分分析をしてからSVMを回してみます。 主成分分析とSVMは話したので過去の記事を参照してください。grahamian.hatenablog.comgrahamian.hatenablog.comそれでは早速SVMを回してみましょう。 コードは主成分分析も含めてこんな感じです。…

Scikit-learnでirisを主成分分析してみる

主成分分析(Principal Component Analysis)とはデータの各ベクトルを独立にし次元を下げる手法です。 データを独立にするとは入力ベクトルを直行にさせると考えればOKです。 複数のベクトルの要素を見て独立なベクトルを再構築させます。 次元の低減はベクト…

scikit-learnのSVMで数字を線形分離してみる

先日はanacondaを導入して簡単なプロットをしてみました。 が、anacondaはscikit-learnのような機械学習ライブラリがまとめて入っています。 せっかくなので、簡単な機械学習について手を出してみようと思います。参考にしたのは下記ブログです。 参考という…

Anacondaを入れてSpyderを使う

Pythonをインストールするにいろいろと調べていたのですが、今はAnacondaを使うのが一般的なようです。 Anacondaならデータ分析や機械学習に用いるさまざまなライブラリが一緒に導入できます。 pipで個別に入れるよりも安定して導入できるので、プレーンな状…