強くなるロボティック・ゲームプレイヤーの作り方勉強会「3章 強化学習 後半」

2017/04/25(火)20:00 〜 22:00 開催
ブックマーク

イベント内容

発表形式を想定しています。
こちらの本を進めていく予定です。
発表してくださる方募集中!!


強化学習
https://www.morikita.co.jp/books/book/1990
強くなるロボティック・ゲームプレイヤーの作り方
https://book.mynavi.jp/ec/products/detail/id=52804
強化学習
https://www.morikita.co.jp/books/book/1990
http://neuro.bstu.by/ai/RL-3.pdf
オススメの本
https://www.morikita.co.jp/books/book/3034

ソース

Reinforcement Learning: An Introduction Python code for Sutton & Barto's book Reinforcement Learning: An Introduction (2nd Edition)
https://github.com/dennybritz/reinforcement-learning
Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton's Book and David Silver's course.
https://github.com/ShangtongZhang/reinforcement-learning-an-introduction
A course in reinforcement learning in the wild
https://github.com/yandexdataschool/Practical_RL
techcircle_openai_handson
https://github.com/icoxfog417/techcircle_openai_handson

おまけ

some common TD Learning algorithms
https://github.com/chrodan/tdlearn

スケジュール

輪読本 https://book.mynavi.jp/ec/products/detail/id=52804

【4月】:強化学習
1週目:gym入門など●
2週目:
    1章 “強くなる”ロボティック・ゲームプレイヤーを作るには
    2章 学習とは?
3週目:
    3章 強化学習●
     3.1 強化学習の背景
     3.2 強化学習の構成
     3.3 マルコフ決定過程
     3.4 最適政策関数
4週目:
    3章 強化学習●
     3.5 状態価値関数
     3.6 状態・行動価値関数
     3.7 動的計画法の問題点
【5月】:強化学習
1週目:
お休み
2週目:
    4章 離散的な空間での学習●
     4.1 はじめに
     4.2 ルックアップテーブルで表される価値関数の例
     4.3 標本を抽出する
     4.4 モンテカルロ法
3週目:
    4章 離散的な空間での学習
     4.5 価値関数近似における教師付き学習
     4.6 TD法
     4.7 Q学習
     4.8 三目並べ(Tic-Tac-Toe)の例
     4.9 実行例
4週目:
suttonに変える?
5週目:
【6月】:強化学習
1週目:
2週目:
3週目:
4週目:
【7月】:強化学習
1週目:
2週目:
3週目:
4週目:

以降〜
    5章 連続的な空間での学習
     5.5 カーネルモデル
     5.6 線形モデルの最小二乗推定
     5.7 カーネルモデルの最小二乗推定
     5.8 アクロボットの例

5章 連続的な空間での学習
     5.1 はじめに
     5.2 台車の山登りゲーム
     5.3 価値関数の近似誤差
     5.4 価値関数のモデル

6章 政策を直接近似する
     6.1 はじめに
     6.2 政策勾配法
     6.3 最小分散ベースライン
     6.4 ガウスモデル政策モデル
    6章 政策を直接近似する
     6.5 自然政策勾配法
     6.6 政策勾配の例
     6.7 4足ロボットへの実装


次の輪読テーマ募集!!

電子回路系

FPGAなど
Raspberry Piで学ぶ ROSロボット入門
https://www.amazon.co.jp/dp/4822239292/ref=pd_sim_14_64?_encoding=UTF8&psc=1&refRID=AY8SJWTTVSZ0RDZ8GBY4
https://github.com/ryuichiueda/raspimouse_book_info
Prototyping Lab――「作りながら考える」ためのArduino実践レシピ
https://www.oreilly.co.jp/books/9784873114538/

データサイエンス系

Python機械学習プログラミング 達人データサイエンティストによる理論と実践
https://www.amazon.co.jp/Python%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0-%E9%81%94%E4%BA%BA%E3%83%87%E3%83%BC%E3%82%BF%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%83%86%E3%82%A3%E3%82%B9%E3%83%88%E3%81%AB%E3%82%88%E3%82%8B%E7%90%86%E8%AB%96%E3%81%A8%E5%AE%9F%E8%B7%B5-impress-top-gear/dp/4844380605

数学系

プログラミングのための確率統計
https://estore.ohmsha.co.jp/titles/978427406775P
プログラミングのための線形代数
https://estore.ohmsha.co.jp/titles/978427406578P

暗号

暗号技術入門 第3版
http://www.hyuki.com/cr/
Hacking: 美しき策謀 第2版 ―脆弱性攻撃の理論と実際
https://www.amazon.co.jp/Hacking-%E7%BE%8E%E3%81%97%E3%81%8D%E7%AD%96%E8%AC%80-%E2%80%95%E8%84%86%E5%BC%B1%E6%80%A7%E6%94%BB%E6%92%83%E3%81%AE%E7%90%86%E8%AB%96%E3%81%A8%E5%AE%9F%E9%9A%9B-Jon-Erickson/dp/4873115140
セキュリティコンテストチャレンジブック -CTFで学ぼう! 情報を守るための戦い方-
https://www.amazon.co.jp/%E3%82%BB%E3%82%AD%E3%83%A5%E3%83%AA%E3%83%86%E3%82%A3%E3%82%B3%E3%83%B3%E3%83%86%E3%82%B9%E3%83%88%E3%83%81%E3%83%A3%E3%83%AC%E3%83%B3%E3%82%B8%E3%83%96%E3%83%83%E3%82%AF-CTF%E3%81%A7%E5%AD%A6%E3%81%BC%E3%81%86-%E6%83%85%E5%A0%B1%E3%82%92%E5%AE%88%E3%82%8B%E3%81%9F%E3%82%81%E3%81%AE%E6%88%A6%E3%81%84%E6%96%B9-%E7%A2%93%E4%BA%95-%E5%88%A9%E5%AE%A3/dp/4839956480/ref=sr_1_1?s=books&ie=UTF8&qid=1492399052&sr=1-1&keywords=CTF

web

flask
http://tatsu-zine.com/books/explore-flask/linkparts


実装をもっとしたい方はこちら

当日までに何かしら作ってくるミニハッカソン
発表のレベルは問いません。
https://aichatbot.connpass.com/event/

みんなでチャレンジしています。

House Price

https://www.kaggle.com/c/house-prices-advanced-regression-techniques

General AI Challenge

https://general-ai-challenge.connpass.com/event/50541/

Self-Driving Car Challenge

https://www.udacity.com/didi-challenge

持ち物

実装をされる方はPC

対象

人工知能を1から始めたい方、考えてる方
人工知能に少し興味のあるプログラマ

ドキュメント

ゼロから作るDeep Learning Pythonで学ぶディープラーニングの理論と実装
→終了
https://www.oreilly.co.jp/books/9784873117584/
kerasドキュメント
→終了
https://keras.io/ja/

参加費

1000円(会場費)

開催場所

コワーキングスペース秋葉原 Weeyble(ウィーブル)
http://weeyble.com/
東京都千代田区神田須田町2丁目19−23(野村第3ビル4階)
秋葉原駅電気街口または中央改札口より徒歩3分。 都営新宿線 岩本町駅徒歩3分、銀座線 神田駅6番出口徒歩2分


その他

途中参加や途中退出は自由です。
電源、Wi-Fiはあります。
一緒に運営してくださる方募集してます。


グループ

https://www.facebook.com/groups/1515619948454253/
資料もこちらに貼る予定です。また質問などご自由にどうぞ。

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。

関連するイベント