技術・研究開発セミナー・技術書籍なら情報機構

ハンズオンで学ぶPythonによる強化学習の基礎│セミナー2026

ハンズオンで学ぶPythonによる強化学習の基礎

~強化学習アルゴリズムを自ら実装・応用するためのはじめの一歩~

■本セミナーの受講形式(会場/Zoom両アイコンある場合は受講形式選択可)

zoom……Zoomオンライン受講

見逃し視聴あり……見逃し視聴選択可


〇Pythonによるハンズオンを通じ、古典的な強化学習から最新の深層強化学習まで体系的に学ぶ!
〇基礎概念や代表的アルゴリズムから、Q学習・深層Qネットワークの適用と実装、学習過程の可視化と結果の評価、ハイパーパラメータ調整や学習失敗時の対処法まで。

講師

愛知県立大学 情報科学部 情報科学科 教授 小林 邦和 氏


講師紹介

■ご略歴:
 山口大学工学部助手,同助教,愛知県立大学情報科学部准教授を経て,2017年4月より現職.2026年4月より,愛知県立大学次世代ロボット研究所副所長を兼務.この間,ヒューストン大学工学部医用生体工学科の客員研究員を兼任.博士(工学).

■ご専門および得意な分野・研究:
機械学習(人工知能),知能ロボティクス,ソフトコンピューティング

■本テーマ関連学協会でのご活動:
 米国電気電子学会(IEEE),アメリカ人工知能学会(AAAI),電子情報通信学会,電気学会,人工知能学会,計測自動制御学会,言語処理学会,ロボカップ日本委員会の各会員.
 電気学会技術シーズ創出に向けた機械学習協同研究委員会委員長(2012~2014年),電気学会学習アルゴリズムの高度化を指向した機械学習技術協同研究委員会委員長(2014~2016年),ICAROB国際プログラム委員会委員(2014~2019年),電気学会システム技術委員会1号委員(2017年~2023年),あいちロボカップAP2020開催委員会競技専門部会部会員(2019~2020年),電気学会論文誌特集号編修小委員会委員長(2022年)などを歴任.
 現在,Journal of Robotics, Networking and Artificial Life編集委員(2014年~),電気学会論文誌特集号編修小委員会委員(2014年~),ICAROB国際組織委員会委員(2019年~),ロボカップ日本委員会理事(2019年~)などを務める.

<その他関連商品>
機械学習・AI・データ分析 一覧はこちら


日時・受講料・お申込みフォーム

●日時:2026年8月20日(木) 10:30-16:30 *途中、お昼休みや小休憩を挟みます。

●受講料:
【オンライン受講(見逃し視聴なし)】:1名 51,700円(税込(消費税10%)、資料付)
*1社2名以上同時申込の場合、1名につき40,700円

【オンライン受講(見逃し視聴あり)】:1名 57,200円(税込(消費税10%)、資料付)
*1社2名以上同時申込の場合、1名につき46,200円
*「見逃し視聴あり」でお申込の場合、当日のご参加が難しい方も後日セミナー動画の視聴が可能です。

学校法人割引:学生、教員のご参加は受講料50%割引。→「セミナー申込要領・手順」を確認ください。
5名以上でのお申込の場合、更なる割引制度もございます。
 ご希望の方は、以下より別途お問い合わせ・お申込みください。
 req@*********(*********にはjohokiko.co.jpを入れてください)

■ セミナーお申込手順からセミナー当日の主な流れ →


お申込みはこちらから
オンライン受講/見逃視聴なし

オンライン受講/見逃視聴あり

商品コード:AD260805

配布資料・講師への質問など

●配布資料はPDFなどのデータで配布いたします。ダウンロード方法などはメールでご案内いたします。
・配布資料に関するご案内は、開催1週前~前日を目安にご連絡いたします。
・準備の都合上、開催1営業日前の12:00までにお申込みをお願いいたします。
 (土、日、祝日は営業日としてカウントしません。)
・セミナー資料の再配布は対応できかねます。必ず期限内にダウンロードください。

●当日、可能な範囲でご質問にお答えします。(全ての質問にお答えできない可能性もございます。何卒ご了承ください。)
●ご受講に際しご質問・要望などございましたら、下記メールアドレス宛にお問い合わせください。
req@*********(*********にはjohokiko.co.jpを入れてください)

5名以上でのお申込の場合、更なる割引制度もございます。
 ご希望の方は、以下より別途お問い合わせ・お申込みください。
 req@*********(*********にはjohokiko.co.jpを入れてください)

オンラインセミナーご受講に関する各種案内(必ずご確認の上、お申込みください。)

  • PC/タブレット/スマートフォンなど、Zoomが使用できるデバイスをご用意ください。
  • インターネット 回線速度の目安(推奨) 下り:20Mbps以上
  • 開催が近くなりましたら、Zoom入室URL、配布資料、当日の流れなどをメールでご連絡いたします。開催前日(営業日)の12:00までにメールが届かない場合は必ず弊社までご一報ください。
  • ⇒よくある事例として「弊社ドメイン(johokiko.co.jp)のメールがスパム扱いとなっている」「メールアドレスのご記載ミス」などがございます。お申込み後にフォームへご記載いただいたメールアドレスへ自動返信メールを送信しますので、こちらのメールが受信できない場合、弊社からのZoom入室URLや配布資料のご案内メールもお届けすることができなくなってしまいます。予め受信できる設定にお願いいたします。
    ※メールアドレスの記載誤りについては、以下へご連絡お願いいたします。
    req@*********(*********にはjohokiko.co.jpを入れてください)
  • 受講者側のVPN、セキュリティ設定、通信帯域などのネットワーク環境ならびに使用デバイスの不具合については弊社では対応いたしかねますので予めご了承ください。
  • 講座で使用する資料や配信動画は著作物であり、無断での録音・録画・複写・転載・配布・上映・販売などは禁止いたします。また、申込者以外の受講・動画視聴は固くお断りいたします(代理受講ご希望の際は、開催前日までに弊社までご連絡お願いします)。
  • Zoom使用に関する注意事項(クリックして展開)

  • 公式サイトから必ず事前のテストミーティングをお試しください。
  • 確認はこちら
    →Skype/Teams/LINEなど別のミーティングアプリが起動していると、Zoomで音声が聞こえない、カメラ・マイクが使えないなどの事象が起きる可能性がございます。お手数ですが、これらのアプリは閉じた状態にてZoomにご参加ください。
    音声が聞こえない場合の対処例

  • Zoomアプリのインストール、Zoomへのサインアップをせずブラウザからの参加も可能です。
  • 参加方法はこちら
    →一部のブラウザは音声が聞こえないなどの不具合が起きる可能性があります。
    対応ブラウザをご確認の上、必ず事前のテストミーティング をお願いします。
    (iOSやAndroidOS ご利用の場合は、アプリインストールが必須となります)

    申込み時に(見逃し視聴あり)を選択された方は、見逃し視聴が可能です。(クリックして展開)

  • 見逃し視聴ありでお申込みされた方は、セミナーの録画動画を一定期間視聴可能です。
  • セミナーを復習したい方、当日の受講が難しい方、期間内であれば動画を何度も視聴できます。
  • 原則、遅くとも開催4営業日後までに録画動画の配信を開始します(一部、編集加工します)。
  • 視聴期間はセミナー開催日から4営業日後を起点に1週間となります。
  • ex)2/6(月)開催 セミナー → 2/10(金)までに配信開始 → 2/17(金)まで視聴可能
    →見逃し視聴について、 こちらから問題なく視聴できるかご確認ください。(テスト視聴動画へ)パスワード「123456」

    <見逃し視聴ご案内の流れ・配信期間詳細>
  • メールにて視聴用URL・パスワードを配信します。配信開始日を過ぎてもメールが届かない場合は必ず弊社までご連絡ください。
  • 準備出来しだい配信いたしますので開始日が早まる可能性もございます。その場合でも終了日は変わりません。上記例の2/6開催セミナーの場合、2/8から開始となっても2/17まで視聴可能です。
  • GWや年末年始・お盆期間などを挟む場合、それに応じて弊社の標準配信期間設定を延長します。
  • 原則、配信期間の延長はいたしません。
  • 万一、見逃し視聴の提供ができなくなった場合、(見逃し視聴あり)の方の受講料は(見逃し視聴なし)の受講料に準じますので、ご了承ください。
  • ハンズオン実習環境ご準備のお願い:Google Colaboratory使用

    ・セミナー途中に随時 Google Colaboratory を用いたハンズオンでの実習を行います。動作する環境のご準備をお願いします。

    〇Google Colaboratory
    https://colab.research.google.com/


    ※以下3点を満たせば、問題なく利用できるかと存じます。
    1)「Googleアカウント」および「Google Colaboratoryが動作するWebブラウザ」のご準備
    2)上記リンクへアクセスができる
    3)ページ上部の「+ コード」に例えば「1+1」と入力、実行し答えが出力される

    ※セキュリティ設定などにより、Google Colaboratoryが利用できない場合がございます。必ず事前に当日の視聴環境でご利用可能かご確認ください。

    セミナーポイント

    ■はじめに:
     本セミナーでは,Pythonによるハンズオンを通じて,古典的な強化学習から最新の深層強化学習まで体系的に学びます.単なる理論の解説ではなく,エージェントがどのように試行錯誤しながら学習するのかについて,実際にコードを書き,可視化しながら理解することを重視します.古典的なQ学習(強化学習)の多腕バンディット問題から最新の深層Qネットワーク(深層強化学習)のCartPoleへの適用および実装までを体験し,強化学習アルゴリズムを自ら実装・応用できる力を身につけます.

    ■受講対象者:
    ・Pythonを用いた機械学習・AI技術(特に強化学習)に興味のある技術者の方
    ・強化学習をこれから学びたい方,または基礎から体系的に理解したい方
    ・業務へ活かすため,強化学習アルゴリズムの基礎知識や実装方法を習得したい方
    ・強化学習を学んだことはあるが,なぜ学習できるのかを十分理解できていない方
    ・ゲームAI,ロボティクス,自律制御などへの応用に興味のある方
    ・実際にPythonコードを書きながら,強化学習を体験的に学びたい方
    ・本テーマに興味のある方ならどなたでも受講可能です

    ■必要な予備知識:
    ・高校卒業レベルの数学の知識
    ・Pythonの基礎文法(条件分岐,繰り返し処理,関数など)の知識
    ・Pythonによる簡単なデータ処理・可視化の基礎知識
    ・強化学習やニューラルネットワークの予備知識があると理解しやすくなりますが,必須ではありません

    ■本セミナーで習得できること:
    ・強化学習の基礎概念(エージェント,環境,報酬,状態,行動)の理解
    ・Q学習や深層Qネットワークなどの代表的アルゴリズムの基礎知識
    ・Pythonを用いた強化学習アルゴリズムの実装方法
    ・Q学習や深層Qネットワークにおける学習過程の可視化と結果の評価方法
    ・強化学習におけるハイパーパラメータ調整や学習失敗時の対処法
    など

    セミナー内容

    1.強化学習の基礎
     1)機械学習の概要
      a)教師あり学習・教師なし学習・強化学習の違い
      b)エージェント・環境・報酬
     2)強化学習の応用例
      a)ゲームAI(Atari,マリオAI,AlphaGo)
      b)ロボティクス(自律移動,制御最適化)
     3)セミナーのゴール

    2.多腕バンディット(スロットマシン)問題
     1)多腕バンディット問題
     2)バンディットの価値推定
     3)プレイヤーの行動戦略(探索vs活用)
     4)ハンズオン
      a)バンディット・エージェント・方策の実装
      b)ハイパーパラメータの相違による性能比較

    3.マルコフ決定過程(MDP)と動的計画法
     1)MDP(エージェントと環境との相互作用)
     2)ベルマン方程式
      a)状態価値関数
      b)行動価値関数
     3)動的計画法
      a)方策評価
      b)方策改善
      c)価値反復法
     4)ハンズオン
      a)グリッドワールド環境の実装
      b)価値反復法の実装

    4.Q学習
     1)モデルベースvsモデルフリー
     2)Q学習のアルゴリズムと学習方法
     3)ハンズオン
      a)グリッドワールド環境におけるQ学習の実装
      b)学習過程の可視化

    5.深層強化学習(深層Qネットワーク)
     1)ニューラルネットワーク導入の理由
     2)深層Qネットワーク(DQN)の基本構造
      a)ニューラルネットワークによるQ関数の近似
      b)経験再生
      c)ターゲットネットワーク
     3)DQNのアルゴリズムと学習方法
     4)ハンズオン
      a)DQNの実装
      b)CartPole問題における動作確認

    6.まとめ
     1)最新動向
     2)質疑応答

    【注意事項】
    当日の進行状況に応じて,ハンズオン演習はすべての項目が取り上げられない可能性があります.


    お申込みはこちらから
    オンライン受講/見逃視聴なし

    オンライン受講/見逃視聴あり
    ページトップへ