画像認識の革新モデル ViT セミナー
サイトマップサイトマップ よくあるお問合わせよくあるお問合せ リクエストリクエスト セミナー会場セミナー会場へのアクセス
セミナーのメニュー
  ヘルスケア系
ライブ配信
5月
6月
7月
8月〜

化学・電気系 その他各分野
ライブ配信
5月
6月
7月
8月〜
出版物出版物
新刊図書新刊図書 月刊 化学物質管理Gmpeople
通信教育講座通信教育講座
LMS(e-learning)LMS(e-learning)
セミナー収録DVDDVD
電子書籍・学習ソフトDVD
セミナー講師のコラムです。講師コラム
  ↑2022/4/15更新!!
お申し込み・振込み要領お申込み・振込要領
案内登録案内登録
↑ ↑ ↑
新着セミナー、新刊図書情報をお届けします。

※リクエスト・お問合せ等
はこちら→ req@johokiko.co.jp



SSL GMOグローバルサインのサイトシール  



Zoom見逃し視聴あり

(オンライン)7月22日のみ参加(見逃視聴なし)→ 

(オンライン)7月22日のみ参加(見逃視聴あり)→ 


(オンライン)7月8日・7月22日 両日参加(見逃視聴なし)→ 

(オンライン)7月8日・7月22日 両日参加(見逃視聴あり)→ 

★近年発展が著しい Vision Transformerの最新動向を把握!
 その仕組みや様々な改良モデル、実装方法などがわかる!

画像認識の革新モデル ViT

(Vision Transformer)基礎とその利用法

<Zoomによるオンラインセミナー:見逃し視聴有>

講師

東京工業大学 学術国際情報センター 准教授 博士(工学)  横田 理央 先生


7月8日『自然言語処理モデル BERT 及びその発展形のTransformer ベースの各種モデル(BART、GPT-2、T5、GPT-3)の基礎と利用方法』とセットで受講が可能です。
講義内容はこちら→


日時・会場・受講料

●日時 2022年7月22日(金) 12:30-16:30
●会場 会場では行いません
●受講料
『画像認識モデルViT(7月22日)』のみのお申込みの場合
  【オンラインセミナー(見逃し視聴なし)】:1名41,800円(税込(消費税10%)、資料付)
  *1社2名以上同時申込の場合、1名につき30,800円

  【オンラインセミナー(見逃し視聴あり)】:1名47,300円(税込(消費税10%)、資料付)
  *1社2名以上同時申込の場合、1名につき36,300円

『自然言語処理モデルBERT(7月8日)』と合わせてお申込みの場合
 (同じ会社の違う方でも可。※二日目の参加者を備考欄に記載下さい。)
  【オンラインセミナー(見逃し視聴なし)】:1名61,600円(税込(消費税10%)、資料付)
  *1社2名以上同時申込の場合、1名につき50,600円⇒割引は全ての受講者が両日参加の場合に限ります

  【オンラインセミナー(見逃し視聴あり)】:1名72,600円(税込(消費税10%)、資料付)
  *1社2名以上同時申込の場合、1名につき61,600円⇒割引は全ての受講者が両日参加の場合に限ります

 *学校法人割引;学生、教員のご参加は受講料50%割引。→「セミナー申込要領・手順」を確認下さい。

 ●録音・録画行為は固くお断り致します。


■ セミナーお申込手順からセミナー当日の主な流れ →

配布資料・講師への質問等について

●配布資料はPDF等のデータで送付予定です。受取方法はメールでご案内致します。
 (開催1週前〜前日までには送付致します)。
*準備の都合上、開催1営業日前の12:00までにお申し込みをお願い致します。
(土、日、祝日は営業日としてカウント致しません。)

●当日、可能な範囲で質疑応答も対応致します。
(全ての質問にお答えできない可能性もございますので、予めご容赦ください。)
●本講座で使用する資料や配信動画は著作物であり
 無断での録音・録画・複写・転載・配布・上映・販売等を禁止致します。
●受講に際しご質問・要望などございましたら、下記メールにてお問い合わせ下さい。 req@johokiko.co.jp

※本講座は、お手許のPCやタブレット等で受講できるオンラインセミナーです。

下記ご確認の上、お申込み下さい(クリックして展開「▼」:一部のブラウザーでは展開されて表示されます)
・PCもしくはタブレット・スマートフォンとネットワーク環境をご準備下さい。
・ご受講にあたり、環境の確認をお願いしております(20Mbbs以上の回線をご用意下さい)。
 各ご利用ツール別の、動作確認の上お申し込み下さい。
・開催が近くなりましたら、当日の流れ及び視聴用のURL等をメールにてご連絡致します。開催前日(営業日)の12:00までにメールが届かない場合は必ず弊社までご一報下さい。
・その他、受講に際してのご質問・要望などございましたら、下記メールにてお問い合わせ下さい。
 <req@johokiko.co.jp>

Zoom
Zoomを使用したオンラインセミナーとなります(クリックして展開「▼」)
・ご受講にあたり、環境の確認をお願いしております。
 お手数ですが下記公式サイトからZoomが問題なく使えるかどうか、ご確認下さい。
 → 確認はこちら
 *Skype/Teams/LINEなど別のミーティングアプリが起動していると、Zoomでカメラ・マイクが使えない事があります。お手数ですがこれらのツールはいったん閉じてお試し下さい。
 →音声が聞こえない場合の対処例

・Zoomアプリのインストール、Zoomへのサインアップをせずブラウザからの参加も可能です
 →参加方法はこちら
 →※一部のブラウザーは音声(音声参加ができない)が聞こえない場合があります、
   必ずテストサイトからチェック下さい。
   対応ブラウザーについて(公式);コンピューターのオーディオに参加に対応してないものは音声が聞こえません

見逃し視聴あり
申込み時に(見逃し視聴有り)を選択された方は、見逃し視聴が可能です。
(クリックして展開「▼」)
・原則、開催5営業日後に録画動画の配信を行います(一部、編集加工します)。
・視聴可能期間は配信開始から1週間です。
(GWや年末年始・お盆期間等を挟む場合、それに応じて弊社の標準配信期間の設定を延長します。)
 セミナーを復習したい方、当日の受講が難しい方、期間内であれば動画を何度も視聴できます。
 尚、閲覧用URLはメールでご連絡致します。
 ※万一、見逃し視聴の提供ができなくなった場合、
 (見逃し視聴あり)の方の受講料は(見逃し視聴なし)の受講料に準じますので、ご了承下さい。

 →こちらから問題なく視聴できるかご確認下さい(テスト視聴動画へ)パスワード「123456」


セミナーポイント

 自然言語処理タスクでは、従来の手法を一新させたTransformerが広く利用されているが、画像処理タスクでも2020年頃からVision Transformerが盛んに用いられてきており、近年その発展が著しい。
 本講座では、Vision Transformerの仕組みや様々なモデルの特徴・性能・留意点などの基礎的事項から、各分野における最新の研究動向、実装の軽量化や高速化について解説する。

○受講対象:
 ・画像・動画処理に深層学習を用いている方
 ・Vision Transformerの導入を検討している方
 ・Vision Transformerを使いこなせていないとお考えの方
 ・深層学習の最新の研究動向を抑えておきたい方
 など

○受講後、習得できること:
 ・Vision Transformerを用いた画像認識の最新動向が把握できる
 ・Vision Transformerの仕組みや様々な改良モデル、実装方法などがわかる
 ・画像分類、物体検出、セグメンテーション、姿勢推定、画像生成などの画像処理タスクおよびそれらを含むマルチモーダルタスクへのVision Transformerの導入方法や期待される効果が分かるようになる
 など

セミナー内容

1.Vision Transformerの基礎知識
 〜基本的な仕組みおよび各種改良モデルの解説〜

 1)はじめに
  a) Vision Transformerの魅力
  b) Vision Transformerの特性
 2)Transformerの仕組み
  a) Self-Attention
  b) Multi-Head Attention
  c) Transformer全体の構造
  d) 事前学習
 3)Vision Transformerの仕組み
  a) Patchとposition encoding
  b) 正規化
  c) Shortcut connection
  d) Attentionの役割
 4)アーキテクチャの改良
  a) DeiT
  b) TNT
  c) CAT
  d) RegionViT
  e) DeepViT
  f) KVT
  g) PVT
  h) SwinTransformer
  i) PiT
  j) CrossFormer
  k) Focal Transformer
 5)Neural Architecture Search
  a) Scaling-ViT
  b) ViTAS
  c) AutoFormer
  d) GLiT
  e) HAT
 6)CNNとのハイブリッド
  a) CPVT
  b) CvT
  c) CeiT
  d) LocalViT
  e) CMT
  f) LeViT
  g) BoTNeT
  h) ResT
  i) NesT
 7)自己教師あり学習
  a) MoCo v3
  b) BYOL + SwinTransformer
  c) DINO
  d) EsViT
  e) MoBY

2.Vision Transformerの応用例・研究動向
 〜各分野への適用法やその効果・留意点など〜

 1)物体検出

  a) DETR
  b) YOLOS
  c) SMCA
  d) UP-DETR
  e) PED
  f) LSTR
 2)セグメンテーション
  a) CMSA
  b) Max-DeepLab
  c) VisTR
  d) ISTR
  e) SETR
  f) Segmenter
  g) TransUNet
  h) GAA
  i) Cell-DETR
  j) SegFormer
  k) Maskformer
 3)姿勢推定
  a) HOT-Net
  b) METRO
  c) TransPose
  d) TokenPose
  e) Skeletor
 4)画像生成
  a) iGPT
  b) TransGAN
  c) ViTGAN
  d) Image Transformer
  e) Taming Transformer
  f) DALL・E
  g) TTSR
  h) IPT
  i) SceneFormer
  j) ColTran
 5)動画認識
  a) Action Transformer
  b) I3D
  c) Temporal Transformer
  d) Actor Transformer
  e) MEGA
  f) Spatiotemporal Transformer
  g) ConvTransformer
  h) Recurrent Transformer
  i) MViT
  j) ViViT
 6)マルチモーダル学習
  a) VideoBERT
  b) VisualBERT
  c) VL-BERT
  d) ViLBERT
  e) LXMERT
  f) SpeechBERT
  g) CLIP
  h) CogView
  i) Unicoder-VL
  j) UNITER
  k) Perceiver IO

3.Vision Transformerの実装と軽量化・高速化手法
 1)軽量化

  a) 剪定
  b) 蒸留
  c) 量子化
  d) アーキテクチャの改良
 2)高速化
  a) Linformer
  b) Reformer
  c) Cluster attention
 3)実装
  a) pytorch-image-models
  b) PyTorch DDP, FSDP, Pipe
  c) DeepSpeed

  <質疑応答>

セミナー番号:AI2207B2

top

会社概要 プライバシーポリシー 通信販売法の定めによる表示 商標について リクルート
Copyright ©2011 技術セミナー・技術書籍の情報機構 All Rights Reserved.