機械学習・時系列データ分析のためのデータ前処理 セミナー

サイトマップサイトマップ よくあるお問合わせよくあるお問合せ リクエストリクエスト セミナー会場セミナー会場へのアクセス リンクリンク
セミナーのメニュー
  ヘルスケア系
7月
8月
9月
10月〜

化学・電気系 その他各分野
7月
8月
9月
10月〜
出版物出版物
新刊図書新刊図書 月刊 化学物質管理Gmpeople
通信教育講座通信教育講座
LMS(e-learning)LMS(e-learning)
セミナー収録DVDDVD
電子書籍・学習ソフトDVD
セミナー講師のコラムです。講師コラム
  ↑2019/7/3更新!!
お申し込み・振込み要領お申込み・振込要領
案内登録案内登録
↑ ↑ ↑
新着セミナー、新刊図書情報をお届けします。

※リクエスト・お問合せ等
はこちら→ req@johokiko.co.jp



SSL GMOグローバルサインのサイトシール  


機械学習・時系列データ分析のためのデータ前処理 セミナー

*その他 機械学習・ディープラーニング・人工知能: 関連セミナー、書籍はこちら:

★解析結果の成否を左右するとも言われる前処理について、具体的にどのような処理を行えば良いのか?
 自然言語処理画像処理時系列データ分析を取り上げ解説!
Python を用いて個々の前処理を行うために有用なパッケージや関数などを紹介します!

機械学習

・時系列データ分析のための

データ前処理すすめ方

講師

茨城大学 工学部 情報工学科 教授  新納 浩幸 先生

* 希望者は講師との名刺交換が可能です

講師紹介

【ご略歴】
 1985年 東京工業大学理学部情報科学科卒業。
 1987年 同大学大学院理工学研究科情報科学専攻修士課程修了。
   同年 富士ゼロックス、翌年松下電器を経て、1993年茨城大学工学部助手。
 2015年 同学部教授。現在に至る。

【ご専門】
 自然言語処理、機械学習、統計学

【主な著書】
 『 Chainer v2 による実践深層学習 』 オーム社
 『 ニューラルネットワーク自作入門 (翻訳)』 マイナビ出版
 『 Rで学ぶクラスタ解析 』 オーム社
 『 数理統計学の基礎 』 森北出版

→このセミナーを知人に紹介する

日時・会場・受講料

●日時 2019年9月19日(木) 12:30-16:30
●会場 [東京・東陽町]江東区産業会館2階第6展示室 →「セミナー会場へのアクセス」
●受講料 1名41,040円(税込(消費税8%)、資料付)
 *1社2名以上同時申込の場合、1名につき30,240円
      *学校法人割引;学生、教員のご参加は受講料50%割引。→「セミナー申込要領・手順」を確認下さい。

 ●録音・撮影行為は固くお断り致します。
 ●講義中の携帯電話の使用はご遠慮下さい。
 ●講義中のパソコン使用は、講義の支障や他の方の迷惑となる場合がありますので、極力お控え下さい。
  場合により、使用をお断りすることがございますので、予めご了承下さい。
  *PC実習講座を除きます。


■ セミナーお申込手順からセミナー当日の主な流れ →

セミナーポイント

 前処理とは何らかの解析処理を行う前に行う処理のことです。前処理の効果は大きく、以降に続く解析処理の成否を決めているのが、実は、前処理とも言われています。
 ただ前処理は言葉的には明確ですが、具体的にどういう処理を行うかははっきりしていません。それは前処理自体の入出力が様々だからです。まず前処理の入力は、通常、最初に得られた形でのデータですが、どこから得られたデータなのかでその形態は様々です。また前処理の出力は、その後に続く解析処理への入力になるのですが、その解析処理が多様なので、結果的に前処理の出力も様々です。
 本セミナーでは上記の点を踏まえ、解析処理を時系列データ分析、自然言語に対する機械学習及び画像に対する機械学習の3つに限定します。その上で、各処理に対して、通常、前処理として位置づけられている処理を解説します。
 また利用するプログラミング言語は Python です。個々の前処理を行うために有用なパッケージや関数などを紹介します。

○受講対象:
 ・時系列データ分析に携わっている方
 ・自然言語処理のシステム開発に携わっている方
 ・画像を対象とした機械学習システムの開発に携わっている方

○受講後、習得できること:
 ・時系列データ分析に対する前処理技術
 ・自然言語処理に対する前処理技術
 ・画像処理に対する前処理技術

セミナー内容

(1) 時系列データ分析の前処理
  最初に時系列データ分析の前処理について解説します。時系列データは扱いが難しく、分析対象によってどのような前処理が必要なのかは様々です。ここでは一般的に時系列データ分析の前処理として扱われるWindow サイズの調整、データの正規化、変数変換、スムージングについて解説します。また周期性に関する注意も行います。更に時系列データから外れ値(異常値)を検出・削除する処理は前処理とも捉えられますが、外れ値を検出すること自体が独自のタスクである場合もあります。ここでは時系列データから外れ値検出についても代表的手法を紹介します。

  1.1 Windows サイズの調整
  1.2 データの正規化
  1.3 変数変換
  1.4 スムージング
  1.5 周期性に関する注意
  1.6 外れ値検出


(2) 自然言語の機械学習処理のための前処理
  次に自然言語の機械学習処理のための前処理について解説します。扱う言語は日本語と英語に限定します。日本語の場合、まず問題となるコードの問題について解説します。次に自然言語処理の場合、原始データは通常プレーンな文書ではありません。ここでは原始データが html 文書の場合に対象を絞って、それをプレーンな文書に変換する方法について解説します。プレーンな文書が得られた後は句読点の統一や無駄な空白の除去などといった俗に言うクリーニング処理が必要であり、どのような処理があるのか、どうすれば簡単に処理できるかを紹介します。その後に行うべき処理では単語分割です。単語分割についてはほぼできあがった技術ですが、単語数を予め定めるニューラルネットワーク翻訳などでは Subword の技術が必要なので、この点について解説します。言語が英語の場合、日本語の場合には生じなかった、大文字と小文字の問題や、語尾変化の問題などがあります。このように英語特有の前処理について解説します。最後に単語列から文書に対する特徴ベクトルを作成する手法について解説します。基本はBag of words モデルと TF-IDF の組み合わせです。また文の埋め込み表現についても解説します。

  2.1 日本語コード
  2.2 構造化文書から plain テキストへ
  2.3 クリーニング処理
  2.4 Subword による単語分割
  2.5 英語固有の前処理
  2.6 Bag of words と TF-IDF
  2.7 文や文書の埋め込み表現


(3) 画像の機械学習処理のための前処理
  最後に画像の機械学習処理のための前処理について解説します。まず画像は様々なフォーマットで保存されていますので、それらファーマットの違いと変換処理について解説します。次に画像のノイズ除去の手法を紹介します。また実際に記録されている画像から物体検出を行いたい場合、閾値処理とフィルター処理を前処理として行うことが重要です。これらの処理について解説します。またディープラーニングで画像を扱うためには、実は、入力画像のサイズの問題が深刻です。これについて解説した後に、サイズの変更方法を述べます。最後に画像の機械学習の精度を改善する Data Augmentation の個々の手法について解説します。

  3.1 画像フォーマット変換
  3.2 画像からのノイズ除去
  3.3 閾値処理
  3.4 フィルター処理
  3.5 画像サイズの変換
  3.6 Data Augmentation


  <質疑応答>

セミナー番号:AC190975

top

注目の新刊

雑誌 月刊化学物質管理

日本語メディカルライティング

DI対応CSV 2019

プラスチック環境対応技術

自動運転センシング

半導体製造プロセス

三次元培養

ピッカリング・エマルション

再生医療・細胞治療

分野別のメニュー

化学・電気系他分野別一覧

  植物工場他

  機械学習他

ヘルスケア系分野別一覧

  海外関連

  医療機器

各業界共通
マーケティング・人材教育等

「化学物質情報局」

特許・パテント一覧 INDEX
(日本弁理士会 継続研修)

印刷用申込フォーム    

セミナー用

書籍用

会社概要 プライバシーポリシー 通信販売法の定めによる表示 商標について リクルート
Copyright ©2011 情報機構 All Rights Reserved.