特徴量エンジニアリング セミナー

サイトマップサイトマップ よくあるお問合わせよくあるお問合せ リクエストリクエスト セミナー会場セミナー会場へのアクセス リンクリンク
セミナーのメニュー
  ヘルスケア系
4月
5月
6月
7月〜

化学・電気系 その他各分野
4月
5月
6月
7月〜
出版物出版物
新刊図書新刊図書 月刊 化学物質管理Gmpeople
通信教育講座通信教育講座
LMS(e-learning)LMS(e-learning)
セミナー収録DVDDVD
電子書籍・学習ソフトDVD
セミナー講師のコラムです。講師コラム
  ↑2019/4/5更新!!
お申し込み・振込み要領お申込み・振込要領
案内登録案内登録
↑ ↑ ↑
新着セミナー、新刊図書情報をお届けします。

※リクエスト・お問合せ等
はこちら→ req@johokiko.co.jp



SSL GMOグローバルサインのサイトシール  


特徴量エンジニアリング セミナー

本セミナーでは、地理空間データ、テキストデータ、画像データなど、
多様な形式のデータに対応した特徴量エンジニアリングの手法を広く紹介します。

データ分析における特徴量エンジニアリング

〜多種多様なデータを扱う際の原理と実践〜

講師

国立環境研究所 生物・生態系環境研究センター 高度技能専門員
株式会社ホクソエム 執行役員 瓜生 真也 先生

* 希望者は講師との名刺交換が可能です

→このセミナーを知人に紹介する

日時・会場・受講料

●日時 2019年7月10日(水) 10:30-16:30
●会場 [東京・京急蒲田]大田区産業プラザ(PiO) 6階C会議室 →「セミナー会場へのアクセス」
●受講料 1名46,440円(税込(消費税8%)、資料・昼食付)
 *1社2名以上同時申込の場合、1名につき35,640円
      *学校法人割引;学生、教員のご参加は受講料50%割引。→「セミナー申込要領・手順」を確認下さい。

 ●録音・撮影行為は固くお断り致します。
 ●講義中の携帯電話の使用はご遠慮下さい。
 ●講義中のパソコン使用は、講義の支障や他の方の迷惑となる場合がありますので、極力お控え下さい。
  場合により、使用をお断りすることがございますので、予めご了承下さい。
  *PC実習講座を除きます。


■ セミナーお申込手順からセミナー当日の主な流れ →

セミナーポイント

■はじめに
特徴量エンジニアリングは、データ分析や機械学習モデルにおいて、予測モデルの性能を向上させる上で欠かせないプロセスの一つです。機械学習や統計モデリングの入力として与える特徴量を適切な形に整えることで、より良い出力結果を得ることが期待されます。
本セミナーでは、実務で扱う多種多様な形式のデータに対応した特徴量エンジニアリングの手法を広く紹介します。前半は、数値、テキスト、カテゴリ変数それぞれの基本的な取り扱いを紹介します。後半は、ドメイン知識が十分にない場合でも適用可能な範囲での、データに固有な形式の特徴量を作成する方法を説明します。
Jupyter Notebook上で解説を行い、コードはR/Pythonで示します。またセミナー後も参加者がコードを復習できるように演習に用いたコード等は共有いたします。

■受講対象
・データ分析に求められる基礎知識の理解を深めたい方
  …データサイエンス、機械学習での多くの場面で遭遇する基礎知識を幅広く扱います。
・多種多様な形式のデータを扱う方
  …地理空間データ、テキストデータ、画像データを対象に、
   これらのデータの特徴量エンジニアリングの手法を紹介します。

■必要な予備知識
・RまたはPython、Juliaなどのプログラミング言語の基礎知識があると望ましい。
・随所で「機械学習のための特徴量エンジニアリング - その原理とPythonによる実践(オライリー・ジャパン)」の
内容に触れます。
※参考資料として一読いただいていると理解がより深まります。https://www.oreilly.co.jp/books/9784873118680/

■本セミナーに参加して修得できること
1. データサイエンス、機械学習で用いられる手法の基礎
2. データ分析環境への理解…Jupyter Notebook上で、RおよびPythonでの実行例を示します
3. データの前処理、整形に関する知識、RおよびPythonを使った処理の方法
4. 日本語テキスト、時系列、画像、地理空間データの扱いについての基礎知識

セミナー内容

1 特徴量エンジニアリングについての各論

1. 導入
 ・どのような種類のデータがあるか
 ・特徴量とは何か
 ・前処理
 ・コンピュータが処理しやすいデータ形式: tidyデータ
 ・欠損処理の概要
 ・「守り」の特徴量エンジニアリング

2. 数値の取り扱い
 ・数値データのいろいろ: 連続、離散、二値変数
 ・データの分布
 ・対数変換のご利益
 ・特徴量スケーリング
 ・【実践】地価データの特徴量エンジニアリング

3. テキストデータの取り扱い
 ・テキストの数値化
 ・TF-IDF
 ・日本語テキストの取り扱い
 ・【実践】日本語テキストデータの特徴量エンジニアリング

4. カテゴリ変数の取り扱い
 ・エンコーディング
 ・One-Hotエンコーディング
 ・ダミーコーディング


2 多様なデータの特徴量エンジニアリング

1. 時間・曜日データの取り扱い
 ・時間/曜日データの特徴
 ・自己相関
 ・季節成分・周期成分
 ・曜日(平日と休日)
 ・タイムゾーン

2. 地理空間データの取り扱い
 ・GISデータの特徴
 ・距離
 ・空間自己相関
 ・住所/地名のデータ
 ・【実践】地価データの地理空間的な特徴量エンジニアリング

3. 画像データの取り扱い
 ・画像データの特徴量

4. 話題提供
 ・クラスタリングと次元削除
 ・主成分分析
 ・k-meansクラスタリング
 ・【実践】地価データの分析
 ・特徴量の管理
 ・特徴量の重要度と取捨選択
 ・「攻め」の特徴量エンジニアリング

講師紹介

【略歴】
2014年、横浜国立大学大学院環境情報学府 博士課程前期修了。
株式会社ナイトレイでのデータ分析エンジニア職を経て、
国立環境研究所生物センターにて高度技能専門員。
株式会社ホクソエムでは執行役員として在籍

【専門】
空間解析、テキスト分析、自然風景画像を用いた機械学習モデルの開発。
データ分析チームにおける分析基盤構築と再現性の向上。

共著/翻訳: 「Rによるスクレイピング入門」(C&R研究所)、「データサイエンティストのための最新知識と実践」(マイナビ)、「機械学習のための特徴量エンジニアリング」(オライリー・ジャパン)
付録: 「Rで楽しむベイズ統計入門」(技術評論社)
査読協力: 「RとKerasによるディープラーニング」(オライリー・ジャパン)

セミナー番号:AC190736

top

注目の新刊

雑誌 月刊化学物質管理


半導体製造プロセス

三次元培養

ピッカリング・エマルション

再生医療・細胞治療

2019 車載カメラ徹底解説

量子コンピュータ

これから化学物質管理

外観検査

生物学的同等性試験

最新の医療機器薬事入門

積層セラミックコンデンサ

分野別のメニュー

化学・電気系他分野別一覧

  植物工場他

  機械学習他

ヘルスケア系分野別一覧

  海外関連

  医療機器

各業界共通
マーケティング・人材教育等

「化学物質情報局」

特許・パテント一覧 INDEX
(日本弁理士会 継続研修)

印刷用申込フォーム    

セミナー用

書籍用

会社概要 プライバシーポリシー 通信販売法の定めによる表示 商標について リクルート
Copyright ©2011 情報機構 All Rights Reserved.