____

アルトナーは、顧客企業からの要望等にお応えしていく中で、重要性の高いテクノロジーを日々キャッチアップし続けています。 そうした中で特に近年注目されているのがAI(機械学習)です。アルトナーでは、AI(機械学習)に不可欠な基礎知識から実装までを習得でき、業務に活きる実践的な「AI分野向け研修カリキュラム」を組んで顧客ニーズに応えています。その研修内容についてアルトナーのソフトウェア研修担当 畑田研二さん(以下:畑田さん)にお話を伺いました。 (取材・記事執筆:アルトナー取材班)

AI分野向け研修カリキュラム

基礎知識
・機械学習の基本的な考え方や用語の習得
・機械学習アルゴリズムの理解
・機械学習に必要な線形代数、微分積分、統計学、情報通信理論の復習
基礎実習
・Pythonの基礎、JupyterNotebookの使い方、データ分析用ライブラリの使い方
・数値計算、データ加工処理、データ可視化処理
・機械学習モデル(教師あり・なし)の実装、検証、チューニング
実践課題
・Kaggle データ分析コンペティションに挑戦
・公開されているデータを使用して実践的なデータ分析スキルを習得

基礎知識

機械学習の基本的な考え方や用語の習得

C.M.Bishop「Pattern Recognition and Machine Learning」というテキストを英文で熟読することで、まず、パターン認識や機械学習をする上で必要になってくる知識、専門用語を習得してもらいます。同時に、データ分析やモデル構築で現れる、確率理論、モデルをどう選択すべきかの決定理論や情報理論の必要性を理解します。

機械学習アルゴリズムの理解

次にAI(機械学習)の基本的なアルゴリズムを学びます。一つは教師あり学習。もう一つは教師なし学習です。教師あり学習では、重回帰、ロジスティック回帰、決定木、k近傍法、サポートベクタマシン、ニューラルネットワーク、ディープラーニングを学びます。教師なし学習では、クラスタリング、主成分分析マーケットバス分析等を学習します。 ここでは、数式を追跡するだけはなく、基礎実習で使用するテキストを用いて、Pythonで実際に手を動かしながら課題を解いていくやり方で機械学習アルゴリズムを理解します。

機械学習に必要な線形代数、微分積分、統計学、情報通信理論の復習

ここでは、前述のC.M.Bishop「Pattern Recognition and Machine Learning」の練習問題を解くことにより、線形代数、微分積分、統計学、情報通信理論を習得して行きます。AI(機械学習)に必要な数学を目的に応じて実際に使うやり方を覚えてもらいます。コンピューターと向き合うというより、紙と鉛筆で、数式を展開するなどして実際に計算する力を身に着けます。

基礎実習

Pythonによる課題へのアプローチ

AI(機械学習)で使われるアルゴリズムや計算手法が纏められたテキストを元にPython3を扱える開発環境で実習を行います。Pythonの基礎、JupyterNotebookの使い方、データ分析用ライブラリの使い方を習得して、AI(機械学習)に必要とされるプログラミング環境やPythonプログラミングのやり方を覚えていきます。

数値計算、データ加工処理、データ可視化処理

NumpyやScipyを使った科学的な数値計算のやり方をテキストの課題をPythonで実装しながら覚えて行きます。 データ加工処理ではPandasを使用し、欠損データと異常値の取り扱い方、時系列データの取り扱い方を習得します。 Matplotlibを使用し、データの可視化のやり方をPythonでプログラミングします。

機械学習モデル(教師あり・なし)の実装、検証、チューニング

機械学習の典型的なアルゴリズムを実際にPythonでプログラミングして、基礎知識の確認をして行きます。機械学習の分野では、課題に応じてどのモデルを選択するか、そのモデルで問題を解決できたかどうか、パフォーマンスは十分なのかを吟味することは大切です。そのため、モデルを実装する技術とともにモデルの検証とモデルをチューニングする方法をPythonプログラミングで身に着けます。

実践課題

Kaggle データ分析コンペティションに挑戦

世界中のAI(機械学習)に携わっている人たちが約40万人も集まるコミュニティ「Kaggle(カグル)」にある、様々なデータ分析コンペティションの一つに挑戦します。様々な企業が課題・問題とそれに必要なデータを展開しているので、それを競い合って分析するというコンペティションです。そこにはコンペティションのチュートリアルとしての課題とデータが公開されているので、それに挑戦します。これまで培った基礎知識やコーディング、分析力を実際に試してみるというのが狙いです。

公開されているデータを使用して実践的なデータ分析スキルを習得

モデルを作り、そのモデルを評価できるようになる学習を行います。自分で作ったモデルに、実際にデータを入れて統計的に目的の結果が出ているかを、パラメータをチューニングしながら評価していきます。

データ分析で重要なことは、システムの中にある規則性を見出し、
価値のある情報を引き出すことです。

畑田さんは言います。 「AI(機械学習)の業務といっても、どのようなアルゴリズムや戦略で問題に取り組むのかを考える上流工程の仕事から、分析に使用するために取得する大量のビッグデータを分散処理して、無駄なノイズとなるデータを排除しセットアップする“クレンジング”と言われる仕事まで、多岐にわたります。 業務に活かすためには、この研修で基礎的な知識と理論を学んだ後に、沢山のデータに触れ、様々な問題に対してアプローチし結果を出して行くという経験の積み上げが必要です。これらの経験があると、システムのデータを観察した時に、問題解決に向けた直感力が醸成されて、上流工程の仕事にも対応できるようになると思います。データ分析で重要なことは、システムの中にある規則性を見出し、そこから価値の情報を引き出すことです。 具体的には、お客様からの最初のヒアリングで、お客様はデータ分析の結果を何に活用されようとしているのかをよく理解した上で、データ分析の結果を報告できるスキルが大切だと思います。」
New Contents

新着コンテンツ

Related Contents

関連コンテンツ

TOP