Japan
サイト内の現在位置
NECアカデミー for AI での経験
はじめに
CEC新潟情報サービス株式会社の溝口と申します。入社以来、物流関係の企業のシステム開発・運用保守とデータセンターの管理業務を担当しておりました。今回はご縁があり、2020年4月より1年間NECアカデミー for AI入学コース(以下、入学コース)に参加しました。今回はその体験をコラム執筆という形で掲載させていただけるということで非常に光栄に思っております。
近年、AI(人工知能)の技術が急速に発展し、私たちの身のまわりの製品もAIを利用した機器に置き換わっている中、私たちのようなIT企業にとってAIを用いた技術・サービスは今後IT市場の中心となっていくことは間違いないでしょう。経済産業省のIT人材に関する調査では、日本のAI人材の需要と供給の差が2030年には約12.4万人の不足にのぼると予測されており、日本のIT産業の発展にはAI人材の育成が不可欠です。
(参考:経済産業省「IT人材に関する調査(概要))
入学コースはそうしたAI人材の育成を目的に、実際のプロジェクトに参画しながらAIに関する知識を学ぶことができ、今後の日本のAI人材不足の解消のカギになるのではないかと期待しています。
今回はその入学コースについて、私が体験した内容と得られた経験というものを紹介させていただきたいと思います。
専門研修の受講
入学コースに在籍中はメンターの方と相談のもと、AIに関する様々な専門研修を受講することが可能です。その中で私が受講した研修を2つほど紹介します。
データサイエンティスト養成ブートキャンプ
この研修はNECアカデミー for AIに入学してすぐに受講した研修です。20日間にわたりデータ分析の各手法を活用した分析業務について集中して学ぶ内容でした。
まずデータ分析において必須ともいえるPythonと統計学の基礎知識について学び、その後は以下のように座学・演習・発表というサイクルを2~3日ずつ繰り返すことでデータ分析の各手法を活用した分析業務について実践的に学ぶことができました。
- ①データ分析手法について学習(回帰・分類・クラスタリングなど)
- ②疑似案件から分析テーマを設定
- ③分析テーマについて、学んだ分析手法で分析
- ④分析結果について報告書を作成
- ⑤顧客への報告を想定しての発表
1回のサイクルで、最初の1日で①を行い、残りの1~2日で②~⑤を行うため、研修としてはなかなかハードに感じました。しかしこの後参画したプロジェクトなどの経験から今となってはこのくらい時間に追われることに慣れておいてよかったと感じています。
Pythonについては始めに基礎知識を学習しますが、受講を検討している方にはあらかじめ勉強しておくことをお勧めします。基礎知識だけではこの後の分析でその都度調べることになり、分析自体に時間が取れなかったりするためです。
①では回帰・分類・クラスタリングなどの各手法について学習しました。各手法の前処理や分析方法について演習を通して学びました。
②では疑似的な顧客課題を分析によって解決することをゴールとして、分析テーマを設定しました。データサイエンティストは分析する能力だけでなく顧客の課題からそれを解決するためのソリューションを提案する能力も必要です。様々な疑似案件を想定してテーマを考えたり、他の人が設定したテーマについて考えたりすることでテーマを設定するスキルも身に付けることができたのではないかと感じています。
③では設定した分析テーマに即した分析を行いました。ここで良い精度・結果を出すためにデータの選定や特徴量を試行錯誤しながら考えていました。
④では分析結果からお客様に報告するための資料を作成しました。資料はお客様の抱えている課題から、それを解決するための分析手法についての概要、使用データ、分析結果、および、そこからどのような効果が得られるか、までをお客様に報告することを前提として作成します。
⑤では④で作成した資料を使ってお客様に報告することを想定して発表しました。受講者ごとにテーマが異なるので他の受講者や講師の方から様々な質問が飛んできてとても苦労しました。
この研修で特に大事なのは②、④のあたりだと個人的に思っています。というのも実際の案件において、お客様の課題から分析によって解決できるソリューションを見つけ出すのは非常に難しいからです。また、ソリューションを見つけたとしてもそれがお客様にとって納得のできる、価値のあるものでなければいけません。分析結果を報告するときも同じで、今回行った分析によって何が分かり、それをシステム化したときにどのくらいの費用対効果が見込めるかといったところまで踏み込む必要があります。この研修ではそういった内容についても繰り返し学ぶことができるので、データサイエンティストとしてスタートラインに立つのには良い研修だったのではないかと感じています。
ディープラーニング
ディープラーニングに関する研修は「ディープラーニング~基礎~」「ディープラーニング~応用(CNN編)~」「ディープラーニング~応用(RNN編)~」の3つを受講しましたが、ここではまとめて紹介したいと思います。どれも1日の研修でディープラーニングの概要と各手法について学ぶことができました。
内容としてはまずディープラーニングの基礎となるニューラルネットワークの構造から学び、ディープラーニングを構成する上で必要な各手法についてまとめてからディープラーニングのフレームワークの一つであるPyTorchを使用して実際に実装していく、といった流れでした。ディープラーニングは現在、目的に応じて様々な手法が考案されていて、どの手法も昨今のAI技術には欠かせないものとなっていますが、詳細に理解するのが難しい技術でもあります。この研修では一般的なディープラーニングの仕組みから実装までを丁寧に教えてもらうことができるので、別データを用意して自分で実装してみることもできますし、ディープラーニングの資格であるG検定の勉強にもなります。
私が入学コース在籍中にディープラーニングを使うプロジェクトはありませんでしたが、ディープラーニングは今後のAI産業の中心技術となっていくことは間違いないので受講してよかったと思っています。ある程度機械学習の知識がある人向けの研修ですが、研修後すぐ実装できる知識まで身に付けることが出来るので、「機械学習の手法はある程度理解しているけどディープラーニングはちょっと…」という方は一度受講してみてはいかがでしょうか。
プロジェクト参画
入学コースでは、私は4つのプロジェクトに参画させていただきました。それぞれ分野が異なり、とても良い経験となったのですが、その中で特に印象深かったプロジェクトを2つ紹介します。
食品メーカーの販売データ分析
入学コースで最初に参画させていただいたプロジェクトで、8か月ほど携わった一番長いプロジェクトでした。このプロジェクトでは、ある食品会社の売上データを集計して月次データとしてお客様に渡しており、月次データから得られる知見や考察を別資料でまとめ、月末のお客様との定例会で話し合っていました。私はその中で知見・考察資料の作成を担当させていただくことになったのですが、初めのうちはまだデータ分析の知識・経験が少ないために、お客様に提示できるだけの知見を見つけ出すのに非常に苦労しました。またちょうどこの時期にCOVID-19が大流行したことで巣ごもり需要が高まり、業界全体の売上も落ちていました。これにより、月ごとのデータ推移から傾向を読み取るのが出来ず、この減少がCOVID-19による減少なのか、それとも他に要因があるのかという判断が難しくなり、これが知見を見つけ出すのをより困難にしていました。しかし、メンターやプロジェクトメンバーの方と相談しながら活動していく中で分析データの集計手法の知識だけでなく、業界のドメイン知識やデータを俯瞰的に捉える力なども養うことができました。
さらにこのプロジェクトではアプリの会員情報を利用した顧客分析も担当させていただきました。こちらの分析も非常に興味深く、
「ある年代の男性はある食品を多く購入する傾向がある」
「ある地方に住んでいる学生はある飲料を全く買わない」
といった知見を明らかにすることができ、お客様にとって今後のキャンペーン施策などの重要な情報として提示することができます。この分析もプロジェクトメンバーと相談を重ねながら行うことで最終的にお客様に納得いただける結果となり満足しています。
この分析業務を通してたくさんのことを学びましたが、特に大事だと感じたのが自分の立てた仮説・知見が正しいものか相談する、ということです。自分で分析して導き出した仮説・知見が単なる知識不足やデータの見落としによる間違ったものであることはよくあります。また、お客様が納得できるような知見である必要もあります。私もプロジェクトメンバー内の打合せの際に指摘をいただき、直すことが何回もありました。データ分析は業態が変わると必要な知識も大きく変わってしまうため、常に複数人数で打合せ・相談できる体制を整えておくことが重要であると感じました。
電気事業者の需要予測
これは入学コースの最後の1か月半ほど参画させていただいたプロジェクトで私の中では一番忙しいプロジェクトでした。このプロジェクトでは、機械学習を用いずに熟練者によって作られた計算方法による予測モデルが既にあり、それよりも高い精度の予測モデルを、機械学習を活用して作成するものでした。このプロジェクトでは分析だけでなく、キックオフから最終報告までを主体的に経験することができました。経験したことの無い内容が多く不安もありましたが、今となってはプロジェクトの最初から最後までの流れを体験することができる良い機会だったと感じています。このプロジェクトではほぼ毎日メンバーの方と打合せがあり、その都度相談することができたため自分の分析の問題点などを指摘してもらうことができ、成長することができたと感じています。
このプロジェクトを通して私が特に成長できたと感じたのは分析結果を説明するスキルです。どんなに良い分析ができてもお客様にうまく伝えることが出来なければその後の施策につなげることもできません。今回のプロジェクトでは機械学習で精度の高い予測をすることが目的だったため、施策まで盛り込む必要はありませんでしたが、その代わり機械学習による予測の利点やより高精度にするための工夫など、お客様に有用だと思ってもらえるように心がけることでお客様に喜んでいただくことができました。分析するための知識はもちろん必要ですが、相手に納得して喜んでもらえるような伝え方のスキルを身に付けるのもデータサイエンティストになる上で必要であり、このプロジェクトからそのスキルを学ぶことができました。
資格取得
入学コースに在籍中は各種研修、プロジェクト参画に加え、空いた時間にAI・データ分析に必要な資格の勉強も行いました。在籍中に私が取得した資格は「統計検定2級」「Python3エンジニア認定データ分析試験」「G検定」の3つです。
統計検定は私がNECアカデミー for AI に入学してから半年後くらいに取得しました。データに基づいて客観的に判断し、問題を解決するスキルが身に付くということで、データ分析を仕事としている人はほとんど持っているといえる資格になります。私の場合は入学時のメンターとの面談で2級までは取得しようということで話をしていました。統計学の知識が全くなかったので3~4か月ほど勉強してなんとか取得することができました。
Python3エンジニア認定データ分析試験は統計検定を受験した2か月ほど後に取得しました。この試験を受験した理由は、データ分析においてPythonが有効なツールとして広く活用されている現状から、この試験によりPythonによるデータ分析のスキルを身に付けられるのではないかと思ったからです。内容としてはPythonを用いたデータ分析の基礎的な問題で、私の場合は入学コースでPythonを使用するプロジェクトに参加していたので1か月ほどの勉強で取得することができました。
G検定は試験日の関係もあり、入学コースの修了直前に取得しました。この検定はディープラーニングの知識を事業に活用していく能力を測る検定であり、機械学習の各手法からAIの最近の技術まで、幅広い知識を身に付けることができます。AIの最新の情報や法律が出題されるので、参考書だけでなく、ネットなどで常にAIに関するニュースについてアンテナを張っておく必要があります。G検定に関しては範囲が広かったこともあって4か月ほど勉強しました。
私の場合、入学コースの前半は割と時間に余裕があったため自主学習や試験勉強に多く時間を費やすことができましたが、後半になってくると時間的にプロジェクトの割合が多くなってきて試験勉強に費やせる時間もなくなってくるので、入学コース在籍中に資格を取ろうと考えている人はなるべく早めに取得しておくことをお勧めします。
NEC Analytics Challenge Cup
NEC Analytics Challenge CupとはNEC主催の分析コンテストで2020年からはNECグループだけでなく、NECアカデミー for AIの連携大学・企業の方も参加しています。私はNECグループ外の人間でしたが、入学コース在籍中は参加が可能だということで腕試しにと思って参加しました。私が参加したのは予測精度コンテストというもので、過去の人口動態データを用いて、2019年7月の繁華街(新宿駅 西口・東口周辺)における全年代・全性別の平均滞在人口の予測精度を競うというものでした。コンテストはグループでの参加も可能でしたが私は一人で参加したため、特徴量の選択からモデル作成手法の決定、精度評価まですべて自分の力のみで行う必要がありとても大変でしたが、とても良い経験になったと思っています。最終的に上位に入賞することはできませんでしたが、精度を向上させるための様々な手法を知ることが出来たのは大きな成長だったと感じています。
おわりに
今回コラムにした内容は入学コースのほんの一部で、私自身この他にも様々な体験を通して成長を感じることができました。
入学コースは1年間の長期コースなので、入学しようか、あるいは社員を入学させようか迷っている方にとって、この記事が背中を押すきっかけになれば幸いです。