Japan
サイト内の現在位置
Data Science Fes 2019 企業講演「様々な業界と協奏し社会を変える! NECのデータサイエンティストの仕事」
開催日:2019年11月16日 場所:TKPガーデンシティお茶の水 登壇者:NEC AI・アナリティクス事業部 長城沙樹
「データサイエンス・AI」の活用や働き方をテーマにしたフォーラム「Data Science Fes 2019 Student Academy ~次代のキーワード “データ”が創る 社会とキャリアを知る一日~」が2019年11月16日、神田駿河台のTKPガーデンシティお茶の水で開催された。当日はデータサイエンスやAIを学んでいる学生に加えて、社会変革やイノベーションに関心がある、データに関連する仕事や働き方に興味がある、これからデータについて学びたいといった幅広い層の参加者が数多く来場し、場内は熱気に包まれた。
企業講演では、NEC AI・アナリティクス事業部の長城沙樹が、データサイエンティストの仕事を自身の経験を交えて紹介したほか、NECのデータサイエンティストとして働く魅力、そして社会人と学生との関連と違いなどについて講演。入社して1年半というキャリアの中で体験した事例に参加者は興味深く聞き入り、終了後は予定されていなかった質疑応答まで行われた。
データサイエンティストは、どんな仕事をする人?
長城は筑波大学で統計や機械学習といった情報学の基礎を学んだのち、同大学院に進学して自然言語処理やSemantic Webについて研究。2018年にNEC入社後はAI・アナリティクス事業部データサイエンス部に所属し、データサイエンティストとしてデータ分析や顧客に提案した企画の検証業務などに携わっている。
講演の冒頭、長城はNECにおける自分のキャリアを紹介したのち、次のような質問を参加者に投げかけた。
「みなさん、データサイエンティストってどういう職業だと思いますか?」
参加者のとまどう様子を見た長城は、このように続けた。
「実を言うと、データサイエンティストはまだ明確な定義がない職業です。データサイエンティスト協会によると、“データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル”と位置付けられています。一見したところでは理解した感じになりますが、実際はまるでわからないという雰囲気になりますよね」
理解したと言いながら、まるでわかっていない。そんな男女のイラストを提示しながら展開したユニークな説明に場内の雰囲気が一気にやわらぐ。そのうえで、長城はNECが考えるデータサイエンティストの定義を端的に示した。
「データサイエンティストとは、AI活用を『ゆりかごから墓場まで』ともに歩む人材のことだと考えています。ここからは、データサイエンティストの仕事の流れを、順を追って説明します。AI活用は、お客様がどんな業界に属しているのか、どんな課題を抱えているのかを調べる『調査』からはじまります。調査により見えてきた課題をAIでどのように解決するかを考えて提案するのが『企画』で、その企画にお客様が合意すると、提案したモデルは本当に課題を解決できるのかを『検証』します。検証結果をお客様に理解していただけたら課題解決モデルをAIシステムとして『導入』し、お客様がAIシステムを『活用』できるまで見届け、さらにアフターフォローまで行います。こうした一貫した流れをお客様とともに歩むのがデータサイエンティストです」
データサイエンティストの仕事内容がよくわかる説明に、多くの参加者が深くうなずく。ここから長城は、NECのデータ分析案件の進め方について話を進めた。
「データ分析案件を最初から最後まで見守るには、先ほど説明した調査・企画・提案などを行うビジネス力、データ分析を行うデータサイエンス力、そしてプログラミングによりシステムを構築できるデータエンジニアリング力が求められます。しかし、これら3つのスキルを高度に兼ね備えたスペシャリスト人材はそう多くありません。そこで、NECではこうしたスキルをもつ複数のメンバーが連携して、データサイエンティストとして活動しています」
長城が担当するのは主に企画から検証にかけてのフェーズで、「コードを書いたりグラフを検証したりするのが80%、お客様の元に出向いて面談するのが15%、そして残りの5%は自由な活動を行っています」と自身の働き方について説明した。
お客様と密に連携して最適なAIモデルを提案する
続いて長城は、入社後に体験した事例について紹介した。取り扱ったのは、新エネルギーとして期待されるシェールガス・オイル業界の案件だった。
「シェールガス・オイルは、2000年ごろから北米などで注目されている新エネルギーの一つです。掘ったら出てくるといった単純なものではないため、開発と仕上げ方法の組み合わせが膨大になるという課題がありました」
課題を把握したNECは、異種混合学習を用いて解決策を導く方法を提案した。異種混合学習は、多種多様なデータから複数のパターンを自動で場合分けして、状況に応じた最適な規則性を選択する、同社独自のアルゴリズム技術だ。
「たとえば、特定日にコンビニエンスストアでおにぎりが何個売れるかという予測モデルをつくる案件があったとします。この場合、その日が平日か休日かで状況は大きく異なります。また、当日の天候も大きな影響を与えます。こうした傾向を自動的に場合分けして、高い精度で生産量を予測するのが異種混合学習です。シェールガス・オイルの案件では、100項目以上におよぶ井戸開発・仕上げデータを異種混合学習に入力して、生産量の予測モデルをつくるプランを提案しました」
しかし、いかに適切なモデルを提案しても、顧客にとって使いにくい状況になることもあると長城は続けた。
「そこで大切になるのが顧客と密に連携することで、どこを改善すればよりよいモデルになるのか、しっかりコミュニケーションを重ねることを第一に考えています」と力強く話した。
多様な業界のお客様とともに案件に取り組むのがNECの魅力
ここで、「ところで…」という文字がプロジェクターに大きく映し出された。
「この中にNECの製品を使っている人はいますか」と長城が問いかけるものの参加者からは手が上がらず、「全然いないですね」と苦笑する長城。ここからNECという会社の説明へと展開する仕掛けだ。
「現在、NECは家電製品づくりなどを行っていないので、みなさんには身近でない会社になっていると思います。ですが、NECはさまざまな業界と一緒に課題の解決に取り組んでいます」
ここから、自動車・電力・製造・通信・水産の各業界とNECが連携して課題に取り組んだ事例が紹介された。過去の事例に基づいてデータサイエンティストの仕事ぶりが具体的に提示されたことで、参加者の姿勢が前のめりになる。各業界との連携事例のプレゼンに続いて行われたのは、「こんなこともやっています!」というイレギュラーな仕事の紹介。ここで長城は、前述した仕事の配分率でいうところの5%にあたる“自由な活動”の紹介を行った。
「近年はデータ分析のコンペティションがたくさん開催されています。私が参加したのは、『KDD CUP 2019』という世界的なコンペのAUTO ML部門でした」
AUTO ML部門は、データを入力すると高精度で予測するAIをつくるという課題にデータサイエンティストが取り組むコンペ。ここで長城は世界11位という見事な結果を残した。データサイエンティストとして世界に飛躍できる実績を披露したことで、参加者の中にぴりっとした空気が流れはじめた。
「ここではNECが多様な案件をさまざまなお客様と取り組む事例を紹介しましたが、このような仕事のやり方を選択する会社は決して多くありません。私がNECに入社しようと考えたきっかけがまさにこの部分で、製造、マーケティング、小売といったさまざまな業界のお客様のデータを分析できるのは、データサイエンティストにとって大きな魅力であると考えています」
社会人に大切なのはお客様の課題解決を第一に考えるビジネス力
最後のテーマとして長城が取り上げたのは、社会人と学生との関連と違いだった。
「社会人と学生とで大きく異なるのは『ビジネス力』だと思います。学生は自分の研究が主軸になりがちですが、社会人になるとお客様の課題解決がもっとも大切です。とくに、次の言葉は身に染みています」
そう説明したうえで長城が示したのは、「AIを使って運用できるサービスをお客様に提供するときの指標は、必ずしも精度だけではない」という言葉だった。
「たとえば、コンビニで品物を販売する予測モデルを考えるとき、お客様は絶対に欠品を出したくないといった要望を出されることがあります。このように指標は企業や案件ごとに存在するので、高い精度だけを求めてモデルをつくってもうまくいかないことが多いのです。ここが社会人と学生の大きな違いで、どんな指標を盛り込んでモデルをつくるのか、お客様と密接に連携しながら進めることが大切になります」
NECに入社してまだ1.5年という若手ながら、データサイエンティストとして着実に実績を挙げている長城だが、プログラミングをはじめたのは大学生になってからだそう。そして、データにふれるのは研究室に配属された4年生になってからだったと話す。
「データを使う仕事をしてみたいと思うようになったのは、データ分析やデータベース研究などを行う研究室に入ってからです。とくに最近はスマホなどを使って個人が気軽にデータを発信できる世の中になっています。そうしたデータを分析して社会に還元することで、社会がよりよい方向に進んでいくのは面白いと考えるようになりました」
学生時代にはふれることのできなかった企業データなどを使って分析作業に取り組むデータサイエンティストは魅力的な仕事だと長城。「いまの仕事にはとても満足しています」と講演を締めくくると、参加者から温かい拍手が湧き起こった。
AUTO ML部門で世界11位を獲得したコンペの詳細を教えてほしい
講演終了後は予定になかった質疑応答が行われた。そのうちの2つを紹介する。
長城さんが11位を獲得したAIコンペの内容について、もう少し詳しく教えてください。
長城
「私が参加したのは、データを入力すればデータサイエンティストが行うような業務を自動的に肩代わりするAIをつくるというコンペでした。お客様から渡されたデータをそのまま入力して予測モデルをつくるのは簡単ですが、その中には通常と異なるデータが含まれています。そのような異常データを排除するとともに、渡されたデータを加工して新しいデータを作成する『データの前処理』、実際にモデルを作成する『学習』、そして新しいデータから予測する『予測』。この3種類の作業を自動で行うAIをつくる、というコンペでした」
AIが自動的に異常データを排除できるようになれば、データサイエンティストの仕事がなくなると考える人もいます。そうした意見に対して、どのようにお考えですか?
長城
「データサイエンティストの仕事で重要なのは、お客様がどんなことに困っているかを把握し、AIを使っていかに解決するかを考察するところです。この部分をAIが実行するのは難しいので、人間のほうに強みがあると私は思います。単純な分析タスクはどんどん自動化される可能性がありますが、データサイエンティストの仕事は単なる分析タスクにとどまらず、もっと広いもの、まさに“ゆりかごから墓場までお客様に寄り添うもの”と考えていますので、これからもデータサイエンティストの仕事を続けたいと考えています」