生成AI 技術への取り組み 〜基盤から応用、ルール作りまで〜

Vol.75 No.2 2024年3月 ビジネスの常識を変える生成AI特集 ~社会実装に向けた取り組みと、それを支える生成AI技術~

生成AIへの期待が高まるなか、NECは、専門家業務を生成AIで支援する、顔認証や物体認識技術と組み合わせて映像分析業務を自動化する、といった先進的な応用に取り組んでいます。それを支える基盤として生成AI技術自体の改良に加え、業務適用を容易にする技術や生成AIを安心して利用する技術などの関連技術の開発を進めているほか、これらを高速処理するAIスーパーコンピュータも構築しました。また、生成AIソリューションが社会に受容されるために、世界標準に沿ったルール作り、リスク管理手法の開発にも取り組んでいます。本特集では、こうしたNECの生成AI関連活動を具体的な事例を用いて紹介します。

グローバルイノベーションビジネスユニット
上席技術主幹
酒井 淳嗣


1. はじめに

去る2023年は生成AIが広く一般社会に認知され、話題に上った年でした。賢いチャットができるChatGPTが登場し、文書作成、要約などさまざまな利用が広く試されている他、マイクロソフト社やGitHub社は、彼らのオフィスアプリケーションやソフト開発環境に大規模言語モデル(以下、LLM)を載せて、ユーザーの生産性向上を図っています。また、テック企業や研究機関で独自の高性能LLMを開発する競争が熾烈になってきています。

本特集では、LLMを含む生成AIについて、基盤技術から応用開発、更には社会利用の側面まで、NECのさまざまな取り組みを紹介します。

2. 急速に広まる生成AIの市場適用

昨今、ChatGPTの対話的利用、すなわちテキストデータでの利用がしばしば取り上げられていますが、生成AIの利活用はテキストから映像、そしてソフトウェアコードへと広がってきています。これを順に見ていきましょう。

まずはテキストですが、NECでは、汎用的なLLMに業務分野の専門知識を組み合わせることで、これまで専門家にしかできなかった業務をAIで支援する技術を開発しています。例えば、医療用語を学習させたLLMを病院に導入すれば、医師と患者のやり取りを要約し、カルテに記載すべき事項を文章として自動作成できます。サイバーセキュリティ領域では、日々発行される膨大な脆弱性レポートの分析をLLMが肩代わりし、自社ITシステムのセキュリティリスクを容易に判断できるようになります。また新素材や新薬開発の分野では、化学・薬学の論文をもとに新素材の候補をLLMで絞り込むことで、開発期間の大幅短縮に寄与できます。

映像データとLLMの組み合わせは、これから大きく発展が見込まれる領域です。NECでは、得意とする顔認証や物体認識技術を生成AIと組み合わせたさまざまな応用技術を開発中です。例えば、認識結果をもとにLLMにその説明文章を作らせることで、映像分析で人物を認識したうえでその行動や状況を言語化して記録するソリューションが可能になります。更に、認識結果が意味するところをそのシーンに即して言語化することにより、車載カメラの記録映像から交通事故シーンを抽出し、事故調査報告書を自動作成する、という応用技術の開発にも成功しています。また、SNS上にはさまざまな写真が多数アップロードされていますが、災害発生時にそれらのなかから被災状況を写しているものをLLMで対話的に探し出すことができます。これにより被災状況を速やかに確認し、災害初動対応につなげる、という試みも進めています。

こうした先端的な取り組みに加え、NECでは社内の日常業務に生成AIを利用する試行も始めています。2023年5月、社員が業務利用できる社内LLMサービスとしてNEC Generative AI Service(NGS)をスタート、社員自らのアイデアで進捗報告作成や業務目標設定など幅広いケースで利用されています。併せて、秘密情報を含む業務においてLLMを安全に利用するための仕組みや社内ルールも整備しています。

生成AIはテキストだけでなくソフトウェアコードも生成可能で、ソフトウェア生産性を大きく向上させると期待されています。本特集では、NECグループでのソフトウェア・システム開発への生成AI活用の取り組みについても紹介します。

3. 生成AIの可能性を高める基盤技術

NECは2023年7月に独自開発のLLMの開発を完了し、生成AI「cotomi」として既に提供を開始しています。cotomiは性能のわりにサイズがコンパクトで、お客様の業務にカスタマイズして利用しやすい特徴を持っています。cotomiはまた長文にも対応しており、多量の業務文書を扱うのも得意としています。

今後の事業応用に向け、LLM技術の発展の方向は4つあると考えられます。

1つ目は、テキスト以外のデータを扱えるようにすることです。前述のように、映像データを使ったソリューションは今後ますます拡大すると予想され、NECでは映像とテキストを統合して扱える生成AIの基盤モデル(基盤ビジョンLLM)を開発中です。

2つ目は、「ファインチューニング」の改良です。一般に、LLMは汎用的に使える基盤モデルとしてまず作られ、その後、適用先の業務データを使って追加学習させるファインチューニングというカスタマイズ作業を行って業務利用することが通例です。しかし現実には、ファインチューニング用のデータが十分存在しない、あるいは追加学習のために秘密データを開示したくない、というケースがしばしばあります。そこでNECでは、少ないデータから効果的にファインチューニングを行う技術や、データを秘匿したままファインチューニングを行う技術の研究開発を進めています。

3つ目は、プロンプト指示の改良です。LLMを利用する際はプロンプトと呼ばれるテキスト形式でLLMに処理を指示しますが、LLMに与えることができるプロンプトサイズには制限があり、その制限内で効果的に指示を与えるには独特のノウハウが必要でした。そこで、少量のプロンプト指示文から効率的に情報を抽出するなど、プロンプト指示を容易にするための技術開発も進めています。

4つ目は、LLMを安心して利用するための技術です。LLMは学習データを確率的に分析して回答するのみで、その意味を理解しているわけではないため、時折、まったく事実に基づかない回答や、社会的観点から好ましくない回答を出してしまうことがあります。これは、重要な意思決定プロセスでLLMを使う際の大きな懸案事項になっています。NECでは技術側からのアプローチとして、回答の根拠を提示する技術や、回答傾向に社会的偏りがないか評価する手法を開発しています。

こうしたLLM本体及びその関連技術の開発に加え、LLMを高速に実行するための計算機環境の構築にも力を入れています。LLMは複雑かつ巨大なデータ構造からなっており、その性能を発揮させるには、LLMのデータ構造が有する130億個あるいはそれ以上の数のパラメータを最適に調整する必要があります。この調整には膨大な計算資源が必要で、LLMを独自開発する際の大きなネックと言われています。NECは以前よりこの課題を認識しており、LLMを含めたAI研究開発に適したアーキテクチャのスーパーコンピュータ(以下、AIスパコン)を独自に設計、構築してきました。このAIスパコンは2023年3月より本格運用を始めており、前述のcotomiや関連技術の開発を加速する「縁の下の力持ち」として大いに活躍しています。

4. AI技術が社会へ浸透するために

LLMを含むAI技術は、社会を効率化し生活を豊かにすると期待される一方、人間不在で機械的に重要な物事を決められてしまう、犯罪行為にも利用されうる、といったマイナス面も社会で広く指摘されるようになってきました。

NEC社外を見てみると、G7広島サミットではAIの利活用や規制についての世界共通ルールについて話し合われるなど、国のレベルでの議論が進んでいます。NECは従来から通信分野などで国際標準活動にかかわってまいりましたが、AI領域においても、Institute of Electrical and Electronics Engineers (IEEE)や国際標準化機構/国際電気標準会議(ISO/IEC)、欧州電気通信標準化機構(ETSI)などでAIの普及に向けた標準仕様の整備活動に参加しています。

一方、社内では、AIを利活用したNECの事業活動が人権を尊重したものになるよう、「NECグループ AIと人権に関するポリシー」を制定、それに基づいて社内体制や関連規程を構築しています。また「デジタルトラスト諮問会議」の運営を通じ、社外の多様な有識者の方からの意見をAI事業設計に反映させています。

AIがもたらすリスクは技術的にゼロにはできないので、AIを活用したソリューションを作るにあたっては、どのような社会的リスクを持つのか事前評価することが重要です。NECは東京大学との共同研究を通じて、AIリスク管理ツールを試験導入し、その効果を確認しました。この仕組みを今後AIリスク管理サービスとして提供することも検討しています。

5. おわりに

生成AIはこれまでのさまざまなIT・AIソリューションに大きな影響をもたらすと言われ、技術開発と社会応用がかつてないスピードで同時進行しています。本特集では生成AI関連の主に技術面を紹介しましたが、今後も解説記事や展示イベントなどを通じて生成AIに関するNECの取り組みを紹介してまいります。ご期待ください。


  • *
    マイクロソフトは、Microsoft Corporationの米国およびその他の国における登録商標または商標です。
  • *
    ChatGPTは、米国OpenAI社の商標です。
  • *
    その他記述された社名、製品名などは、該当する各社の商標または登録商標です。