サイト内の現在位置を表示しています。

状況把握・対処自動化による指令台及びコンタクトセンター業務の高度化

Vol.77 No.1 BluStellar特集 BluStellarが牽引するDXの未来 ~AI・セキュリティ・データマネジメント・モダナイゼーションで拓く価値創造モデル~

本稿では、公共安全分野の指令台及び企業・団体のコンタクトセンターの業務効率と有効性を向上させる生成AIソリューションを紹介します。本ソリューションは、オペレーター業務従事者のパートナーとして機能します。公共安全分野においては、緊急通報を受けるオペレーター向けに状況評価・ケース分類・記録作成といった重要業務を自動化します。また、指令員には推奨アクションの提示を行います。更に、コンタクトセンターの分野では、オペレーター向けに通話内容のリアルタイム分類、コンプライアンス違反検知、ガイド付きトラブルシューティング支援を提供します。本ソリューションの導入により、人手作業の負荷軽減、ヒューマンエラーの最小化、さまざまなインシデントや顧客対応に対する迅速かつ高精度な応答が可能となり、事業成長と業務成果の向上が期待できます。

1. 背景

現代社会の急速な変化のなかで、さまざまな分野の組織において、これまで以上に効率的かつ効果的な運用が強く求められています。特に公共安全分野では、通報がますます複雑かつ多様化しており、変革が求められています。同様に、企業・団体のコンタクトセンターでも、厳格なコンプライアンス遵守を維持しつつ、多様な顧客課題に対応するという大きな課題に直面しています。こうした対応の膨大さと複雑さは、オペレーター業務従事者(以下、オペレーター)に大きな負担をかけ、十分な業務対応レベルの維持を困難にしています。このような状況下では、従来の手作業や人の判断力に大きく依存した方法では、対応速度の遅れやヒューマンエラーの発生が起きやすくなるという課題がありました。こうした課題に対し、生成AIエージェントは、人の代替ではなくパートナーとして解決を支援します。生成AIは人と協働しながら、定型業務の自動化、リアルタイムなインサイトの提供、高度な提案を行うことで、オペレーターがより効率的に働き、適切な意思決定をし、より複雑かつ高付加価値な業務に集中できるよう支援します。本稿では、公共安全分野の指令台及び企業・団体のコンタクトセンターにおいて、人の能力を拡張し、それぞれに特有の業務課題に対応しつつ、事業成長を促進する生成AI活用ソリューションについて詳しく解説します1)-4)

1.1 指令台

公共安全の現場は日々進化しており、緊急か否かを問わず、公衆衛生やメンタルヘルス、犯罪といった複数の領域にまたがる事案が増えています。このような複雑化は、過大なプレッシャーのなかで、状況評価・記録作成・リソース配備を迅速かつ的確に行う必要があるオペレーターや指令員に大きな負担を与えています。また、従来の手書きによるメモや経験則に頼った判断では、対応の遅れ、ヒューマンエラーの発生により、重大な対応の遅延につながる恐れがあります。本生成AI活用ソリューションでは、こうした課題に対し、オペレーターに向けては、状況評価・ケース分類・記録作成のリアルタイム支援に加え、通話中における必要情報の自動記録で支援します。同時に、指令員に向けては推奨アクションを提示し、最適なリソースを迅速かつ的確に動員できるよう支援します。

1.2 コンタクトセンター

企業・団体のコンタクトセンターは、お客様対応の最前線に立ち、迅速かつ正確な解決が求められる多様な技術課題に対応しています。このプロセスの効率性は、お客様満足度やロイヤルティに直結します。主要な課題としては、「多様な問い合わせの一貫した分類」「コンプライアンス違反の早期検知」そして「複雑な問題解決のワークフローにおいて、オペレーターを適切に導く能力」が挙げられます。本ソリューションでは、オペレーターとスーパーバイザー双方の対応力を高めることを目的に特別に設計されています。オペレーター向けには、通話内容を自動で分類し、お客様の不満を検知して次に投げかけるべき最適な質問を提示することで、問題の根本原因を効果的に絞り込み、解決までのプロセスを加速します。スーパーバイザー向けには、従業員による機密情報の誤った共有などのコンプライアンス違反をリアルタイムで検知し、即時に介入して是正措置を取れるよう支援します。この二重のアプローチにより、通話対応はより効率的かつ一貫性をもって行われ、社内ポリシーの遵守も確実になります。

2. 本システムの概要とアーキテクチャ

本システムは、公共安全分野や企業・団体の現場において、オペレーターの対応力を高めることを目的に設計された包括的なヒューマン・イン・ザ・ループ型の生成AI基盤です。図1に示すように、このアーキテクチャは発信者からの音声入力をリアルタイムに処理し、情報を統合して、オペレーターに実用的な推奨事項や要約を提供します。これらは、組織内外のナレッジベースと連携しながら、専門処理を実行する複数のAIエージェントが協調して動作することで実現されます。

zoom拡大する
図1 システムアーキテクチャ

このアーキテクチャは、発信者からの音声入力をシステムの生データとして取り込みます。音声ストリームは音声認識AIエージェントに渡され、会話がテキスト形式に書き起こされます。この書き起こしデータが後続の処理における主要な入力となります。

テキスト化された入力は、コア処理パイプラインに渡されます。まず、情報抽出AIエージェントが書き起こしテキストから「主要なエンティティ」「事実」「関連性」を特定・抽出します。例えば公共安全のコンテキストでは、「発生場所」「事案の種類」「関与人数」「特別な要件」などの情報が抽出されます。抽出された情報はワーキングメモリに格納され、進行中の通話における動的なコンテキスト情報として保存されます。

次に、コンテキスト検索AIエージェントがワーキングメモリにアクセスし、2つの重要なデータソースと連携します。1つは「分類・状況評価記述データベース」で、事案分類のためのあらかじめ定義されたカテゴリや、状況評価のための体系的な枠組み(例:状況評価モデル)を構えています。もう1つは「外部ナレッジデータベース」で、地理情報、過去の事案ログ、技術仕様などの情報を提供し、コンテキストを補足します。検索AIエージェントは抽出済みの情報を基に関連知識を取得し、それらも一時的にワーキングメモリに格納して、より充実したコンテキストを構築します。

ワーキングメモリに統合されたコンテキストは、状況評価AIエージェント及びインシデント要約AIエージェントによって利用されます。ここがシステムの意思決定の中核に当たります。統合情報に基づき、AIエージェントはリアルタイムで状況評価(例:状況ラベル)を生成し、インシデントの一次要約を作成します。このプロセスには図中の破線で示される「グラウンディングと検証」のステップが含まれており、システムからのアウトプットをあらかじめ定義されたルールや事実と照合することで、精度を確保し、もっともらしく見えるが誤った情報を生成してしまう現象であるハルシネーションの状況を低減します。

最終的なアウトプットには、状況評価に関する推奨事項や説明、そして要約が含まれ、オペレーターに提示されます。このヒューマン・イン・ザ・ループ設計は極めて重要です。オペレーターはシステムのアウトプットを確認し、必要に応じてフィードバックを行い、最終的な判断を下します。このフィードバックループにより、システムは継続的に学習・改善を重ねることができます。最終的に検証済みの情報はログ・アーカイブに送られ、履歴管理が行われます。これにより処理サイクルが完了し、すべてのデータが将来の分析や学習のために適切に記録されます。

本稿で提案するシステムの中核は、人間の協働を模倣したマルチAIエージェントネットワークであり、それぞれのAIエージェントが固有の認知タスクを専用に担います。図2に示すように、このネットワークは「情報抽出AIエージェント」「推論・計画立案AIエージェント」「スマートメモリAIエージェント」という3つの主要AIエージェントで構成され、相互に連携しています4)5)。このアーキテクチャにより、各コンポーネントが互いの成果を基盤として統合的に機能し、オペレーターに包括的かつインテリジェントなソリューションを提供します。

zoom拡大する
図2 マルチAIエージェントネットワーク

情報抽出AIエージェント:これはシステムの「耳」と「目」に当たり、生の非構造化データを取り込み、構造化された形式へ変換する役割を担います。このAIエージェントの主な役割は次のとおりです。

  • 音声データから書き起こしたテキストを元に主要な情報を特定・分類し、氏名、場所、事案の種類、タイムスタンプといった重要なエンティティを抽出します。こうして得られた構造化データが、ネットワーク全体の処理に不可欠な入力となります。

推論・計画立案AIエージェント:これはネットワークの「頭脳」に相当し、情報を分析して意思決定を行う役割を担います。情報抽出AIエージェントから構造化データを受け取り、複雑な認知タスクを実行します。このAIエージェントの主な役割は以下の2点です。

  • データを推論してパターンを特定し、状況を評価し(例:状況評価レポートの生成)、通報の根本的なニーズを把握します6)
  • 次に取るべきステップを計画し、オペレーターに対して次の質問を提案したり、指令員に最適なリソースを推奨します7)。この推論と計画の能力こそが、システムのリアルタイムでのプロアクティブな支援を実現する原動力となります。

スマートメモリAIエージェント:これはネットワークの「中枢神経系」に相当し、動的に共有されるナレッジベースとして機能します。その役割は推論・計画立案AIエージェントが短期的なコンテキストと長期的な知識の両方にアクセスできるようにすることです。構成要素は次のとおりです。

  • ワーキングメモリ:短期記憶として機能し、進行中の通話における一時的なデータを保持します。これによりシステムはコンテキストを維持し、通話の前半部分を参照することが可能になります。
  • 長期メモリ:システムの永続的な知識ストアであり、外部ナレッジベースや、通話分類、状況評価記述といったあらかじめ定義された情報を保持します。スマートメモリAIエージェントは、このストアから関連情報を検索・取得し、推論・計画立案AIエージェントのアウトプットをグラウンディングする役割を担います。これにより、ハルシネーションの発生を抑制します5)

これらの専門AIエージェントの統合ネットワークにより、すべてのデータが適切なタイミングで、適切なコンポーネントによって処理され、強力かつシームレスなワークフローが実現します。これにより、人間のオペレーターの対応力は飛躍的に向上します。

3. コア技術の説明

本ソリューションの成功を支えているのは、モジュール化され、高度に統合されたコア技術スタックです。第3章では、リアルタイムデータ処理からインテリジェントな意思決定に至るまで、システムの高度な機能を実現するために連携して動作する主要技術コンポーネントについて説明します。更に、AIエージェントのアーキテクチャと、コンテキスト理解やプロアクティブなアクションを推進するうえでの協調的な役割について掘り下げます。

3.1 コア技術1:音声認識

NECは音声認識技術の黎明期から研究開発と事業化に取り組み、対話型の音声認識という困難な課題にも一貫して挑戦してきました。行政機関での会議の自動書き起こし技術を開発し、会議録作成の効率化を実現する商用ソリューションを展開する8)とともに、裁判員裁判の支援9)や、コンタクトセンターの業務の支援10)にも活用されています。

近年、ディープラーニングの急速な進展により、音声認識技術は大きな革新を遂げました。認識精度は飛躍的に向上し、現在では人間の聴取能力に匹敵すると評価されています。NECも最新のディープラーニング手法を活用して音声認識技術を進化させ、「NEC高性能音声解析(NEC Enhanced Speech Analysis)」11)(以下、NEC音声認識)として事業支援サービスに商用展開しています。

NECは、「実務で利用可能な音声認識」を実現するために独自技術を開発してきました。ビジネス会話の認識を実用レベルに引き上げただけでなく、職場環境における雑音への対応や話者の識別も可能にしています(図3)。次は、これらの技術の主要な特徴について詳述します。

zoom拡大する
図3 NEC音声認識技術

(1)ディープラーニング活用による精度向上

NEC音声認識は、最新のディープラーニング技術を活用し、音声信号の特徴抽出からテキスト文字列への変換までを高精度に行います。従来、音声処理・言語処理それぞれに深層学習を適用したうえで統合していたものを、音声からテキストへの系列変換に適した単独のニューラルネットワークに置き換え、End-to-End型の訓練手法により全体を最適化することで精度を高めました。更に、逐次処理可能な認識アルゴリズムの開発やニューラルネットワークの計算量削減など、音声認識処理の軽量化も行い12)、待ち時間の短い「リアルタイム」でのテキスト出力を実現しました。

(2)ビジネス会話への適応

NEC音声認識は、ビジネス環境特有の会話において高い精度を実現しています。交渉や会議などの専門的な場面で頻繁に用いられる話し言葉のスタイルやビジネス特有の表現に対応するため、NEC音声認識では大規模な会議録音データセットを構築しました。このデータセットを活用して音声認識システムを学習させることで、認識精度は大幅に向上し、実際のビジネスアプリケーションに適用可能な水準を達成しました。

更に、ビジネス会話では特定の業界や専門分野に固有の用語が頻繁に登場します。こうした領域固有の用語に対応するため、 NEC音声認識では運用マニュアルやプレゼンテーション資料などの関連資料を音声認識システムに直接組み込めるカスタマイズ機能を開発しました。このアプローチの有効性は、ライブ放送における字幕生成シナリオを対象とした実証実験を通じて確認されています13)

(3)業務環境への適応

NEC音声認識は、多様な業務環境への適応性を高める機能を備えています。具体的には、認識精度に影響を及ぼす周囲の雑音を低減するため、さまざまな種類のノイズを効果的に抑制するノイズフィルタを開発しました。ディープラーニングを活用することで音声抽出の精度を向上させ、認識パイプラインの前処理ステップとして組み込んでいます。更に、リモート会議における音声圧縮による品質劣化に対しては、前述の会議録音データセットを用いた訓練により対応しています。

また、複数話者が参加する会話において「誰が何を発言したか」を正確に特定することも可能です。この機能は、個人の声の特徴に基づく生体認証技術である「話者認識」を利用しています。NECは、自然な会話のなかでも話者を識別できる技術を開発しており、米国国立標準技術研究所(NIST)による第三者評価において認証精度95%を達成しています14)

3.2 コア技術2:コンテキスト理解

本システムの運用効果は、会話のコンテキストをリアルタイムで理解・活用できる能力にかかっています。これを実現するのが、「情報抽出AIエージェント」と「スマートメモリAIエージェント」という2つのコア技術コンポーネントです。これらのAIエージェントが連携し、非構造的な会話データから構造化された実践的なインサイトへと変換することで、一般的な生成AIモデルが抱えていた本質的な限界を克服しています。

従来の情報抽出手法では、明示的なキーワードをそのまま抽出するだけでしたが、NECのアプローチでは情報抽出AIエージェントを採用し、発話中に明確に表現された内容を超えて、暗黙的な情報や、リクエストの根底にある意図まで抽出し理解できるよう設計されています。明示的な抽出にのみ依存すると、コンテキストの理解や外部データへのアクセスが必要なケースでは「情報が得られません」といった回答に陥る課題がありました。

本ソリューションは、図4に示すように、マルチステップかつAIエージェント主導のワークフローを実現することで、この課題に対応しています。例えば、オペレーターが「インシデント #200-001 の状況は?」といった質問をした場合、システムは単に通話記録から直接的な答えを検索するだけではなく、次のような高度なプロセスを実行します。

  • リクエストの特定:まず、AIエージェントがオペレーターの真のニーズ(この場合はインシデント状況の更新依頼)を正確に把握します。
  • 特定情報の抽出:インシデントID(#200-001)のようなキーとなる識別子を抽出します。
  • データベース照会:抽出したIDを用いて、外部データベースに自動的に問い合わせを行います。
  • 関連データの取得:該当インシデントの「現在のステータス」や最終更新時刻といった、必要なデータポイントを取得します。
  • ステータス統合:取得した情報を統合し、分かりやすく意味のあるステータス更新情報としてオペレーターに提示します。
zoom拡大する
図4 情報抽出AIエージェント

このAIエージェント主導のワークフローにより、システムは単に「情報が得られません」と答えるのではなく、「インシデント #200-001 は継続中です。現場には消防隊3が到着しています。最新の更新はCEST(中央ヨーロッパ夏時間)2:15で、3階から煙が確認されたとの報告です」といった包括的な回答を提供できるようになります。これを実現する主な要素は次のとおりです。

  • 領域ナレッジに基づく指示理解:AIエージェントは公共安全やITサービスといった領域ごとの専門用語、業務プロトコル、コンテキストを熟知しているため、リクエストの意図を的確に解釈できます。
  • 柔軟なフォーマット提示:求められる情報を指定された、読みやすく分かりやすいフォーマットで設定できるため、オペレーターに明瞭で実用的なデータを確実に届けることができます。
  • AIエージェント主導抽出ワークフロー:論理的で多段階のプロセスでリクエストを処理することで、人間の専門家に近い理解度と応答力を実現しています。

このように、情報抽出AIエージェントは高度な関数呼び出し機能を持つ「専門特化型LLM(Large Language Model)」として動作します。文字起こしされたテキストを処理する際、単に内部ナレッジに頼るのではなく、まず氏名や日付、インシデントIDなどの重要なエンティティを特定します。それらをパラメータとして事前定義された関数を実行し、外部データベースやシステムと連携します。例えば、オペレーターのリクエストを理解したうえで、特定のデータベース関数(例:get_incident_status(id))へAPIコールを自動的に発行できます。このように関数呼び出しと外部データ取得をエージェント自身が自律的にオーケストレーションできることで、単なるテキストベースの応答を超えた、包括的でデータドリブンな回答を提供することが可能となります。この多層的なアプローチにより、高精度かつ関連性のある情報をオペレーターへ確実に提供できます。

最終的に、情報抽出AIエージェントは専門的なアシスタントのように機能し、通話をリアルタイムで「聴き取り」ながら要点を記録し、抽出した情報をオペレーターへ提示します。更に、氏名や電話番号などの重要なデータを既存のデータベースと自動的にリンク付けすることで、記録作業や情報検索の効率化も実現します。

スマートメモリAIエージェントは、情報抽出AIエージェントの基盤的な機能を発展させる形で、システムが効果的に推論を行うために不可欠なコンテキストと長期的な知識を提供します。情報抽出AIエージェントが通話からリアルタイムに非構造化データを抽出・整理するのに優れているのに対し、スマートメモリAIエージェントは、その情報を永続的かつ特定の業務領域に特化したナレッジベースによってグラウンディング(補強)します。この2層構成のアプローチにより、システムは発話内容をその瞬間に理解するだけでなく、より広く正確なコンテキストと関連付けて把握します。その結果、オペレーターに対して信頼性の高い、根拠に基づいた推奨を提示できるようになります。

特に、標準的なLLMには「短期的かつ限定的な記憶」という根本的な制約があります。そのため、長時間の会話ではコンテキストを維持したり、指示を一貫して守ったりすることが難しい場合があります。スマートメモリAIエージェントはこの課題を解決するために設計されており、AIエージェントが業務ナレッジを効果的に記憶・管理・活用できるようにします。

図5に示すように、スマートメモリAIエージェントは、ナレッジマネージャーと短期・長期メモリコンポーネントを統合した構成となっており、主に以下のような利点を提供します。

  • 信頼性の高いビジネス志向の成果:永続的なナレッジベースを活用することで、企業知識に基づいたアウトプットを生成し、事実誤認や「ハルシネーション」の発生を低減します。
  • 組み込み型ナレッジの活用:企業固有の情報や業務タスクを知識として埋め込み・展開でき、AIエージェントの動作を常にビジネス目標と整合させることができます。
  • 自己管理とスケーラビリティ:AIエージェントが自身の知識とコンテキストを管理できるため、過度なエンジニアリングを必要とせず、さまざまなユースケースに容易にスケールさせることが可能です。
zoom拡大する
図5 スマートメモリアーキテクチャ

これらの利点を実現するために、スマートメモリAIエージェントのナレッジマネージャーには、次の機能が備えられています。

  • 領域特化データを用いて業務知識を体系的に抽出・拡張することができます。
  • 「納品物に個人情報を含めないこと」といった明示的な指示(ディレクティブ)を設定し、それに基づいて推論を行う編集可能な推論機構(Editable Reasoning with Directives)を実現します。これにより、AIエージェントの動作は常にコンプライアンス及び業務要件に即したものとなります。
  • ワーキングメモリと長期メモリを統合的に運用することで、AIエージェントは変化する知識から継続的に学習し、常に最新かつ関連性の高い情報を維持することが可能です。

このように、スマートメモリAIエージェントは、LLMとナレッジベース間の情報の流れを統括的に管理するオーケストレーターとして機能します。本エージェントは、高度なメモリ管理システムを活用し、会話内容を常時監視しながら、新たな情報を保存すべきタイミングや既存の知識を参照すべきタイミングを判断します。このシステムでは、通話中に保持される短期的なコンテキスト情報をワーキングメモリに、一方で長期的な業務知識を長期メモリに格納することで、それぞれの役割を明確に区別しています。スマートメモリAIエージェントは、長期メモリに蓄積された情報から最も関連性の高いデータを索引・検索し、LLMの応答がコンテキストに即しているだけでなく、事実に基づき、あらかじめ定義された業務ルールに沿ったものとなるようにします。このように、異なるメモリ構成要素をシームレスに統合・管理する能力によって、LLMが本来抱えるメモリの制約を克服し、長期間にわたる対話や大規模な知識に基づく推論を可能にしています。

情報抽出AIエージェントとスマートメモリAIエージェントの連携動作により、本ソリューションのコア技術が形成されます。これにより、「状況評価」「スマート記録作成」「通話分類」の3つの主要機能が実現します。両AIエージェントが連動することで、会話という生データを行動可能な知見へと変換し、オペレーターの判断力と対応力を大幅に強化します。

  • (1)
    状況評価機能 : 2つのAIエージェントの連携機能は、正確な状況評価を実現するうえで不可欠です。情報抽出AIエージェントは、高度な関数呼び出し機能を活用し、通話から通報者の位置情報、インシデントの内容、明示的に言及された脅威などの重要なリアルタイムデータを抽出します。抽出されたデータは即座にスマートメモリAIエージェントに引き渡され、同エージェントが、長期ナレッジベースに格納された状況評価フレームワークなどの構造化された評価モデルにアクセスし、これらの要素を体系的に評価します。評価結果は既存の手順やガイドライン化されたプロトコルに基づいて適切に基盤付けられます。このプロセスにより、システムはリアルタイムで状況スコアとその説明を生成し、オペレーターに対して、コンテキストに関連性が高く、かつ事前に定義された指針に基づくデータ駆動型の評価を即座に提示します。この迅速な状況評価機能は、システムが備える精緻な記録機能によって補完され、正確なドキュメンテーションを可能にします。
  • (2)
    スマート記録作成機能:スマート記録作成機能は、2つのAIエージェントの継続的な相互作用によって実現されています。通話の進行に合わせて、情報抽出AIエージェントは音声入力をリアルタイムに解析し、氏名、電話番号、住所、インシデントの詳細などの主要情報を自動的に書き起こし・抽出します。抽出された情報は、スマートメモリAIエージェントのワーキングメモリに動的に格納され、単なる通話の全文記録ではなく、抽出した情報を構造化された形式で整理されます。これにより、手作業によるメモ作成プロセスを自動化し、常に簡潔・正確・検索容易なノートを維持できます。その結果、通話内容に即したプロフェッショナル品質の要約が会話の進行とともに自動的に生成され、オペレーターは対話に集中できるようになります。更に、この機能は単なる記録作成にとどまらず、通話内容の背景にある意図や状況の把握にも優れています。
  • (3)
    通話分類機能:通話分類においても、両AIエージェントは同様に協調して動作します。まず、情報抽出AIエージェントが通話内容を解析し、主題や関連キーワードを特定します。この初期的な解析結果はスマートメモリAIエージェントに引き渡されます。スマートメモリAIエージェントは、長期メモリ内の包括的な通話カテゴリ一覧(例:「顧客不満」「IT障害」「メンタルヘルス問題」など)を参照します。情報抽出AIエージェントから受け取った情報をこれらの定義済みカテゴリと照合し、全体のコンテキストを考慮して通話内容を高精度に分類します。このプロセスにより、通話が適切にルーティングされ、初期段階から適切な対応手順が自動的に起動されることで、業務効率と応答速度が向上します。

結論として、情報抽出AIエージェントとスマートメモリAIエージェントの相互補完的な連携により、コンテキスト理解を支える強固なフレームワークが構築されます。情報抽出AIエージェントはリアルタイムで音声会話などの非構造化データを構造化データへ変換する知覚エンジンとして機能する一方、スマートメモリAIエージェントは長期的な知識及びコンテキスト認識を提供する認知基盤としての役割を果たします。この2つのAIエージェントによるデュアルアーキテクチャは、状況評価、ケース要約、通話分類といったシステム出力を、単なるキーワード抽出に基づくものではなく、業務知識に裏打ちされ、人間のやり取りの微妙なニュアンスにも対応した高度な分析の成果として生成することを可能にします。

3.3 コア技術3:アクション意思決定

コア技術の最後の要素は「推論・計画立案AIエージェント」であり、他のAIエージェントによるコンテキスト理解を「実行可能なアクション」へと変換する役割を担います。このAIエージェントは、動的な環境における従来のルールベースシステムの柔軟性不足と意思決定プロセスの説明性の欠如という2つの主要課題に対応します。高度な推論能力を活用することで、推奨されるアクションが常に適時であるだけでなく、その意思決定の経緯が説明可能かつ正当化されることを保証します。

推論・計画立案AIエージェントは、図6に示すように、3層構造のインテリジェントな意思決定アプローチを通じて、これらの課題解決を実現しています。

zoom拡大する
図6 推論・計画立案AIエージェントのアーキテクチャ
  • (1)
    常識的推論(コンテキストの理解):最も基礎的なレイヤでは、AIエージェントは常識的推論を用いて通話における人間的コンテキストを理解します。これは単なるキーワード抽出を超えるものです。例えば、「助けてください!父が倒れて意識がありません。息をしていないと思います」という訴えを受けた際、AIエージェントはこれらのフレーズを総合的に解釈し、「医療的緊急事態が発生している」という広い状況を把握します。このレベルの推論により、システムは会話に込められた暗黙の意味や、緊急性を的確にとらえ、最重要事項、つまり「発信者の父にただちに医療的対応が必要であること」、を優先的に認識できるのです。
  • (2)
    マルチモーダル推論(データ種別の統合):次のレイヤでは、AIエージェントは多様なデータソースを統合し、インシデントの全体像を把握します。これは単なる理解から、「情報に基づく意思決定」へと進むための重要なステップです。AIエージェントは、最初の会話データだけでなく、以下のような追加情報も組み合わせます。

    • 地理空間データ: GPS情報や明示された住所を活用し、正確な場所を特定。これにより、最寄りかつ最適なリソースの派遣が可能となります。
    • ログデータ:タイムスタンプやログ情報を取り込み、インシデントの発生時間や経過時間、応答時間を追跡することで、迅速な対応を確実にします。
  • (3)
    複雑推論(状況とアクション):これは最も高度なレイヤであり、AIエージェントが意思決定の推奨を行い、その理由を説明する段階です。複雑推論を用いることで、AIエージェントは出来事や行動の依存関係や、領域固有の制約条件を把握します。例えば、車両手配のタイミングや医療プロトコル開始の有効性、即時対応(例:心肺蘇生法)が実施されなかった場合の結果予測を評価します。

初期症状の認識から推奨アクションの決定までの一連の論理的プロセスは、完全に説明可能です。システムは自らの推奨の根拠となったデータやその分析プロセスを遡って追跡することができ、「なぜ特定のリソースを出動させたのか」「どの要素が意思決定材料として考慮されたのか」を明確に監査できる痕跡として提示します。この透明性によって現場のオペレーターとの信頼関係が築かれ、推奨内容の迅速な確認や、必要に応じた修正も容易になります。

このように、推論・計画立案AIエージェントは、高度な意思決定エンジンとして、多段階・反復的なプロセスで動作します。単一の大規模モデルではなく、複数の特化型LLMやツールを活用する「オーケストレーター」として設計されています。計画処理モジュールにより、例えばインシデント全体対応のような複雑なタスクを、一連の小さく管理しやすいサブタスクへ分解し、核サブタスクごとに高度な推論処理モジュールを用いて実行可能なアクション候補を生成します。その後、それらのアクションを外部ツール群(データベースや各種システムと連携できるツール)を呼び出しながら検証・実行します。このプロセスは継続的なループとして繰り返され、AIエージェントはワーキングメモリから現状を把握し、計画を立て、アクションを実行し、新たな情報でワーキングメモリを随時更新します。このサイクルは内部ロジックで制御されると同時に、スマートメモリAIエージェントによる最新のコンテキスト情報で絶えず洗練されていきます。そのため、発信者からの新情報や交通状況の変化といったリアルタイムの変動にも柔軟に適応し、常に最適かつ説明可能な推奨決定を維持することができます。

情報抽出AIエージェント、スマートメモリAIエージェント、そして推論・計画立案AIエージェントの協調フレームワークにより、システムは「次の質問予測」と「アクション提案」という2つの主要な運用機能を実現しています。これらの機能は、本システムが単なる情報処理を超え、能動的かつ意思決定を支援する振る舞いへと進化していることを示しています。

  • (1)
    次に問うべき質問の予測 : 3つのコアAIエージェントが連携することで、次に問うべき質問の予測が可能となります。情報抽出AIエージェントが通話をリアルタイムで解析し、必要な情報に欠落がある場合、そのギャップをスマートメモリAIエージェントのワーキングメモリに記録します。その後、推論・計画立案AIエージェントがワーキングメモリを参照し、常識的・複雑推論によって「的確なリソース派遣には住所情報が不可欠である」と判断します。これにより、「正確な場所はどこですか?」「住所を教えていただけますか?」など、次に問うべき質問を複数パターンでオペレーターに提案します。このプロアクティブなガイダンスにより、オペレーターは正しいプロトコルに沿って、必要な情報を漏れなく・効率よく収集できます。
  • (2)
    アクション提案:このアクション提案は、本システムの統合アーキテクチャによる最も直接的な成果です。まず、情報抽出AIエージェントが患者の症状やケース種別などの初期データを抽出します。次に、スマートメモリAIエージェントがこのデータを長期的なナレッジで補強し、関連するプロトコルや運用ガイドラインを検索・反映させます。最終的に、推論・計画立案AIエージェントがマルチモーダル推論を行い、抽出情報とリアルタイムの状況や車両の稼働状況なども統合したうえで複雑推論を行い、さまざまなアクションの結果を見極めます。このプロセスによって、最適かつ説明可能な推奨案を導き出します。推奨案は、根拠となる理由(なぜこのアクションが選ばれたかという説明)とともにオペレーターに提示されるため、オペレーターは状況を包括的に理解しながら、迅速かつ適切な判断が可能となります。

4. むすび

本稿で紹介した生成AIソリューションは、多様なオペレーターの業務を支援し、その能力を飛躍的に向上させる画期的な取り組みです。本システムは、専門的なAIエージェントと人間の知識・経験が相互に補完し合う協調的パートナーシップを構築することで、従来システムの柔軟性不足や、オペレーターにかかる過度な認知的負荷といった課題を解消します。アーキテクチャは、NEC音声認識技術を基盤とし、情報抽出AIエージェント、スマートメモリAIエージェント、推論・計画立案AIエージェントが連携して機能することで、リアルタイムなコンテキスト理解と知的意思決定を支える包括的なフレームワークを構築しています。

この技術は、実運用において明確な効果を発揮します。公共安全分野の指令台では、迅速かつ正確な状況評価、効率的なスマート記録作成、及び通話分類の自動化を実現し、通常時・緊急時を問わず、より的確で迅速な対応を支援します。企業・団体のコンタクトセンターにおいては、次の質問予測による迅速な問題解決や、アクション推奨による最適な対応判断を支援します。更に、複雑推論、常識的推論、及びマルチモーダル推論といった高度な推論技術を統合することで、推奨内容の精度と信頼性を高めるとともに、判断根拠を明確に説明できる説明可能性を確保し、人間による監督性を維持します。

本生成AIソリューションは単なるツールではなく、人間の能力を拡張し、エラーを減らし、業務効率を高める変革的なパートナーです。ルーティンタスクの自動化とデータドリブンな洞察の提供により、人間の専門職は共感力・批判的思考力・迅速な意思決定といった複雑で繊細な業務に集中できるようになり、その結果、さまざまなカスタマーサービスでより高品質な成果を生み出すことが可能になります。

参考文献

執筆者プロフィール

シュティラ ティモ
NEC Laboratories Europe
主任研究員
岩井 孝法
NEC Laboratories Europe
Assistant General Manager
森部 正二朗
AIソリューション統括部
ディレクター
岡部 浩司
データサイエンスラボラトリー
プロフェッショナル
山本 仁
データサイエンスラボラトリー
プロフェッショナル
ホン チェチェン
NEC Laboratories Europe
シニア・リサーチ・サイエンティスト