サイト内の現在位置

NEC、日本テレビとAI音声認識技術を活用し生放送番組において自動で字幕を付与する実証を実施

~音声認識モデルに放送用語を学習させることで、認識精度99.0%を実現~

2023年6月20日
日本電気株式会社

NECは、日本テレビ放送網株式会社(以下、日本テレビ)とともに、日本テレビの生放送番組「ストレイトニュース」(注1)において、自動で字幕を付与する実証を5月末に実施しました。本実証は、NEC独自のAI音声認識技術を活用したDX支援サービス「NEC Enhanced Speech Analysis-高性能音声解析-」(注2)を用いて実施しました。NECは、本サービスの音声認識モデルに放送用語を事前に学習させることで、認識精度99.0%という高い精度を確認できました。(注3)

背景

放送業界では、聴覚に障がいのある方やテレビの音が聞こえにくくなった方にも必要な情報が正しく伝わるよう、テレビの字幕放送が求められています。しかし、字幕放送を実現するには、人手による手打ち入力が主流になっている他、音声認識システムを利用する場合でも、字幕内容の正確性を確保するため校正者を複数人配置する必要があり、運用負荷が大きいことが課題となっていました。

本実証の概要

NECは、NEC独自のAI音声認識技術を活用したDX支援サービス「NEC Enhanced Speech Analysis-高性能音声解析-」を活用し、本サービスの音声認識モデルにニュース番組でよく使用される地名や人名等の放送用語を事前に学習させることで放送業界向けに特化した音声認識技術を開発しました。
NECは、本技術を日本テレビで日昼に約15分間放送される生放送のニュース番組「ストレイトニュース」で実証したところ、99.0%の認識精度を確認できました。従来の当社音声認識サービスでは認識精度が91.6%となり、放送業界向けに特化したことで7.4ポイントの精度向上が認められました。

また、耐騒音性が求められるスポーツ中継等での活用を視野に、周囲の雑音やBGMによる誤認識を低減するための技術を開発しました。NEC社内における実証では電車内騒音や野外騒音等の騒音が加わった状態でも、一般的に騒音下で利用されている音声認識と比較し最大15.9ポイント高い88.3%の認識精度を確認しています。

NECは、本サービスが活用されることで、放送業界における業務効率化を支援するとともに、すべての人が公平に必要な情報を得られる社会の実現を目指します。

なお、今回の発表にあたり、日本テレビより、以下のエンドースメントを頂戴しています。
収録番組への字幕付与は進んでいますが、字幕の内容の正確性を確保するための運用負荷が高く、生放送に対する字幕については限られた番組でのみ付与しています。生放送字幕制作で音声認識を利用し、正確で、効率的な運用や自動化を目指すには、高い認識精度と処理速度が必要だと考えています。今回、NECのAI音声認識技術を利用した運用を実施しましたが、生放送に活用できる素晴らしい技術でした。今後も放送業務の効率化を図っていくための仕組みを期待しています。

日本テレビ放送網株式会社 技術統括局 放送実施部 古田貴也

以上

  • (注1)
    日本テレビ「ストレイトニュース」:new windowhttps://www.ntv.co.jp/straight/
    日本テレビ系 月―金:11時30分~11時45分、土:11時25分~11時35分、日:11時30分~11時45分 (一部地域を除く)
  • (注2)
    NEC、独自の音声認識技術を活用したDX支援サービスを開発(2022年3月7日発表)
    https://jpn.nec.com/press/202203/20220307_01.html
  • (注3)
    従来の当社音声認識サービスでは認識精度が91.6%となり、放送業界向けに特化したことで99.0%と7.4ポイントの精度向上が認められました。

「NEC Enhanced Speech Analysis-高性能音声解析-」について

本件に関するお客様からのお問い合わせ先

放送局からのお問い合わせ
NEC メディア統括部
E-Mail:sl-mlist@hoso.jp.nec.com

AI音声認識技術に関するお問い合わせ
NEC AI・アナリティクス統括部
E-Mail:nesa@info.jp.nec.com

Orchestrating a brighter world

NECは、安全・安心・公平・効率という社会価値を創造し、
誰もが人間性を十分に発揮できる持続可能な社会の実現を目指します。
https://jpn.nec.com/brand/