2013年11月14日
日本電気株式会社
NECは、アナウンサーの読み方や区切り方、アクセントまでを再現可能な、テキスト音声合成の新製品「CSVIEW/VoiceOperator(シーエスビュ-/ボイスオペレータ)音声合成」を本日から販売開始します。
新製品は、NEC中央研究所の音声合成技術(拡張二段単位選択手法) (
注1)により、従来製品と比較して合成音声作成時のアクセントやポーズの修正といった、より自然な音声にするためのチューニングを約50%削減(
注2)すると共にアナウンサーの抑揚やリズムまで再現します。これにより専門知識を持たない利用者でも、容易に、テキストから、人間の発声に近い合成音声の作成を実現しました。
NECは、IVR(
注3)領域に対し、音声合成製品を導入した多数の実績があります。新製品はこれらの実績を活かし、より人間の発声に近い自然な合成音声を実現することで、コンタクトセンターでの活用に加え、商業施設や公共交通機関、自治体(防災等)のアナウンスやニュースの読み上げなどへ、適用領域を拡大するものです。
新製品の価格(最小構成)及び出荷時期は次のとおりです。
製品名 | 出荷時期 | 希望小売価格 (税抜き) | 概要 |
CSVIEW/VoiceOperator 音声合成ランタイム (高音質版) |
2013/12/2 |
3,500,000円 |
サーバライセンス(注4) |
新製品の特長は次のとおりです。
- チューニング時間の短縮による合成音声導入の容易化
生成した発音記号列に対して、音声データベースと照合し、自動修正を行うことにより、最適なアクセント、ポーズの適用を実現(発音記号列自動修正技術)しました。これにより、専門知識を持たない利用者でも容易に適切な合成音声を作成することが可能になります。
- アナウンサーの読み方を再現した自然な合成音声を実現
従来の機械学習による「音声素片(音声の最小構成要素)」単位の合成音声生成技術に加え、NEC独自の二段単位選択手法により、従来よりも長い、「文節」単位で音声データベース中に蓄積したアナウンサーの抑揚やリズムのパターン・波形を忠実に再現。これにより、自然でバリエーション豊かな音のつながりが可能となり、人間の発声に近い合成音声を実現させました。
- 大規模音声データベースの強化による読み方精度の向上
音声データベースに外来語など、日本語では発音しにくい言葉を追加収録し、より聞き取りやすい音声を実現しました。
また、大規模なテキスト解析辞書において、地名などを最新のデータに置き換えると共に、同じ文字列でも前の単語により、読み方が変わる地名の正しい読みを実現しました。
なお、NECは新製品を、「コールセンター/CRMデモ&コンファレンス2013 in 東京」(
注5)にて、展示予定です。
以上
(注1) 拡張二段単位選択手法は、機械学習にNEC独自の二段単位選択手法と発音記号列自動修正技術を組み合わせたNECの手法。
(注2) 従来製品CSVIEW/VoiceOperator音声合成オプションV7.1との比較、NEC調べ。
(注3) IVR:Interactive Voice Response(自動音声応答装置)
新製品に関する情報
本製品に関するお客様からのお問い合わせ先
NEC システムソフトウェア事業部
TEL:044-431-7583
私たちNECグループは、
「人と地球にやさしい情報社会をイノベーションで実現する
グローバルリーディングカンパニー」を目指しています。
|