ページの先頭です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. ソフトウェア
  3. VoiceGraphy
  4. FAQ
ここから本文です。

VoiceGraphy - FAQ

NECの音声認識

VoiceGraphy全般

VoiceGraphy販売

CSR

NECの音声認識

QNECはいつから音声認識に取り組んでいますか?
ANECは日本における音声認識のパイオニアです。1960年に京都大学様とNECの共同研究から日本の音声認識は始まり、今日まで一貫して研究開発を重ね、音声認識技術・ノウハウを蓄積しています。
QNECの音声認識製品導入のメリットは?
A豊富な自治体・一般企業システム導入実績から実証されるノウハウと、音声認識技術を融合し、効率的で拡張性のあるシステムをご提案します。

一覧へ戻る

VoiceGraphy全般

QVoiceGraphyのコンセプトは?
AVoiceGraphyは議事録の効率的な作成を支援するソフトウェアです。
音声認識精度はもとより、修正・校閲・議事録出力など、運用面を含めた作業全体の効率を高めます。またユーザビリティを重視し、見えない使いやすさを追求しています。
QVoiceGraphyの特長は?
A大きく2点あります。

  • 音声認識エンジンをNEC独自で開発しているため、音声認識エンジンの継続的な強化・サポートが可能です。
  • 使い勝手に着目して設計開発しています。操作ボタンの大きさや配置・利用者の目線の動きなどにも配慮、ユーザビリティを考慮した操作性で、編集作業者の作業負荷軽減を図ります。
Q携帯電話の音声認識とは何が違いますか?
A携帯電話で認識させる音声は短く(10秒程度)で、その音声を通信回線でサーバに送り、数秒後に認識結果を携帯電話に表示しています。 認識誤りがあった場合は、もう一度話し認識させるか、その場で認識誤りを修正します。VoiceGraphyは長時間の会議の音声をパソコン内でリアルタイムに認識します。また、編集ツールを使って、音声を聞きながら書き起こしができます。
携帯電話は、”短文をその場で入力する”、VoiceGraphyは”大量の発言がある会議の議事録作成を支援する”製品で、用途が異なります。
Qどのような会議でも利用できますか?
Aマイクなど音響機器が整い、フォーマルな会議(役員会議・株主総会・決算報告会・議会など)での利用が最も適しています。自由闊達な会議では発言が重なり、音声認識は適しません。
Q英語など外国語対応はしていますか?
A未対応です。
Qどのくらい作業を効率化できますか?
A認識精度・議事録作成者のスキルなどにも依存しますが、通常、テープやICレコーダを聞きながら書き起こしをする場合、 会議時間の6倍(1時間の会議の書き起こしに6時間)かかるといわれています。
VoiceGraphyをご利用いただくと書き起こし時間を1/2~1/3(1時間の会議の書き起こしに3時間~2時間)に短縮できます(既存ユーザアンケート結果より)。
さらに、校閲作業でも早聞き機能などにより効率化が図れます。VoiceGraphyの導入により、外部委託で約3~6ヶ月かかっていた議会議事録公開が約1ヶ月に短縮された事例や、役員会議の要約議事録作成期間が7日から1日に短縮された事例もあります。
Q音声認識の効果を最大限に引き出すポイントは?
Aいかに明瞭な音声を取り込むかがポイントです。明瞭に発言したり、マイクに近づくように意識することで、大きな効果が期待できます。
Q話者の音声を事前に登録する必要はありますか?
A不要です。事前登録なく不特定話者を認識します。認識する話者の数にも制限はありません。
Q認識精度はどのくらいですか?
A会議の内容、発言者の話し方、音響機器などにより異なります。
平均して60~90%程度です。くだけた発言スタイルの場合は低く、議会本会議や役員会議など整然とした発言の場合は90%を超える精度が期待できます。
Q滑舌の悪い人や風邪をひいて鼻声の人が話すと音声認識精度に影響がありますか?
A状況によりますが、不明瞭な発声になる可能性があるので、影響が出るとお考えください。 人間が聞いても聞き取りにくい音声であれば認識精度も低下します。
Q複数の人が同時に話した場合は、どう認識されますか?
A複数名の発言が重なった場合は認識困難です。
Q方言は認識できますか?
Aアクセント、イントネーションの違いであれば認識できます。
なお、「おおきに」と発音した場合、「おおきに」と認識します。「おおきに」と発音して「ありがとう」とは変換されません。
Q同音異義語はどのように変換されますか?
A前後の文脈をみて判断しています。
同じ”コウカ”という言葉でも「学校の”校歌”を歌う」「省エネ”効果”がある」というように、前後の文脈から適切な表記を判断します。
Q「あー」「うー」などの不要語は削除できますか?
Aできます。不要語(フィラー)を自動的に削除する機能があります。削除しない選択もできます。
Qリアルタイム音声認識時、会議終了を待たずに編集作業(書き起こし)ができますか?
Aできます。会議(認識)開始から概ね1分後から編集を開始できます。
Q音声ファイル認識時、認識終了を待たずに編集作業(書き起こし)ができますか?
Aできます。会議(認識)開始から概ね1分後から編集を開始できます。
Q1つの会議の認識結果(議事録)を複数の編集ツールで編集作業できますか?
Aできます。
Q音声ファイル認識で認識にかかる時間はどれぐらいですか?
A音声ファイル認識は、実時間の約2~4倍(※)のスピードで高速認識します。
(※)音声ファイルにより前後する場合があります。
Q学習機能はありますか?
A話者の声の特徴を発話ごとにリアルタイムに自動学習し、自動的に認識精度を向上させる「自動学習機能」を搭載しています。
Q言語モデル3種類の違いは何ですか?
A
  • 議会共通言語モデルは、議会向けです。
  • 役員会議共通言語モデルは、役員会議向けです。
  • 言語モデル(フルカスタマイズ) は、お客様の過去の議事録をもとに、フルカスタマイズで作成します。お客様の専門用語や言い回しが反映されるため、 共通言語モデルに比べてより高い認識精度が期待できます。
Q言語モデル(フルカスタマイズ)はどのように作成しますか?
Aお客様の過去の議事録から作成します。テキストデータで7MB程度(約2500ページ相当)ご提供いただきます。
Q新しい用語は追加できますか?
A単語登録によりお客さまご自身で追加できます。

一覧へ戻る

VoiceGraphy販売

Q製品のデモはどこで見られますか?
ANECイノベーションワールド(品川・関西)にて製品をご覧いただけます。予約が必要です。詳細はホームページをご覧ください。
NECイノベーションワールド
Q価格はいくらですか?
AVoiceGraphyは最小構成で390万円です。詳細は、製品価格ページシステム構成例ページをご覧ください。
QVoiceGraphyの製品構成とライセンスの考え方は?
AVoiceGraphyは下記のソフトウェア製品から構成されています。

  • VoiceGraphy音声認識サーバ:音声を認識し文字に変換します。インストール台数=ライセンス数です。
  • VoiceGraphy編集ツール:認識された文字データを編集します。 インストール台数=ライセンス数です。
  • VoiceGraphyデータ管理サーバ:音声認識サーバ・編集ツールが複数の場合に利用します。音声データや認識結果データを管理します。インストール台数=ライセンス数です。
  • VoiceGraphy言語モデル:言語モデルは3種類(①議会向け共通②役員会議向け共通③フルカスタマイズ)あり択一になります。
    ※①②の共通言語モデルは、音声認識サーバと同ライセンス購入が必要です。
    ③は購入いただいたお客様の複数の音声認識サーバで使用できます。
Qマイクは必要ですか?
Aマイクは必要です。マイクに向かって話したクリアな音声が音声認識に適しています。 ICレコーダ内蔵のマイクで録音したものや、集音マイク(電話会議・テレビ会議用、天井埋込など)の音声は、雑音が多く音声認識には適しません。
Qマイクなどの音響機器の相談はできますか?
A音響機器メーカー様や取り扱い会社様をご紹介させていただきます。

一覧へ戻る

CSR

Q環境に対する配慮はしていますか?
A書き起こし作業の効率化による消費電力量の削減や、VoiceGraphy編集ツールによる作成・校閲作業で、従来より紙の使用量も削減できます。

VoiceGraphyはエコシンボルの認定を受けています。

エコシンボルエコシンボルはNECの定める自己宣言型環境ラベルで、環境配慮基準を満たした商品やサービスに与えられています。 基準の詳細は「NECの環境への取り組み」をご覧ください。

VoiceGraphy 環境負荷評価モデルの詳細はこちら
Q言語モデル(フルカスタマイズ)作成に使用する機密データは、どのように扱いますか?
Aお客さまのご要望に応じて、秘密保持契約を交わすなど、適切に扱わせていただきます。

一覧へ戻る


ページの先頭へ戻る