サイト内の現在位置

10秒間の顔の映像から脈拍・血中酸素等を高精度に推定
バイタルサイン推定技術

NECの最先端技術

2025年12月19日

病院での診察や年に1度の健康診断の際に測定する脈拍・血中酸素・表面血流等のバイタルサイン。こうした値を日常的に何の負荷もなく、気軽に測定することができれば、自身の体調変化や家族、同僚の異変にすばやく気づくことができるはずです。NECが今回開発したバイタルサイン推定技術は、10秒間の顔の映像からバイタルサインを高精度に推定することが可能。一般的なスマートフォンのカメラで誰でも気軽にバイタルサインを推定できるという本技術について、研究者に詳しく話を聞きました。

スマートフォンのカメラから接触型センサとほぼ同等精度の推定が可能

バイオメトリクス研究所
主任研究員
梅松 旭美

― バイタル推定技術とは、どのようなものなのでしょうか?

梅松:普段私たちは人の顔を見て、今日は調子良さそうだなとか、具合が悪そうだなというように健康状態や心理状態を感じ取っていますよね。バイタル推定は、これを機械でも実現しようとした技術です。10秒間の顔の映像を解析して、脈拍や呼吸、血中酸素、表面血流の最高値・最低値、ストレスに関連すると言われている脈拍揺らぎを非接触で推定することができます。映像については、スマートフォンやタブレットPCについている一般的なカメラで十分です。


赤松:映像のフレームレートは最低で毎秒15フレーム(15fps)、解像度も可能であればフルHD(1,920×1,080ピクセル)くらいあると嬉しいのですが、一般的なスマートフォンで撮影できる映像で問題なく推定することが可能です。


梅松:いま日本国内では約90%の方がスマートフォンを所持(注1)しており、世界でも半分以上の方がスマートフォンを持っている(注2)と言われています。身近なデバイスであるスマートフォンを使うことで、どなたでも気軽に健康状態のチェックができることを目指しました。ウェアラブルセンサからバイタルサインを取得するというアプローチもありますが、これらは着脱や充電の手間が必要です。

10秒という短さにこだわったのも、手軽さを追求したことが理由でした。これまでの技術では30秒から1分待つものが一般的でしたが、それではユーザにカメラの前でわざわざじっと待っていただかなくてはなりません。例えば介護施設などで入居者の方の健康管理を行う際には、毎朝血圧計などのさまざまな医療機器を使ってバイタルサインを測定していますが、ここで10秒スマートフォンに顔をかざすだけで精度の高い参考値がわかれば、オペレーションの大幅な効率化に貢献できるはずです。

日常的生活のなかで負荷をかけず、数値を提示できることで継続的なモニタリングも可能になります。毎朝健康チェックを行う工事現場の作業者や精密作業者、ドライバー、パイロットなどの方々にご利用いただければ、病院や年に一度の健康診断でしか測定できないような値も日々参考値を計測し、推移を見守ることが可能です。従業員の方々のウェルビーイングへの活用が期待できると考えています。


赤松:精度も高いレベルを実現しています。脈拍や呼吸は、医療で用いられる接触型センサで得られる値とほぼ同等のものを推定できます。表面血流は血圧と関連する値なのですが、血圧計が±5mmHg程度の誤差があると言われているなかで、いま私たちの技術は±10mmHg程度の誤差まで迫っています。

映像の輝度・色情報の変化からバイタルサインを推定

バイオメトリクス研究所
特別研究員
赤松 祐亮

― どのようにして映像からバイタルサインを推定しているのでしょうか?

赤松:映像中の輝度や色の変化を見ています。例えば脈拍では、心臓から送り出された血液が顔の血管に流れ込むたびに、顔の映像中の色信号がわずかに変化します。その色変化の周期を分析して、脈拍を推定することができます。


梅松:スマートウォッチなどのウェアラブルセンサを利用したことのある方は、デバイスが緑色の光を放つのを見たことがあるかもしれません。あれは、主に緑色の光の反射率を検知することで脈波に関連する有用な変化を見出せるからで、今回の技術も原理的には同じことをしています。しかし、非接触であるぶん、難易度は非常に高くなっています。


赤松:そうですね。なので、精度を上げるために深層学習を活用しています。接触型の医療機器から得られる数値を正解データとして、映像と対応させるペアを大量につくりながら、精緻にその値を推定していくアルゴリズムをつくり上げていきました。

ここで大きなチャレンジとなったのは10秒という時間です。一般的に、人の脈拍は約60回/分、呼吸は12~20回/分程度です。10秒であれば脈拍は約10回、呼吸は2~3回程度という少ないサンプルから値を推定しなければなりません。30秒~1分ほどあれば回数も安定して精度も良くなっていくのですが、先ほど梅松さんがお話ししたとおり、私たちは短い時間で推定することを目指していたので、この課題に取り組んでいきました。

結果的には、10秒という短い時間のなかでも波形推定の精度を飛躍的に高めることで、この課題をクリアしました。一般的な同様の技術では、心臓から送り出される脈波だけが解析対象となっていますが、今回の私たちの技術では、脈波が末端まで届いたあとに跳ね返ってくる小さな反射波等の波形形状まで解析できるようになっています。これにより、短時間での高精度な推定が可能になりました。

ちなみに、この反射波は、血管が硬いと消失する傾向があるため、将来的には動脈硬化の検知に活用できる可能性もあると考えています。

誰でも、いつでも、どんな機種でも使えるように徹底して調整

― 正解データに近づけていったということですが、データはどのように集めたのでしょうか?

梅松:そこが今回NECのアセットやノウハウが活かされた点であり、一番大変だった点と言っても過言ではないかもしれません。NECやグループ会社の従業員に参加を呼び掛けるほか、広く一般の方からもモニタを募集しました。


赤松:結果的に、一般的なオープンデータセットの10倍くらいのデータを学習してモデルをつくっています。本技術はさまざまなユーザに使っていただくことを目指していますので、大規模なデータ学習が不可避でした。デバイスにインストールすれば、どなたでもすぐに、高い精度を享受できるようなものにするために、バイアスなくさまざまな方のデータを学習してモデルの汎用性を高めています。


梅松:NECは世界No.1(注)の顔認証技術を保有していますが、その研究過程で培ってきたデータ収集のスキームやノウハウがあります。実際、今回は顔認証チームと合同でデータを取得したときもありました。20代から80代の男女の皆さんに広くお集まりいただき、さまざまな国籍の方々にもご協力をいただきました。顔とバイタルの情報を取得するわけですから、倫理的にも細心の配慮が必要です。こうした点にも気をつけつつ大量のデータを安全に集めるという点は、本技術を実現するうえでの最初の難関でした。これは、NECという会社が信頼されているからこそできることでもあったと思います。


赤松:一方で、人によるバイアスの問題だけでなく、カメラの種類による問題もありました。デバイスの機種によって撮影される映像にはそれぞれ癖があるので、こうした個別性にも対処する必要があったのです。例えば、あるスマートフォンのインカメラでは顔をキレイに映すために、私たちが取得したい情報を消してしまう傾向があったりします。そこで、同じシーンを撮影したカメラAで出力された脈波とカメラBで出力された脈波を使づけるように学習をさせたりすることで、どのようなカメラでも精度よく推定できるようにしていきました[1]。


梅松:デバイス間の性能差の検証では、チームの古川さんに貢献いただきました。呼吸は李さん、脈拍揺らぎは宇佐見さんに一部担当いただくなど、チームメンバー全員で推定できる指標を作っていきました。そのおかげもあって、本技術は世界最大規模のテクノロジー展示会CES 2024において、Innovation Awards Honoreeを受賞しました。


赤松:それぞれのバイタルサインの推定技術は、難関ジャーナル誌や難関学会でも認められています。心拍と呼吸はIEEE Journal of Biomedical and Health Informaticsに採択されました[1]。血中酸素もIEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2023で採択されています[2]。

  • 注:
    米国国立標準技術研究所(NIST)による顔認証ベンチマークテストでこれまでにNo.1を複数回獲得
    <URL>https://jpn.nec.com/biometrics/evaluation/index.html
    ※NISTによる評価結果は米国政府による特定のシステム、製品、サービス、企業を推奨するものではありません。
  • [1]
    Y. Akamatsu, T. Umematsu, H. Imaoka: “CalibrationPhys: Self-supervised Video-based Heart and Respiratory Rate Measurements by Calibrating Between Multiple Cameras”, IEEE Journal of Biomedical and Health Informatics, vol.28, no.3, pp.1460-1471, 2024.
  • [2]
    Y. Akamatsu, Y. Onishi, H. Imaoka: “Blood Oxygen Saturation Estimation from Facial Video via DC and AC components of Spatio-temporal Map”, in Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp.1-5, 2023.

顔認証との連携や他のバイタル情報や心理状態の推定も視野に

― 本技術には、今後どのような可能性があるでしょうか?

梅松:気軽に短時間でバイタルサインを観測できるという点をさらに追求して、スマートフォンを持っている方であれば、いつでもどこでも簡単に健康チェックができる世界を目指したいと思っています。

長期スパンで考えると、医療機器としての許認可を目指すことも視野には入るとは思います。しかし、医療機器となると、扱える範囲が病院などの医療機関に限定されてしまいます。私たちとしては、もっと幅広く多くの方々に使っていただきたいというのが、現在の想いです。というのも、世界を見渡せばスマートフォンとネットワーク環境はあるものの、近くに医療施設がないような地域も多く存在しています。そういった場所にも本技術を活用することができれば、社会的な問題の解決につながるはずです。はじめのステップとしては、世界中の人の健康を支えるツールとして広く役立てられることを目指していきたいと考えています。

また、将来的には顔認証との連携も考えています。例えば顔認証の入場ゲートで数秒立ち止まっていただく間にバイタルサインも推定できれば、日常生活に何の負荷もなく体調管理を組み込むことができます。スマートフォンやパソコンの顔認証のロック解除時でも使えるかもしれません。そのためには、より短い時間での推定を実現していく必要がありますから、さらなる技術の向上を目指して研究開発に取り組んでいきたいと考えています。

一方で、本技術単体で精度を増すだけでは限界があると思っています。たとえ、スピーディかつ高精度に血中酸素や表面血流の最高値と最低値がわかるようになっても、それだけでは魅力的なサービスとして展開できません。推定結果に応じて何かレコメンドをしたり、さらに健康になるための示唆を与えたりするようなシステムもつくり上げていく必要があると感じているところです。

昨年度はコンビニエンスストア様にご協力をいただき、本技術を搭載したスマートフォンを店内に置いてバイタルサインを推定する実証実験を行いました。例えば、脈拍揺らぎはストレスに関係する数値なので、ストレスが高めと考えられる値が出た方にはGABAの入ったチョコレートをおすすめするというようなシステムです。このようなマーケティング分野での運用も視野に入っています。NECの幅広い事業のなかで、多くの方々の健康な生活に寄与できるようなサービスをさまざまな角度から考えていきたいです。


赤松:私は、技術的なところで、もっと精度を上げていくことは変わらず追求していきたいと考えています。加えて、もっと幅広い数値を推定できるようにもしていきたいですね。例えば、血液から得られる情報には、血糖値やコレステロール、脂質などさまざまなものが詰まっています。先述のとおり動脈硬化が進むと脈拍の波形形状に特徴が出ますし、血糖値も血液の粘り気に関わるものなので、映像のなかに特徴が表れるはずだと思っています。本技術には、こうした血液検査をしないとわからないような数値も測定できるポテンシャルがあると考えていますので、さらなる可能性を追求していきたいと考えています。

左から、古川さん、宇佐見さん、李さん、赤松さん、梅松さん

一般的なスマートフォンに搭載されているカメラで撮影する顔の映像から、脈拍・呼吸、血中酸素、表面血流の最高値・最低値、脈拍揺らぎを高精度に推定する本技術は、10秒間という短い時間の映像から解析できるところにNECならではの大きな特長があります。一般的な技術では30秒~1分間の映像から得られる情報を分析することではじめて安定した推定結果を出すことができますが、本技術では10秒間の脈波の形状を詳細に分析。大量のデータを活用した深層学習に基づき、これまでセンシングすることができなかった反射波(心臓から送り出された血流が末端から跳ね返ってくる脈波)さえも解析できるようになったことで、脈拍や呼吸は、医療で用いられる接触型センサで得られる値とほぼ同等の精度を実現しました。この他、カメラの機種ごとの特性を学習することで、モデルの汎用性を高めています。

誰でも手軽に、特別なデバイスやアクション不要でバイタルサインを推定できるようにすることで、世界中の人々の生活に溶け込み、健康の維持・向上やウェルビーイングに貢献することを目指しています。

  • 本ページに掲載されている内容は、公開時の情報です。

お問い合わせ