難聴レベルと認知機能レベルを判定する


超高齢社会に代表される社会課題の解決に向け、AI技術の活用が期待されています。今回は、対象者の難聴を判定し、難聴レベルと認知機能レベルの関係を容易に把握することができる発明を取り上げます(特開2021-110895、エクサウィザーズ)です。


超高齢社会と認知症

総務省統計局の最新の発表(総務省統計局 人口推計)によると、2021年9月現在の65歳以上の高齢者人口は3,638万人であり、高齢者人口率は29.1%となりました。2020年発表の高齢者人口は3617万人だったことから、2021年に高齢者人口は2020年の発表より21万人増えたことになります。


認知症の主な要因は加齢にあることから、高齢者人口の増加に伴い、認知症患者も増えます。平成29年度高齢者白書によると、2012年は認知症患者数が約460万人、高齢者人口の15%だったのが、2025年には20%、つまり、5人に1人が認知症になると推計されています。超高齢社会で暮らす私たち誰もが認知症になりうる時代、他人ごとではありません。


総務省統計局 人口推計
内閣府 平成29年版高齢社会白書

難聴と認知機能低下の関係

海外の研究により、難聴は認知症の危険因⼦であることがわかってきています。難聴になると、周囲からの情報量(テレビニュースや会話など)が減少します。その結果、他人の話しが聞き取れない、会話が成立しないなどの経験を繰り返すうちに、話すことが億劫になり、他人との関わりを持たなくなります。そして、だんだん社会との交流が減少し、精神的健康にも影響を与え、認知機能の低下につながっていきます。難聴=認知症ではなく、難聴によりコミュニケーションが少なくなったり、社会との関わりが減ったりすることで、認知機能に影響が出る可能性があるということです。


難聴レベルと認知機能レベルを判定する

高齢になると難聴を発症する可能性が高くなります。また、高齢になると認知機能が低下し認知機能障害になる場合もあります。しかし、認知症と難聴は関連性があるものの、認知症と難聴とを区別することが困難でした。そのため、難聴である対象者が、質問者の質問に正しく回答できない場合に、その対象者が認知症であると誤って判定されてしまうことになります。この発明は、対象者の難聴を判定し、難聴レベルと認知機能レベルの関係を容易に把握することができる発明(特開2021-110895、エクサウィザーズ)です。


難聴レベルの判定

難聴レベルの判定フローは下記の通りです。
図2は対話音声の音声波形の一例を示す模式図です。縦軸は音声信号の振幅、横軸は時間を示します。遅延時間は、対話者の発話の終了時点から対象者の回答の開始時点までの時間です。健常者と比較して、難聴者の場合、遅延時間は長くなる傾向があります。


  • 対象者と対話者との対話音声を取得する
  • 対話音声に基づいて対話者の音声に関する特徴量を抽出する
  • 対話音声に基づいて対話者の発話に対する対象者の回答の遅延時間を算出する
  • 対象者の発話の声量(声の大きさや強さを表す量)、発話内容の具体性、及び発話内容の明確さ、対象者のカメラ画像から抽出した対象者の表情、身振りや手ぶり、対象者の視線などから、対象者の不安レベルを判定する
  • 音声特徴量、回答遅延時間、不安レベルに基づいて対象者の難聴レベルを判定する

図4は対話者の音声の特徴量の一例を示します。
特徴量としては、例えば、パワー、時間、回数、頻度、音声認識難易度などが挙げられます。これらの特徴量は、いずれも音声に含まれる高周波数域の程度を示します。



認知機能レベルの判定

認知機能の判定は図6〜図8に示されるように、DNN(Deep Neural Network:深層ニューラルネットワーク)、RNN(Recurrent Neural Network:再帰型ニューラルネットワーク)、CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)を用い、DNN、RNN、CNNは、健常者及び認知機能障害者と対話する対話者の音声データを含む学習用データを用いて生成されています。



認知機能レベルの補正

難聴レベルに基づいて、認知機能レベルを補正することができます。対象者の難聴レベルが高い場合、難聴の影響で、対象者の認知症レベルが本来の認知症レベルより高く判定されている可能性が高いからです。そこで、難聴レベルが高い対象者の認知機能レベルを低く(軽症に)なるように補正します。

図10は判定結果の表示方法を示します。認知機能レベルに応じて、認知症と非認知症の2つに分け、難聴レベルに応じて、難聴と非難聴の2つに分けています。これにより、判定結果を、非認知症・難聴、非認知症・非難聴、認知症・難聴、及び認知症・非難聴の4つの領域に区分でき、認知症と難聴との関係を容易に識別することができます。補正前の認知機能レベルと、補正後の認知機能レベルとを対応付けて出力することもできます。図10では、補正前では認知症であると判定された対象者は、その対象者の難聴レベルも考慮することにより、認知機能レベルが補正され、認知症ではないと判定されています。このように、対象者が認知症と判定されたが、実際には認知症ではないのか、やはり認知症であるのかを容易に確認することができます。



図11と図12は、対象者の認知機能レベル及び難聴レベルを時系列に表示したものです。実線部分は過去から現在までの実績を示し、破線部分は将来の予測を示します。

図11では対象者は認知症ではないが、難聴レベルが年月とともに徐々に増加していることが分かります。図12では対象者は認知症ではないが、難聴レベルが年月とともに徐々に増加するとともに、認知機能レベルも増加していることが分かります。これにより、対象者の難聴レベル及び認知機能レベルがどのように推移するかを容易に確認することができるので、対象者は、早期に難聴対策及び認知症対策を行うことができます。



この特許情報は、2020年1月15日に出願され、2020年7月29日に特許公報(特許第6729923号)が発行されています。通常は、特許出願された後、一年6か月経過後に公開特許公報が発行され、その後の審査請求を経て、登録された後に特許公報が発行されますが、本件は公開特許公報が発行される前に登録特許公報が発行されている、いわゆる早期審査登録特許です。

Invention to Businessデータマップ 特許レポート オンラインショップ