潜在的ないじめを音で検知する


いじめは深刻な社会問題の一つです。学校内のいじめだけでなく、職場内のいじめも広まってきています。今回取り上げたのは、ノイズイベントの周波数スペクトル情報を利用して、ノイズイベントが潜在的ないじめまたは改ざんの発生であるかどうかを識別する発明です(US20210327438A1、Soter Technologies)。


深刻化するいじめ問題

文部科学省によると、問題行動・不登校調査で、2020年度のいじめの認知件数が前年度比で約10万件減の51万7163件でした(2021年10月13日発表)。新型コロナウイルス禍で子ども同士の接触機会が減ったことが要因と考えられます。一方、いじめ全体の認知件数が減る中で、パソコンや携帯電話での誹謗(ひぼう)中傷など、いわゆる「ネットいじめ」は増加しています。2020年度は1万8870件で、2006年度の調査開始以来、過去最多を更新。増加幅は特に小学校で大きく、2020年度は前年度から約1800件増の7407件でした。


いじめは、人々や生産性に悪影響を与える恐れがあり、学校生活やビジネス環境では深刻な問題です。職場での口論は、職場環境のリスクを高める可能性もあります。いじめや口論を特定するために、カメラ監視システムが開発されました。しかし、カメラ監視システムは、トイレ、バスルーム、シャワールーム、病室など、プライバシーが優先されるプライベートエリアでは使用できません。同時に、いじめは若者の間でより深刻になり、職場でのいじめは社会的・政治的言説の分裂的な進展によって、より広がっています。いじめやいじめの可能性を効果的に特定するためのシステムの開発が求められています。


音に基づいて潜在的ないじめを識別する

この発明は、音に基づいて潜在的ないじめを識別するための発明です(US20210327438A1、Soter Technologies)。


いじめイベントを検知する全体フローはFig.5です。


  • 時間の経過とともに音のサンプルを検出(510)します。サンプルは、100Hz〜10kHzなどの周波数スペクトルの音に敏感な音検出センサによって検出されます。

  • 音レベル閾値および/または期間閾値に基づいて、音がノイズイベントとして適格であるかどうかを決定する(520)。
  • ノイズイベントは、期間しきい値を超える期間に、サウンドレベルしきい値を超えるサウンドサンプルの特定の数・特定のパーセンテージに基づきます。サウンドレベルがノイズイベント(530)として適格でない場合、操作は終了します。
  • 音がノイズイベント(530)として適格である場合、次ステップ(540)に進みます。音サンプルを処理して、ノイズイベントの周波数スペクトル情報を提供する。周波数スペクトル情報を計算するための技術には、高速フーリエ変換(FFT)が含まれます。
  • ノイズイベントの周波数スペクトル情報と少なくとも1つの周波数スペクトルプロファイルとを比較することに基づいて、ノイズイベントが潜在的ないじめの発生であるかどうかを決定します(550)
  • 比較により、ノイズイベントが潜在的ないじめが発生したかどうかを判断します(560)。音がノイズイベントとして適格であるのに十分に大きい・長いかどうかを識別します。
    1. いじめの発生ではないと判断された場合、操作は終了します。音がノイズイベントとして適格でない場合、そのサウンドは潜在的ないじめの発生として扱われません。音がノイズイベントとして適格である場合、ノイズの周波数スペクトル情報が分析され、さまざまな周波数スペクトルプロファイルと比較されて、それが潜在的ないじめの発生の特徴であるかどうかが判断されます。学習モードからの音を分析して、パラメーターを構成し、周波数スペクトル情報を提供します。
    2. ノイズイベントが潜在的ないじめの発生であると判断された場合、いじめ通知を開始します(570)。いじめの通知は、いじめが発生している可能性があることと、騒音レベルを取得した検出センサの場所を管理者に知らせます。いじめや口論の可能性が特定されると、潜在的ないじめに関与している人に警告を示すことなく、警告またはアラートが登録している管理者クライアントに送信されます。このように、いじめや口論の可能性に関与している人を適切に報告し、後で適切に監督することができます。

いじめではない音(ノイズサウンド)を特定する

この発明のポイントは、いじめ特有の音を検知するのではなく、いじめではない音(ノイズサウンド)を音サンプルとして学習させて、ノイズイベントのしきい値を設定することで、潜在的ないじめを検出するという点です(Fig.4)。


いじめの発生がない場合の学習モードで音のサンプルを用いて、音レベルを決定します。学習モードの音のサンプルは、いじめのない会話を反映し、いじめのない会話をノイズイベントとして学習モードから除外するように、音レベルのしきい値・期間のしきい値を設定します。ノイズイベントは、ある期間にわたってサウンドレベルのしきい値を超えるサウンドサンプルの特定の割合に基づいて識別できます。例えば、ある期間におけるサンプルの20%、50%、100%などのサンプルの別のパーセンテージなどです。


ノイズイベントとして認定するための音レベルのサンプルの特定は、他の要因の中によっても変化する可能性があります。例えば、学校のバスルームに検出センサが設置された場合、トイレの水洗、流水、カジュアルな会話、学校の鐘、建設騒音などをバックグラウンドノイズとし、いじめの可能性のあるイベントとして識別する必要はありません。その他、バックグラウンドノイズには、換気または空調システムからのノイズも含まれます。
この発明では、ノイズイベントが機械によって生成されたノイズ発生であるかどうかを決定するには、ノイズイベントの周波数スペクトル情報が100Hzから10kHzの間の周波数優位性を含むこととしています。


特に、人間の声の周波数スペクトルプロファイルは、一般に機械音の周波数スペクトルプロファイルとは異なります。例えば、100Hzから10kHzの間では人間の声が支配的であり、この範囲外の周波数成分はかなり低くなります。さらに、群衆からの人間の声は、100Hz〜10kHzの周波数範囲、または人間が聞こえる別の周波数範囲で凸状または三角形の形状を示します。対照的に、機械音または機械音は、その周波数スペクトル全体でより均一なプロファイルを持つことができます。したがって、音の周波数スペクトル情報を使用して、ノイズイベントが人間の声に対応するかどうか(すなわち、いじめが発生する可能性があるかどうか)、またはノイズイベントが機械音に対応するかどうかを区別できます。カジュアルな会話、非いじめ会話、音、口論音、流水、トイレのフラッシュ、背景音。



いじめは通常ではない状態です。潜在的ないじめの検出をする際に、通常の音を取り除くという考え方は注目できると思いました。高齢者の見守りにおいては、独居老人の給湯ポットの利用有無で異常状態を検知するのが良く知られていますが、他にも、異変をキャッチするための予兆が表れる身近な情報があるかもしれません。


なお、この発明の出願人であるSoter Technologiesは、高度なセンサとソフトウェアテクノロジーを使用して、環境および社会的インテリジェンスのための革新的なソリューションを開発および提供し、世界をより安全な場所することを掲げており、様々なセキュリティアプリケーションを展開しています。


https://www.sotertechnologies.com/
Invention to Businessデータマップ 特許レポート オンラインショップ