聴覚障害者への情報保障を実現する音声認識技術
今年、「第25回夏季デフリンピック競技大会 東京2025」(略称:東京2025デフリンピック)が開催されることに伴い、さまざまなシーンで音声認識技術の導入が進んでいる。聴覚障害者への情報保障の観点から見る音声認識技術の可能性について、アドバンスト・メディアと日本聴導犬推進協会が行ったプレスセミナーから解説していく。
音声認識技術の普及が実現する
ろう者・難聴者への情報保障とは
2025年2月27日、アドバンスト・メディアは日本聴導犬推進協会と共に「ろう者・難聴者の情報保障の手段としての音声認識〜日常生活における音声認識を活用した情報取得の重要性について〜」と題したプレスセミナーを実施した。情報保障の観点から普及が求められる音声認識技術について、本セミナーの内容を踏まえて紹介していこう。
デフリンピック開催に伴い
音声認識技術への関心が高まる
2025年11月15日から26日にかけて、ろう者・難聴者のための国際スポーツ大会「第25回夏季デフリンピック競技大会 東京2025」(略称:東京2025デフリンピック)が開催される。このデフリンピックの開催や、2025年9月13日から21日に開催される「東京 2025 世界陸上競技選手権大会」(略称:東京2025世界陸上」の開催を契機に、東京都は都庁の総合案内をはじめとした38施設に、音声認識を活用した字幕システムを導入した。会話をリアルタイムに文字に変換して透明ディスプレイに表示することで、聴覚障害者の理解を助けるだけでなく、多国語での表示に対応するため、海外から訪れた観客などの日本語理解も助けてくれるツールだ。
こうした国際イベントの開催に伴って、現在ろう者や難聴者の情報保障の手段として、音声認識技術への関心が高まっている。今回のプレスセミナーもこうした背景を踏まえて実施されたもので、音声認識がろう者や難聴者の情報保障にどのように貢献しているかが紹介された。
音声認識技術について、アドバンスト・メディアの取締役 事業本部長 大柳伸也氏は「AIが音声、特に人間の音声を認識してデータ化する技術を指します。身近な利用シーンとしてはスマートスピーカーやスマートフォンに話しかける音声検索にこの技術が活用されています。ビジネスシーンにおいては議事録の作成や、コンタクトセンターでの通話記録などで利用されることが多いですね」と語る。
こうした音声認識技術は、ろう者や難聴者のサポートにも活用されている。例えば冒頭に紹介したような、透明ディスプレイへの字幕表示だ。市役所や鉄道の窓口に設置され、職員の発話をテキスト表示することでコミュニケーションをサポートする。透明なディスプレイにより、相手の表情や口の動きを読むことが可能になる。
また音声文字変換アプリとして「UDトーク」や「こえとら」といったアプリも登場している。UDトークにはアドバンスト・メディアの音声認識エンジンが採用されており、日常会話のサポートなどに利用されている。そのほか、テレビなどの字幕や、会議での会話をリアルタイムに表示するような場面など、実にさまざまなシーンで音声認識が活用されているのだ。

10人に1人が聞こえに課題
必要な情報をどう届ける?
こうした音声認識について、ろう者や難聴者はどのような点に利便性を感じているのだろうか。本セミナーに登壇した日本聴導犬推進協会 事務局長 兼 常任理事を務める水越みゆき氏は「一つ目に、音声で発音したことがすぐに文字として表示されるため、リアルタイムに情報取得ができる点があります。筆記で説明されるケースもありますが、書く時間を要するため発話によるコミュニケーションよりも時間がかかります。また読みにくい字であったり、書くことをお願いする手間や罪悪感も軽減できます。二つ目に、手話を利用できない人に対してもスムーズなコミュニケーションが行える点があります。三つ目に、スマートフォンのアプリなどを利用すれば使える手軽さがあります。説明内容などの文字情報を保存して振り返りができる点もメリットといえるでしょう」と語る。
水越氏が所属する日本聴導犬推進協会は、聴覚障害者に必要な音(情報)を知らせる補助犬である「聴導犬」の育成や普及に取り組んでおり、良質な聴導犬を育成し、聴覚障害者の自立と社会参加を支援する活動を行っている。それらの経験から、ろう者や難聴者の現状を次のように説明した。
「厚生労働省によると聴覚や言語障害のある人(身体障害者手帳所持者)の数は約37万9,000人とされています。またこの障害者手帳を所持していない人も含めた聞こえにくさを持つ人は、日本補聴器工業会の『JapanTrak2022』調査報告によると約1,260万人。10人に1人の割合で聞こえにくさを感じていると言われています。この聞こえにくさを持つ人は、例えば片耳だけ聞こえないとか、老人性難聴といわれるような人たちが含まれています」と水越氏は語る。
こうした聞こえにくさを抱える人々の聞こえ方は多様だ。それ故にコミュニケーション方法も、聞こえ方や特性に応じて異なっている。例えば「補聴器」に加え、「手話・手話通訳」「筆談・要約筆記」「スマホ・タブレット端末」「読話」「人工内耳」などが挙げられる。読話は唇の動きから発話内容を読み取るものだ。
水越氏は「この中でも活用者の多い『手話』はろう者コミュニティにおける母語や文化的なアイデンティティの側面を持ち、言語としてろう者に根付いています。一方で言語であるために、取得には時間を要します」と語る。そのため、ろう者と手話が使えない人をつなぐ手話通訳士の存在が求められている一方で、高齢化による担い手不足や、処遇改善が課題となっている。

多様性や社会課題に対して
音声認識技術を活用しよう
こういった多様性や社会的な課題に対して期待されているのが、音声認識技術だ。前述した手話通訳士の不足に対しては、音声認識技術を導入することで会話をテキスト化し、内容理解をサポートできる。リアルタイム文字起こしによって、スムーズなコミュニケーションも支援する。また、手話を使えない人や、補聴器が効果的でない人でも会話が理解しやすいメリットもある。さまざまなデバイスで利用できるため、ユーザーのライフスタイルに合わせた活用が可能だ。
「例えば会議や教育現場などのシーンにおけるコミュニケーションの補助、駅や病院のアナウンスなどをテキスト化することによる情報アクセスの拡大や利便性の向上といった活用メリットが期待できます。他者と平等に情報にアクセスすることを可能にし、意見を表明する可能性を広げるため、社会インクルージョンの促進も期待できるでしょう」と大柳氏は語る。
音声認識活用のメリットについて、利用者の視点から水越は「当協会ではイベントを行う際に、手話通訳と音声情報の両方を情報書証の手段として提供しています。手軽で安価に利用できる音声認識は利用頻度が非常に高まっています。また手話と文字を併用できる点から、コミュニケーションの選択肢も広がります」と語る。
聴覚障害者へのサポートとして、アドバンスト・メディアの音声認識技術が採用された事例は数多い。例えば茨城県の取手市役所では、障がい福祉課において同社の音声認識偽実と透明ディスプレイを組み合わせ、聴覚障害のある人や高齢者としっかりコミュニケーションを行える体制づくりを実現している。
聴導犬使用者も、これらの音声認識技術を活用しているという。水越氏は「職場や外出先で使用されています。当協会の利用者に大学の先生をされている方がいらっしゃいますが、ゼミなどで学生とのやりとりを行う場合に音声認識技術を利用されているそうです。また、聴導犬は『聴導犬』のケープを着用しているため、利用者は他者から聴覚に障害があることを分かってもらいやすく、コミュニケーションを行う際に最初から音声認識技術を利用してやりとりを行っていると言います」と語る。日本聴導犬推進協会においても、聴導犬との暮らしを希望する相談者に対して、相談内容の振り返りや情報のすりあわせを行う際に、音声認識技術によるテキスト化を活用しているそうだ。
聴覚障害者のサポートに積極的に活用されている音声認識技術だが、課題もある。話し方によっては認識できない言葉や誤変換される言葉もあるため、認識精度の向上が期待されている。「電子音の認識にも対応してほしいですね。聴導犬は音が鳴っていることを知らせることはできますが、実際にそれが鳴っているのかろう者や難聴者は確認できません。電子音に応じてテキストが表示されれば、生活の質の向上につながるでしょう」と水越氏は語った。
アドバンスト・メディアでは今後、これらの課題に対して音声認識の精度や速度の向上や、対雑音性の強化を進めると同時に、利用者の声を生かしたサービス改善を進めていく方針だ。