banner

ブログ

Jul 04, 2023

AI は障害のある人々のアクセシビリティの拡大に貢献します

生活に力を与えるための総合的なアプローチ: AI が障害のある人々のアクセシビリティ状況をどのように再定義するか。

世界保健機関 (WHO) のデータによると、現在 10 億人以上の人が何らかの重大な障害を抱えて暮らしています。 さらに、AI 関連テクノロジーの市場は今後 7 年間で累積評価額が 2 兆ドルを超えるまで成長すると見込まれており、これらの分野の融合がアクセシビリティの新時代の導入に役立つ可能性があると示唆するのは当然です。

AI がその存在感を発揮している重要な分野は、標準的ではない音声で人々をサポートする場合です。 Voiceitt は、AI と機械学習を使用して音声障害のある人々を支援する、アクセシブルな音声認識テクノロジー企業です。

この技術は、非標準の音声パターンを認識して適応するように設計されており、それによってより明瞭なコミュニケーションが可能になります。 この技術は、明確な音声を発することが困難な脳性麻痺、パーキンソン病、ダウン症候群を患っている人にとって特に有益です。

人工知能 (AI) の領域が成長するにつれて、このまだ発展途上のテクノロジーは、さまざまな種類の障害を抱えて暮らす人々の生活の質の向上に役立つ能力を示しています。

Voiceitt の言語聴覚士でカスタマー サクセス マネージャーである Rachel Levy 博士は、コインテレグラフに次のように語った。 したがって、私たちはこのすべての音声データと、独自のモデルに影響を与える個人の音声データを保持しています。」

「これは、テクノロジーが個人の固有の発話パターンから学習し、この情報を使用してその発話を他の人が容易に理解できる形式に変換することを意味します」と彼女は付け加えた。

マガジン: ランサムウェアによる支払いを禁止すべきでしょうか? 魅力的だが危険なアイデアだ

レヴィ氏はさらに、この技術が、特に変性障害を持つ個人の発話パターンの変化にどのように適応するかについて説明した。 したがって、これらの個人がツールを使用する間、Voiceitt はユーザーの音声を録音し続け、ヒューマン アノテーターがデータを文字に起こして認識精度を高めます。 したがって、音声明瞭度の低下がある場合、プラットフォームはそれに応じて適応し、新しい音声パターンを組み込むようにデータ モデルを再トレーニングできます。

Voiceitt にはライブキャプション機能もあります。 この機能により、ビデオ会議通話またはライブ インタラクション中にリアルタイムの音声文字起こしが可能になり、言語障害のある人にとって会話がより容易になります。 レヴィはこの機能をコインテレグラフにデモンストレーションし、この技術がどのように音声をテキストに変換し、ソーシャルメディアや電子メールで共有できるかを示しました。

WHOの2023年の調査によると、22億人以上が何らかの視覚障害を抱えており、そのうち少なくとも10億人は簡単に治療できるとのこと。

AI を活用したイメージング ツールは、視覚データをさまざまな種類の解釈可能な形式に変換することで支援できる可能性を秘めています。 たとえば、OCR.best や Image2TxT などのツールは、視覚的な手がかりを自動的に解読し、テキストおよび音声ベースの応答に変換するように設計されています。

同様に、ChatGPT-4 や Claude 2 などの高度な AI モデルには、画像に含まれる非常に複雑な情報 (科学データなど) を解読し、光学式文字認識ツールで解釈できるプラグインが導入されています。

最後に、AI ベースの画像ツールは、リアルタイムでコントラストを増減し、画像の解像度品質を最適化できます。 その結果、近視や遠視などの症状を持つ人は、視覚能力に合わせて画像の解像度を変更できます。

2023 年第 1 四半期の時点で、WHO は現在約 4 億 3,000 万人が「生活に支障をきたすほどの重度難聴」を患っていると推定しており、これは世界人口の 5% 近くを占めます。 さらに、研究機関は、2050 年までに 7 億人以上、つまり 10 人に 1 人が障害を伴う難聴になるだろうと示唆しています。

共有