コロナ禍にあって、さまざまな変化が生じています。ネガティブな変化も多いですが、そうした中だからこそ生まれる新しいしくみもあります。多くのイベントがオンライン開催になる中、聴覚障害がある方に字幕を見せるような試みも行われています。 今回紹介するSpeech to Text Webcam Overlayはブラウザ上に移ったWebカメラの映像の上に、テキスト認識した文字列を表示するソフトウェアです。

Speech to Text Webcam Overlayの使い方

こんな感じで文字列を表示できます。この文字列は音声をテキスト認識した内容です。

認識精度は高いです。Google ChromeのWeb Speech APIを使っています。

右側に寄せたり、テキストの色を変更できます。

他にもさまざまなオプションが用意されています。

Speech to Text Webcam OverlayはWeb Speech APIを使っていますので、利用できるブラウザが限定されます。今のところGoogle ChromeやEdge(おそらくChromium版)が対応しているようです。Webカメラの映像ソースとしては使えませんが、画面共有を使えばよさそうです。

Speech to Text Webcam OverlayはJavaScript製のオープンソース・ソフトウェア(Creative Commons)です。

Speech to Text Webcam Overlay 1heisuzuki/speech-to-text-webcam-overlay: Web Speech API で音声認識した結果の字幕をWebカメラ映像に重ねて表示するWebページ