ITエンジニア/デザイナ向けにオープンソースを毎日紹介

技術 - 音声の記事一覧

プレミアムユーザー限定記事

MOONGIFTプレミアムは、月額500円の有料サービスです。詳細はこちらから

もっと見る

List

  • 2017/06/10

MacAssistant - macOS上で動くGoogleアシスタント

GoogleのAIアシスタント、Googleアシスタントがついに日本語対応します。現在利用できる端末が拡大中とのことです(筆者端末は執筆時点ではまだ未対応です)。Siri以上に優秀と聞きますので、非常に楽しみな技術です。そんなGoogleアシスタントをmacOSでも使えるようにするのがMacAssistantです。##...

List

  • 2017/01/19

MYukkuriVoice - macOSでゆっくりボイスを作る

ニコニコ動画やYouTubeなどの実況動画でよく使われているのがゆっくりボイスです。何とものんびりした口調で、変な抑揚が面白い音声となっています。自分が喋らなくとも良いので、多くの方が利用しています。そんなゆっくりボイスを作り出せるのがMYukkuriVoiceです。macOS用で、任意のテキストを喋らせることができま...

List

  • 2016/10/16

HeySiri macOS - macOS Sierraで使えるHey, Siri

新しいMac OSX、macOS Sierraから搭載されたのがSiriです。スマートフォンと同じように音声を使って処理ができます。しかしキーボードショートカットが必要で、それではコンピュータの前にいる時しか使えません。これは不便だ、ということで作られたのがHeySiri macOSです。Mac OSXでもHey, S...

List

  • 2016/04/12

Voix JS - Webブラウザに音声コマンド機能を追加

スマートフォンやタブレットではボイス入力による音声コントロールが人気です。ウェアラブルや車の運転中による音声操作など、ITの利用範囲が広がる技術となっています。そんな音声コントロールをWebブラウザにも追加してくれるのがVoix JSです。## Voix JSの使い方Voix JSはマイクへのアクセスを許可する必要があ...

List

  • 2015/06/15

Voice Memos – Webベースのボイスメモ

はっと思いついたアイディアは手でメモしている間に忘れてしまうかも知れません。思いついたその時にさっとメモすることができればと思ったことは少なくないでしょう。スマートフォンアプリとしてそういった機能を提供するボイスメモアプリはいくつもあります。しかしもっと手軽に、どこでも使いたいと思うならばWebアプリケーションにしては...

None

  • 2014/12/25

voice-elements – 音声読み上げ、音声入力を簡単にするWeb Components

WebはWeb Componentsによって新しい世界を迎えようとしています。高度な機能、UIが簡単に再利用できるようになれば、どんどん開発ができるようになります。標準で提供されるタグの範囲を超えた機能を簡単に実現できるようになるでしょう。今回紹介するvoice-elementsもWeb Componentsの一つと言...

List

  • 2014/12/16

JuliusJS - JavaScriptだけで音声入力

これまで入力インタフェースと言えばキーボードまたはマウスが中心でした。しかしスマートフォンやタブレットに注目が集まるようになると、もっと別な入力が望まれるようになります。その一つが音声ではないでしょうか。既にSiriをはじめAndroid、iOSで音声入力が取り入れられはじめています。今回はWebだけで音声解析を行うラ...

List

  • 2014/03/30

電話テキスト化サービス – WebRTCで電話を実現しつつ音声をテキスト化

WebRTCを使ってみたいなと思いつつもサーバの準備が必要でありなかなか手を出しづらいのが実情です。しかしNTTコミュニケーションズの提供するSkyWayを使えばフレキシブルなWebRTCが手軽に手に入ります。そんなSkyWayを使ったサンプルソフトウェアが電話テキスト化サービスです。音声認識技術とも合わせることで、音...

List

  • 2014/02/22

SpectrogramJS – Webベースのスペクトログラム

こんなことまでHTML5で!音は耳で聞くものですが、それでは分からない情報があります。そこで使われるのがスペクトログラムという技術で、いわゆる声紋になります。横軸に時間、縦軸に周波数をとり、その強さによって濃さや色を変えるグラフです。そんなスペクトログラムをWeb上で実現するソフトウェアがSpectrogramJSです...

List

  • 2014/01/13

ISSE – 音声ファイルから特定の音域だけを取り出す

音声の録音は途中からやり直しが効かないので、こういうソフトウェアは便利かも知れませんよ。ISSEのコンセプトは音声におけるPhotoshopになることです。非常に面白いコンセプトです。といっても全ての音声編集ができるようになる訳ではなく、音声ファイルの切り分けに特化したツールとなっています。簡単にいうと音楽ファイルでボ...

List

  • 2013/09/29

音声認識APIを手軽に使えるようにする「annyang」

annyangはJavaScript製のオープンソース・ソフトウェア(MIT License)です。Siriなどの登場によって一気に知名度があがった音声認識システムですが、それをWebベースで、しかもJavaScriptだけで実現してしまおうというのがannyangです。まずマイクへのアクセス許可が求められます。いきな...

List

  • 2013/07/30

Podcastingに便利。音声ファイルを指定時間から再生「TimeJump」

TimeJumpはJavaScript製、MIT License/GPLのオープンソース・ソフトウェアです。Podcastingというと、単純なMP3ファイルの配信であるため最初から最後まで全体を聞かないといけないイメージがあります。しかしTimeJumpを使えば指定時間からの再生が簡単に実現できます。表示例。audi...

List

  • 2013/03/16

試そう!Google ChromeのWeb Speech APIを使ったゲーム「FlashCards」

FlashCardsはGoogle ChromeのWeb Speech APIを使った音声入力によるフラッシュカードゲームです。目の前にぱっぱっと出されていくカードの答えをどんどん答えていくフラッシュカードというトレーニングがあります。それをWebブラウザ上で体感できるのがFlashCardsです。ゲーム画面です。お題...

List

  • 2013/02/13

なんと!JavaScriptだけでテキスト読み上げ「Speak.js」

Speak.jsはJavaScriptだけでテキストを読み上げるソフトウェアです。Webブラウザで音声ファイルを指定してJavaScriptで解析、なんてソフトウェアもありますが今回は一から“音声”を生み出してしまう驚きのソフトウェア、Speak.jsを紹介します。ボタンを押すとHello Worldと話します。こんな...

40572?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2012%2f07%2fscreenshot-2012-07-03-13.35.22_thumb

  • 2012/07/16

Web上で録音、再生を可能にする小さなJavaScript/Flashライブラリ「WAMI recorder」

WAMI recorderはJavaScriptから操作可能なFlash製の音声録音、再生ライブラリです。HTML5が浸透しつつありますが、逆にJavaScriptでは出来ないもどかしい部分も明確になってきています。その一つにマイクロフォンへのアクセスがあります。しかしそんな時こそFlashと連携させれば良いのです。W...

39799?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2012%2f06%2fscreenshot-2012-06-12-10.56.45_thumb

  • 2012/06/24

情報を聴覚から。ニュースサイトを音声読み上げ「speech news」

speech newsはオンラインニュースサイト(例としてGoogleニュース)をMP3化するソフトウェアです。インターネット上には多数のニュースサイトがあります。そのチェックにフィードを使っているという人は多いと思いますが、今回紹介するのは目ではなく耳でチェックするspeech newsです。例えばGoogleニュー...

38936?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2012%2f05%2fscreenshot-2012-05-21-14.32.58_thumb

  • 2012/05/30

こんなことまで。HTML5による動画チャットや通話を可能にする「sipML5」

sipML5はHTML5で実装されたSIPクライアントです。インターネット電話というとSkypeやLINEが有名ですが、IP電話もまたインターネットを使った電話システムです。そこで使われているSIPをHTML5でサポートしたのがsipML5です。コネクトしました。が、対話しようとしてもできませんでした…。利用に際しては...

29033?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2011%2f08%2fscreenshot2011-08-24-13.41.46_thumb

  • 2011/09/02

Webブラウザ、それもクライアントサイドだけで実現するテキストの音声読み上げ「speak.js」

speak.jsはHTML5を使ってクライアントサイドだけでテキスト音声読み上げを実現するJavaScriptライブラリです。speak.jsはHTML5/JavaScript製のオープンソース・ソフトウェア。コンピュータの世界で常に望まれてきたのがテキストと音声の融合です。人が話せば音声を解析してテキストにし、逆にテ...

27137?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2011%2f05%2fimage008_thumb

  • 2011/06/03

複数言語に対応したテキスト読み上げアプリ「Type and Speak」

Type and Speakは入力したテキストを読み上げるAndroidアプリ。多数の言語に対応。Type and SpeakはAndroid製のオープンソース・ソフトウェア。海外旅行に行った際などに一番問題になるのは言語の問題ではないだろうか。ガイドブックには読み方は書いてあるが、どう発音するのかは分からない。伝えた...

26986?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2011%2f05%2f6a3277816003e303bf3355630079d069

  • 2011/05/29

音声認識を活用。Rubyから文章を指定して音声認識&処理実行「James」

JamesはMac OSXの音声認識をRubyから操作できるライブラリ。JamesはRuby製/Mac OSX用のオープンソース・ソフトウェア。近未来の世界において(映画の中で)たびたび登場するのが音声認識によるコンピュータの操作だ。テレビをつけたり照明を消したり、必要な情報を音声によってやり取りする。実行中今のコンピ...