ITエンジニア/デザイナ向けにオープンソースを毎日紹介

技術 - 音声の記事一覧

プレミアムユーザー限定記事

MOONGIFTプレミアムは、月額500円の有料サービスです。詳細はこちらから

もっと見る

List

  • 2014/01/13

ISSE – 音声ファイルから特定の音域だけを取り出す

音声の録音は途中からやり直しが効かないので、こういうソフトウェアは便利かも知れませんよ。ISSEのコンセプトは音声におけるPhotoshopになることです。非常に面白いコンセプトです。といっても全ての音声編集ができるようになる訳ではなく、音声ファイルの切り分けに特化したツールとなっています。簡単にいうと音楽ファイルでボ...

List

  • 2013/09/29

音声認識APIを手軽に使えるようにする「annyang」

annyangはJavaScript製のオープンソース・ソフトウェア(MIT License)です。Siriなどの登場によって一気に知名度があがった音声認識システムですが、それをWebベースで、しかもJavaScriptだけで実現してしまおうというのがannyangです。まずマイクへのアクセス許可が求められます。いきな...

List

  • 2013/07/30

Podcastingに便利。音声ファイルを指定時間から再生「TimeJump」

TimeJumpはJavaScript製、MIT License/GPLのオープンソース・ソフトウェアです。Podcastingというと、単純なMP3ファイルの配信であるため最初から最後まで全体を聞かないといけないイメージがあります。しかしTimeJumpを使えば指定時間からの再生が簡単に実現できます。表示例。audi...

List

  • 2013/03/16

試そう!Google ChromeのWeb Speech APIを使ったゲーム「FlashCards」

FlashCardsはGoogle ChromeのWeb Speech APIを使った音声入力によるフラッシュカードゲームです。目の前にぱっぱっと出されていくカードの答えをどんどん答えていくフラッシュカードというトレーニングがあります。それをWebブラウザ上で体感できるのがFlashCardsです。ゲーム画面です。お題...

List

  • 2013/02/13

なんと!JavaScriptだけでテキスト読み上げ「Speak.js」

Speak.jsはJavaScriptだけでテキストを読み上げるソフトウェアです。Webブラウザで音声ファイルを指定してJavaScriptで解析、なんてソフトウェアもありますが今回は一から“音声”を生み出してしまう驚きのソフトウェア、Speak.jsを紹介します。ボタンを押すとHello Worldと話します。こんな...

40572?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2012%2f07%2fscreenshot-2012-07-03-13.35.22_thumb

  • 2012/07/16

Web上で録音、再生を可能にする小さなJavaScript/Flashライブラリ「WAMI recorder」

WAMI recorderはJavaScriptから操作可能なFlash製の音声録音、再生ライブラリです。HTML5が浸透しつつありますが、逆にJavaScriptでは出来ないもどかしい部分も明確になってきています。その一つにマイクロフォンへのアクセスがあります。しかしそんな時こそFlashと連携させれば良いのです。W...

39799?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2012%2f06%2fscreenshot-2012-06-12-10.56.45_thumb

  • 2012/06/24

情報を聴覚から。ニュースサイトを音声読み上げ「speech news」

speech newsはオンラインニュースサイト(例としてGoogleニュース)をMP3化するソフトウェアです。インターネット上には多数のニュースサイトがあります。そのチェックにフィードを使っているという人は多いと思いますが、今回紹介するのは目ではなく耳でチェックするspeech newsです。例えばGoogleニュー...

38936?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2012%2f05%2fscreenshot-2012-05-21-14.32.58_thumb

  • 2012/05/30

こんなことまで。HTML5による動画チャットや通話を可能にする「sipML5」

sipML5はHTML5で実装されたSIPクライアントです。インターネット電話というとSkypeやLINEが有名ですが、IP電話もまたインターネットを使った電話システムです。そこで使われているSIPをHTML5でサポートしたのがsipML5です。コネクトしました。が、対話しようとしてもできませんでした…。利用に際しては...

29033?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2011%2f08%2fscreenshot2011-08-24-13.41.46_thumb

  • 2011/09/02

Webブラウザ、それもクライアントサイドだけで実現するテキストの音声読み上げ「speak.js」

speak.jsはHTML5を使ってクライアントサイドだけでテキスト音声読み上げを実現するJavaScriptライブラリです。speak.jsはHTML5/JavaScript製のオープンソース・ソフトウェア。コンピュータの世界で常に望まれてきたのがテキストと音声の融合です。人が話せば音声を解析してテキストにし、逆にテ...

27137?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2011%2f05%2fimage008_thumb

  • 2011/06/03

複数言語に対応したテキスト読み上げアプリ「Type and Speak」

Type and Speakは入力したテキストを読み上げるAndroidアプリ。多数の言語に対応。Type and SpeakはAndroid製のオープンソース・ソフトウェア。海外旅行に行った際などに一番問題になるのは言語の問題ではないだろうか。ガイドブックには読み方は書いてあるが、どう発音するのかは分からない。伝えた...

26986?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2011%2f05%2f6a3277816003e303bf3355630079d069

  • 2011/05/29

音声認識を活用。Rubyから文章を指定して音声認識&処理実行「James」

JamesはMac OSXの音声認識をRubyから操作できるライブラリ。JamesはRuby製/Mac OSX用のオープンソース・ソフトウェア。近未来の世界において(映画の中で)たびたび登場するのが音声認識によるコンピュータの操作だ。テレビをつけたり照明を消したり、必要な情報を音声によってやり取りする。実行中今のコンピ...

26150?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2011%2f03%2fd481adefa01e67aed04bbfd94a892b42

  • 2011/04/04

どんな使い方ができそうか。JavaScriptと連携できるWebベースの音声認識/出力「Speech API」

Speech APIはJavaScriptとFlashを使ったWebベースの音声認識/出力ソフトウェア。Speech APIはJavaScript/Flash製のオープンソース・ソフトウェア。コンピュータが一般化される前から技術的には存在したが、今ひとつ流行らなかったのが音声入力だ。AppleのMacintoshの前で...

List

  • 2011/02/11

Web上で録音。Javaアプレット製の録音/再生プレーヤ「NanoGong」

NanoGongはJavaアプレットで出来た音声録音ソフトウェア。NanoGongはJava製のオープンソース・ソフトウェア。オンラインではテキストによるメッセージのやり取りが多い。音声や動画はサーバ側から配信するものが殆どで、クライアント側から発信するものは多くない。あったとしてもSkypeのようなチャットが多い。小...

24868?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2011%2f01%2fimg_0369_thumb

  • 2011/01/29

可能性大。音声入力を使えばiPhoneでの入力がもっと楽になる「iPhone Julius」

iPhone Juliusは音声解析エンジンのJuliusをiPhone上で使えるようにするソフトウェア。iPhone JuliusはiPhone用のフリーウェア(ソースコードは公開されている)。iPhoneにはハードウェアのキーボードがなく、ソフトウェアベースで入力する。入力方法としては悪くないが、キーボードに慣れて...

24777?type=list&url=http%3a%2f%2fwww.moongift.jp%2fwp-content%2fuploads%2f2011%2f01%2fimage4_thumb

  • 2011/01/25

まさに未来。音声による対話型エージェントシステム「MMDAgent」

MMDAgentは音声認識、応対を行う3Dオブジェクトによる音声インタラクションシステム。/s2IfMMDAgentはWindows用のオープンソース・ソフトウェア。コンピュータ技術の進歩もあって、個人のPCでさえリアルなオブジェクトを容易に動かせるようになっている。さらに初音ミクのように滑らかに言葉を発したり、逆に言...

List

  • 2010/04/19

ストリミーングの音楽を録音する「Streamrecorder.net」

Streamrecorder.netはWindows用のオープンソース・ソフトウェア。radiko.jpをはじめ、音声コンテンツがまた隆盛になってきた。ポッドキャスティングやインターネットラジオを楽しむ人も多いのではないだろうか。管理のしやすさもあってストリーミングで配信するサイトも多い。メイン画面。ボタン一つで録音を...

List

  • 2010/04/06

Mac OSX用radiko.jpクライアント「radikoro」

radikoroはMac OSX用のフリーウェア。Webブラウザでラジオが聞けるradiko.jpの人気が高い。電波が入りづらい地域のユーザをターゲットにしているとのことだが、そもそもラジオを持っていない人や、パソコンの前にいる時間が長い人にとっても便利だろう。小さなウィンドウ ブラウザで使えるのは利点ではあるが、常時...

List

  • 2010/04/02

JavaScriptでradiko.jpを制御する「RadikoJS」

RadikoJSはJavaScript/Flashによるオープンソース・ソフトウェア。radiko.jpの人気が高い。ラジオの電波状況など関係なく、滅多にラジオを聴いてこなかった人もパソコンからであれば手軽に使えて聴けるようになる。さらに最近ではTwitterなどを通じて他のユーザと情報交換も可能だ。おうっ、小さい! ...

List

  • 2010/04/01

まるで小さな女の子が喋っているかのようなテキスト読み上げ&音声合成「DaughterLoid」

DaughterLoidは“技術だけ”オープンソースなソフトウェア。テキストの読み上げ機能はOS標準の機能として提供されるレベルになっている。英語のみならず日本語の読み上げも可能で、うまくやれば漢字の読み上げにも対応している。既に市場はコモディティ化されているのだろうか。いや、そんなことはない。まだまだニーズは多い。例...

List

  • 2010/03/27

ポッドキャスティング、ネットラジオ用に「AudioFlash」

AudioFlashはWindows用のオープンソース・ソフトウェア。ほんの数年前では自分で音声を録音してネット上に配信しようと思うと様々な機器やソフトウェアが必要だった。だが今ではマイク一つ(それも大抵ノートブックに付属している)があればすぐにできてしまう。録音から公開設定までこなす とは言え、音声を録音しただけでは...