読者です 読者をやめる 読者になる 読者になる

初心者エンジニアが何か書く

〜技術ブログメイン〜

GoogleSpeechAPIで音声をささっとテキスト化

音声をテキスト化するRESTのAPIって全然ない.

唯一GoogleSpeechAPIだけ見つかったので実装した.

その方法を紹介.

 

手順1:SpeechAPIの利用準備

 

SpeechAPIは特別なGoogleAPI.もともと非公認なAPI(今も非公認?)だけあって,利用するまでの方法が他のGoogleAPIと少し違う.

 

まず始めに,Chromium-devグループに加入します.加入には特に申請手続きは必要なく,簡単に登録できます.


Google グループ

https://console.developers.google.com/project?authuser=0

 

次に,GoogleConsoleを開いて,自分のプロジェクトの作成します.

そしたら,GoogleSpeechAPIの利用ON,公開キー(ブラウザ)を取得します.

f:id:inobo52:20141028023701p:plain

 

f:id:inobo52:20141028024029p:plain

 

手順2:Webの記事を参照する

以下の記事を参照しました.

mobilebiz: TwilioとGoogle Speech APIを使った音声変換について

個人的に一番参考になった記事.これをもとにTwilioの音声データをテキスト化しましたので,必要そうな情報が取得できました.ただ,この記事は2013年度のもので若干古め.実際,GoogleSpeechAPIは今はversion2だが,この記事はversion1である.

 


gillesdemey/google-speech-v2 · GitHub

最新のGoogleSpeechAPIのversion2のドキュメントが書いてある記事.コードは特にないので,コピペとかはできないが,仕様の参考にはできる.

 

How to convert .flac to .mp3 using PHP - Stack Overflow

GoogleSpeechAPIを使って音声ファイルをテキスト化にするには,音声ファイルの拡張子flac にする必要があるみたい.なので,拡張子の変換の際に ffmpeg コマンドを利用した.別に ffmpegじゃなくて良い.

 

手順3:ちょいと実装

google_speech_api.php  と  を二つ実装