GoogleSpeechAPIで音声をささっとテキスト化
音声をテキスト化するRESTのAPIって全然ない.
唯一GoogleSpeechAPIだけ見つかったので実装した.
その方法を紹介.
手順1:SpeechAPIの利用準備
SpeechAPIは特別なGoogleのAPI.もともと非公認なAPI(今も非公認?)だけあって,利用するまでの方法が他のGoogleのAPIと少し違う.
まず始めに,Chromium-devグループに加入します.加入には特に申請手続きは必要なく,簡単に登録できます.
https://console.developers.google.com/project?authuser=0
次に,GoogleConsoleを開いて,自分のプロジェクトの作成します.
そしたら,GoogleSpeechAPIの利用ON,公開キー(ブラウザ)を取得します.
手順2:Webの記事を参照する
以下の記事を参照しました.
mobilebiz: TwilioとGoogle Speech APIを使った音声変換について
個人的に一番参考になった記事.これをもとにTwilioの音声データをテキスト化しましたので,必要そうな情報が取得できました.ただ,この記事は2013年度のもので若干古め.実際,GoogleSpeechAPIは今はversion2だが,この記事はversion1である.
gillesdemey/google-speech-v2 · GitHub
最新のGoogleSpeechAPIのversion2のドキュメントが書いてある記事.コードは特にないので,コピペとかはできないが,仕様の参考にはできる.
How to convert .flac to .mp3 using PHP - Stack Overflow
GoogleSpeechAPIを使って音声ファイルをテキスト化にするには,音声ファイルの拡張子を flac にする必要があるみたい.なので,拡張子の変換の際に ffmpeg コマンドを利用した.別に ffmpegじゃなくて良い.
手順3:ちょいと実装
google_speech_api.php と wave_editor.php を二つ実装