- blogs:
- cles::blog
Asterisk のボイスメールを Google に文字起こしさせてメールで送る
asterisk deeplearning googleAsterisk のボイスメールを自動的に Google に文字起こしさせてメールで送る方法がないかと思って調べてみたら、既に試してみた人がいて、手順とスクリプトが纏められていました。
- Asterisk - Voicemail with Speech Recognition using Google API
- Asterisk - Setup voicemail to send email with mp3 attachment
これをそのまま導入すれば良いのかと思いきや、API Key が必要ない Google Speech API の v1 は既に廃止されているらしく、これを動かすと API からは 404 が帰って来てしまいます。ちなみに Google の音声認識 API については Google Cloud Speech API が正式に提供されており、private 扱いとなっている Google Speech API はあまり推奨されないのかもしれませんが、今回は改造を最小限に抑えるために Google Speech API v2 に対応させてみます。
† Google Speech API の API Key を取得する
Google Speech API は private 扱いなので、利用するためにはあらかじめ Chromium-dev グループに参加しておく必要があります。
この辺りの手順や、API の仕様については以下のサイトにまとまっていますので、これらを参考に API Key を取得します。
- Google Speech APIを使えるようになるまで - Qiita
- gillesdemey/google-speech-v2: Reverse Engineering Google's Speech To Text API (v2)
† sendmailmp3 へのパッチ
基本的には sendmailmp3 の導入を行うだけですが、sendmailmp3 に以下のパッチを当ててください。
(###YOUR_API_KEY### の部分については自分の API Key に置き換える必要があります。)
また、この API は 1 日 50 回程度までしかアクセスできないので注意が必要です。
普通の人の留守電の用途であれば十分な回数だとは思いますが・・・・・・
diff -u /usr/sbin/sendmailmp3{.org,}
† ボイスメール本文の例
こんな感じで、いつものボイスメールの末尾に文字おこししたテキストが追加されるようになります。
これで簡単な要件であればファイルを開くことなく内容が分かるようになります。
このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/9935
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。
OpenID を使ってログインすることができます。
2 . awk で指定した n カラム目以降を出力する(6760)
3 . Windows 10 で勝手にログアウトされないようにする(6467)
4 . Thunderbird のメッセージをスレッド化しないようにする(5743)
5 . ネットワーク機器を廃棄する前に設定情報の消去を(4709)