Media Streamesとは
Media StreamsとはTwilioの通話音声にWebSocketを使用してリアルタイムにアクセスすることができるサービスです。
Media Streamsと他のサービス(TTSや感情分析エンジン)を組み合わせることでリアルタイムな文字起こしや感情分析が可能となります。
Media Streamesが正式リリースされました!
Media Streamsは2019年のSIGNAL(Twilioの技術カンファレンス)にて発表されました。
Twilioのリアルタイムな音声ストリームへのアクセスは強く要望されており、Bateが発表された時に新しい価値創造に繋がると期待されていました。
そんなMedia Streamsが2020年3月26日(UTC)に正式リリースが発表されました。
Media Streams is now Generally Available(英語)
Media StreamsのページはBataがついてます(2020年3月27日 12:00 JST 現在)が、近々取れると思います。
Media Streamesの使い方
※Media Streamsを使用するときは、音声ストリームを処理するためのサーバーが必要です。
Media Streamsを開始するためには以下のようにTwiMLを返却します。
URLには、WebSocket先のURLを記載してください。
<?xml version="1.0" encoding="UTF-8"?>
<Response>
<Start>
<Stream url="wss://mystream.url" />
</Start>
</Response>
Media Streamsを使った、文字起こしのサンプル(Python, Node.js, Java, Ruby on Rails)はこちらのGitHubリポジトリに用意されています。
Media Streamsのドキュメントはこちら。
まとめ
Twilioを使って、コールセンターやコンタクトセンターを作っているユーザーさんには待望の機能なのではないかと思います。
ぜひこれを機会にTwilioを使った顧客対応品質向上を目指してみてはいかがでしょうか。