音声分離サービス
waketekoo
発話が重なっているモノラル音声を
話者ごとに分離するサービスです。
こんな経験はありませんか?
従来の録音機能を利用した音声データのテキスト化では、録音した音声を文字起こししても、「誰が何を話したのか判別できない」「同時に発話した区間の音声では文字起こしがうまくいかず、テキストが読めない」「手間をかけてデータにしても、精度が悪くデータの利活用が進まない」という課題がありました。
waketekooを利用すれば!
音声分離サービス waketekooを利用すれば、重なった音声もきれいに分離します。これにより、文字起こしでも高精度なテキスト化を実現します。
その結果、議事録の作成や、自動要約、応対品質評価などのデータ利活用が可能となります。
サービスの特長
1.会話音声を同時発話部分も含め話者ごとに分離※1可能で、高い認識精度を実現
- 高いテキスト化精度により、人手による文字起こし等の作業を削減します
- 会話の参加者数に制限がありません(但し話者重複部分の分離は2人まで)
- 三菱電機のAI技術Maisart®※2を活用して開発された音声分離技術を使用しています
※1 話者分離(話者を区別してテキスト化)はクラウドAPI型のオプションとなります。
※2 Mitsubishi Electric's AI creates the State-of-the-ART in technologyの略。全ての機器をより賢くすることを目指した三菱電機のAI技術ブランド。
2.導入のハードルが低いシステム要件、価格設定で提供
- AIで一般的に使用される高性能GPU(画像処理プロセッサー)を使わないシステム構成が可能です
- 1ユーザーから使用できる価格体系を予定しています
3.導入要件に応じ選択できる2つの提供パターンを用意
- システム構築要件に柔軟に対応できる「モジュール提供型」
- 音声をテキスト化する「音声認識エンジン」を搭載し、アプリケーション間接続を効率的に実現できるREST APIを採用した「クラウドAPI型」※3
※3 サービス基盤としてアマゾン ウェブ サービス(AWS)を利用しています。
オンプレミスや既存のクラウド環境などで利用可能なモジュール提供型です。
お客様の環境構築不要で利用可能なクラウドAPI型です。