IBMとDeepgramは、エンタープライズ向けAI分野での協業を発表した。今回の協業により、Deepgramの音声認識(Speech-to-Text)と音声合成(Text-to-Speech)技術が、IBMの生成AIソリューション「watsonx Orchestrate」に統合される。
IBMは、顧客から高性能で信頼性のある文字起こしやリアルタイム字幕機能などへの要望が高まっていることを受けて、Deepgramの技術を組み込むことを決定した。DeepgramはIBMにとって初の音声技術パートナーとなり、今回の統合により、ユーザーはより自然な音声でデジタルエージェントと対話できるなど、高度な音声認識が可能になる。
この連携により、数十種類におよぶアラビア語バリエーションやインドの多様な言語など、幅広い言語・方言に対応できるようになり、地域特有のアクセントを反映した高精度な音声認識や合成を実現する。また、カスタムチューニングやリアルタイム字幕生成、自然な音声出力の実装も追加される予定だという。
各種業界での導入も見込まれており、医療、金融をはじめとした分野で自動化された顧客対応、通話分析、音声主導型データ入力などの用途が広がると期待されている。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
AIdiver編集部(エーアイダイバーヘンシュウブ)
「AIdiver」(エーアイダイバー)は、株式会社翔泳社が運営する、企業およびビジネスパーソンのAIの利活用にフォーカスしたメディアです。経営、ビジネス、日々の業務をAIで変革したい「AIリーダー」の皆さまに役立つコンテンツを発信します。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
