コールセンターやカスタマーサービスの現場で、対話型音声AIサービスが急速に普及している。従来の「何番を押してください」式のIVR(自動音声応答)から、自然な対話で顧客の課題を解決するAI対話システムへ──この変革を牽引する日本のスタートアップが株式会社IVRy(以下、アイブリー)だ。
同社の奥西亮賀CEOは、2020年のサービス開始当初から「3年後か5年後には生成AIモデルが出てくる」と予測し、音声データとアカウント数の蓄積に注力してきた。ChatGPTの登場以前から技術革新の波を見抜いていた先見性は、現在の同社の競争優位性の基盤となっている。
リクルートでの学びから起業へ
奥西氏のバックグラウンドはコンピュータサイエンスだ。大学院では照明制御の最適化問題という、ディープラーニング以前の研究に取り組んでいた。
「遺伝的アルゴリズムなどを使った研究で、システムエンジニアリングやコンピュータサイエンスは一定程度できるなと思ったんですが、ビジネスやマーケティングがデザインできないと、良いと思っているサービスも世の中に届かないと実感しました」
2015年にリクルートに入社し、保険系の新規事業を立ち上げた。UI/UX、マーケティング、アライアンス、事業戦略作りなど多岐にわたる業務を経験し、4年後に起業の道を選んだ。
起業当初は人材データ分析に取り組んだが、100人以下の中小企業には響かなかった。「せっかくなら、全員が活用できるサービスを作りたい」──この思いから試行錯誤を重ね、7番目に生まれたのがアイブリーだった。
きっかけは個人的な体験だった。「創業融資のときに銀行の本人確認電話を営業電話だと勘違いして無視していたら『本人確認できません』と言われたんです。電話って意外と大事なんだなとその時に感じました」。電話をかける側の都合でかかってくる従来のシステムを、受ける側の都合でコントロールできるようにしたい──この発想が出発点となった。
GPT-3の時代に見抜いた「来るべき未来」

2020年、自然言語処理分野(NLP)における画期的な大規模言語モデルとしてGPT-3などが登場した段階で、奥西氏は重要な判断を下していた。当時はChatGPTが登場する前、生成AIの可能性を意識している人はそれほど多くなかった。
「言語処理に強いAIエンジニアと議論する中で、GPTはデータ量を大量に投入すれば精度が上がるという研究が出てきているから、いつか汎用モデルによる大きな変化が来るだろうという話をしていました」
「3年後か5年後かわからないけれど、そのタイミングで実用性の高いモデルが出てくる」という仮説のもと、音声解析とデータ分析にフォーカスした事業展開を決めた。
2022年末のChatGPT登場は、予想より早く訪れた「待っていた未来」だった。「5年ぐらいかかると思っていたんですが、思ったより早く待ってたやつが来たんじゃないかと」
この技術革新が本物かどうかを確かめるため、2023年3月の言語処理学会に足を運んだ。「『ChatGPTによって我々の研究は終わるのか』というセッションがあるぐらいインパクトが大きかったんですが、研究者たちは『ついに来ちゃったね』ぐらいの温度感でしたね」
研究者たちの冷静な反応を見て確信した。「本物の技術を使って、元々やっていた戦略通り対話型音声AIのサービスを作るという意思決定をしました」
ハルシネーション問題をタスク分解で解決
生成AIの実用化で最大の課題とされるハルシネーション(AIの間違い)について、独自のアプローチで解決を目指した。一気通貫でAIを使うのではなく、タスクを細分化して、小さなAIモデルをいくつか組み合わせ、ハルシネーションによる言葉を語らせない対話モデルを作りあげた。
「大手の対話型AIアシスタントも一つのAIモデルで動いているように感じますが、実際は小さなAIがいくつも組み合わさってできている。意図を理解するAIと、天気について答えるのが得意なAI、道順について答えるのが得意なAIは別なので、それぞれ違うところに振り分けてあげる」
この手法により、アイブリーではハルシネーションによるクライアントからのクレームは一件も発生していないという。