コールセンターは自動化を取り入れています。それが良いことなのかどうかについては議論がありますが、進行中のものです。—そして、これが起こる可能性が高いかもしれません。
TechSci Researchの調査によると、2028年までに接触センターAIの世界市場は2022年の24億ドルからほぼ30億ドルに成長する可能性があります。一方、最近の調査では、約半数のコールセンターが来年、ある形式のAIを導入する計画であることがわかりました。
モチベーションは非常に明らかです:コールセンターはコストを削減しながら業務を拡大しようとしています。
起業家のEvie WangはTechCrunchに語った。「ヒューマンコンタクトセンターエージェントの制約なしに迅速にスケーリングを行いたい多くのコールセンター業務を有する企業は、効果的なAI音声エージェントソリューションを採用することに積極的です。このアプローチは、総コストを削減するだけでなく、待機時間も短縮します。」
WangはRetell AIの共同創設者の一人であり、企業が利用して顧客の電話を応対し、予約のスケジュールなどの基本的なタスクを実行するAI搭載の「音声エージェント」を作成するためのプラットフォームを提供しています。Retellのエージェントは、顧客サービスの利用事例に適した大規模な言語モデル(LLMs)と、LLMsによって生成されたテキストに声を与えるスピーチモデルの組み合わせで動作します。
Retellの顧客には、いくつかのコンタクトセンターオペレーターが含まれていますが、テレヘルス企業であるRoなど、高い電話量を取り扱う中小企業も含まれています。彼らは、プラットフォームの低コードツールを使用して音声エージェントを構築するか、カスタムLLM(例:MetaのLlama 3などのオープンモデル)をアップロードして体験をさらにカスタマイズすることができます。
Wangは語りました。「音声対話のエクスペリエンスに多くを投資しており、それをAI音声エージェント体験の最も重要な側面と見ています。AI音声エージェントを数行のプロンプトで作成できるおもちゃとして見なすのではなく、ビジネスに実質的な価値を提供し、複雑なワークフローを置換できるツールとして見なします。」
私の簡単なテストでは、Retellは少なくともコールフェーシング側でうまく機能していました。
私はRetellのウェブサイトのデモフォームを使用してRetellボットとの通話を手配しました。ボットは、架空の歯科医の予約をスケジュールするプロセスを案内し、希望する日付や時間、電話番号などの質問をしました。
私が言うのは、ボットの合成音声はリアリティ面で私が聞いた中で最高のものではありませんでした—確かに、Eleven LabsやOpenAIのテキストtoスピーチAPIと比較してもそうではありません。(追記:Wang氏によると、RetellはカスタムElevenLabsの声を使用しているとのことですが、これが品質が低い理由かもしれません。)Retellの辞職理由について、チームは主に会話中に発生する中断などのエッジケースや遅延を削減することに焦点を当ててきたとWang氏は述べています。
遅延は低いです:私のテストでは、ボットは私の回答やフォローアップの質問にほぼためらいなく応答しました。そして、彼は脚本に従っていました。私がどんなに頑張っても、それを混乱させたり、不適切な方法で振る舞わせたりすることはできませんでした。(私が自分の歯科記録についてボットに尋ねると、オフィスマネージャーと話すようにと主張していました。)
では、Retellのようなプラットフォームはコールセンターの未来でしょうか?
おそらくです。予約のような基本的なタスクにおいては、自動化が非常に合理的です。そのため、startupやビッグテック企業がRetellと競合するソリューションを提供しているのはおそらくそのためです。(Parloa、PolyAI、Google CloudのコンタクトセンターAIなどを参照)。
それはすぐに手に入る—そして、収益を生み出す—果実です。Retellは、会話1分あたりに支払ってもらう数百の顧客を持っていると主張しています。Retellは、Y Combinator(同社が孵化した場所)などのバッカーから合計453万ドルの資本を調達しています。
しかし、より複雑なクエリについては、特にLLMが事実を捏造し、安全策を講じていても線から外れる傾向があることを考慮すると、疑問点が残ります。
Retellの野望が広がるにつれて、同社がその領域の多くの確立された技術的課題をどのように航行するかに興味を持っています。少なくとも、Wang氏はRetellのアプローチに自信を持っているようです。
Wang氏は述べました。「LLMの登場とスピーチ合成の最近の突破により、会話型AIは非常に興奮するユースケースを作成するのに十分なものとなっています。例えば、1秒未満のレイテンシやAIを中断できる能力により、ユーザーは他の人との会話と同じように完全な文で話し、会話をします。開発者がAI音声エージェントを構築、テスト、展開、モニタリングするのを簡単にし、最終的にプロダクションレディの状態にするのを支援することを目指しています。」