フィンテック企業は先四半期、AI 音声エージェントを立ち上げました。音声認識は正確で、バックエンド統合は機能し、システムは 200 件の同時通話を処理できました。しかし 2 週間以内に、彼らは驚くべきことに気づきました。発信者の 38% がリクエストを完了する前に電話を切ってしまったのです。検視の結果、犯人、つまり脚本が明らかになりました。 AI はすべての通話の冒頭で、「利用可能なサービスとメニュー オプション」についての 12 秒間の独り言を語りました。電話をかけてきた人は、終わりを聞くまで待っていませんでした。
脚本は商品です。あらゆる休止、あらゆる言葉の選択、誤解からのあらゆる立ち直りによって、発信者がそのまま残るか電話を切るかが決まります。私たちは、業界全体で 60 以上の導入向けに音声スクリプトを設計してきました。このガイドでは、実際に何が重要かを抽出しています。
冒頭のセリフで信頼を獲得するには 4.8 秒かかります
30,000 件以上の通話にわたる当社のデータによると、発信者は平均 4.8 秒以内に AI 音声エージェントと対話するかどうかを決定します。およそ 15 単語です。長さ、トーン、具体性など、冒頭のすべてが台本の他のどの部分よりも重要です。
3 つの開口部スタイルについてデータが語ること
次の 3 つの開始アプローチを使用して、1,500 件の通話に対して制御された A/B テストを実行しました。
| 開口部のスタイル | 例 | 発信者の維持 | 平均通話時間 |
|---|---|---|---|
| 企業発表 | 「当社のインテリジェント サービス システムへようこそ。以下についてお問い合わせください。」 | 57% | 38秒 |
| 簡単な挨拶 | 「こんにちは。どうしたらお手伝いできますか?」 | 78% | 1分42秒 |
| コンテキスト認識プロンプト | 「こんにちは、注文または返品についてお電話ですか?」 | 84% | 2分15秒 |
コンテキストを認識したプロンプトは、企業向けオープナーよりも 27 パーセントポイント優れていました。理由は簡単です。AI が発信者のニーズを予測すると、能力があることを知らせます。呼び出し側は、「このものは実際に私が何を望んでいるのかを知っている」と考え、それにチャンスを与えます。
列を開くための 3 つのルール
1. 8 単語以内で挨拶します — 「���んにちは、何かお手伝いできますか?」十分です。ブランドの説明をやめます。
2. 最も一般的な 2 つのインテントに名前を付けます — 通話データから取得します。電話の 60% が約束に関するもので、25% が請求に関するものであれば、そのとおりに伝えてください。
3. 質問で終わる — 質問は本能的な反応を引き起こします。ステートメントは沈黙を引き起こします。
会話の分岐: 一度に 3 つ以上の選択肢を提示しないでください
音声の基本的な制約は、ユーザーがオプションを確認できないことです。 Web ページには 8 つのボタンを表示できます。電話では、3 つの選択肢を超えると混乱が生じます。私たちの分析によると、音声メニューに 5 つ以上のオプションが表示される場合、選択ミスまたは「繰り返してください」の割合が 61% に達します。
フラットなデザインが深い木に勝つ
従来の IVR システムでは、深いメニュー ツリーが好まれていました。カテゴリ A の場合は 1 を押し、サブカテゴリ A-2 の場合は 2 を押し、項目 A-2-c の場合は 3 を押します。このパラダイムはタッチトーン入力にとって理にかなっています。音声AIにとって、それは悲惨なことだ。
正しいアプローチはフラットな会話設計です。レイヤーごとにドリルダウンするのではなく、AI に 1 回のやり取りで意図を理解させます。
例:
フラット デザインにより、平均会話ターン数が 4.2 から 2.7 に減少し、満足度スコアが 5 点満点中 3.4 から 4.1 に向上しました。
すべての会話ノードに必要な 4 つの要素
1. 意図の確認 — AI は「3 月 15 日の注文の配送状況を確認したいんですね?」とエコーバックします。
2. 修正パス — 発信者が「いいえ、それは正しくありません」と言った場合、AI は最初からやり直すことなく適切に再ルーティングする必要があります。
3. 沈黙処理 — 発信者が 5 秒間話さなかった場合、AI は無期限に待つのではなく、穏やかにプロンプトを表示します。
4. 脱出ハッチ — どの時点でも、「私をある人に転送」はすぐに機能するはずです
口調と言葉遣い: AI を人間らしく見せる 5 つのテクニック
最も一般的なスクリプトの間違いは、形式的な表現です。私たちはクライアントからの 200 件を超える初稿スクリプトをレビューしましたが、83% が口頭での会話による台本ではなく書面による形式的な台本を使用していました。ビジネスメールを書くように電話で話す人はいません。
形式的な表現と会話的な表現
| フォーマル(避ける) | 会話(使用) |
|---|---|
| 注文識別番号を入力してください | 注文番号は何ですか? |
| システムはあなたの身元を確認します | あなたが誰であるかを簡単に確認させてください |
| リクエストは正常に処理されました | すべて完了しました - 準備は完了です |
| この対話はこれで終了します。お電話ありがとうございます | 他に何か?そうでない場合は、素晴らしい一日をお過ごしください。 |
自然な響きのスクリプトのための 5 つのテクニック
1. 「システム」の代わりに「私」を使用します — 「それを調べます」は常に「システムは現在あなたのクエリを処理しています」よりも優れています
2. 会話のつなぎ言葉を追加する — 「確かに」、「分かった」、「問題ありません」 — これらの小さな言葉には、たくさんの暖かさが伝わります。
3. 待ち時間を認識する — 検索に時間がかかる場合は、沈黙するのではなく、「10 秒ほどお待ちください」と言います。
4. 命令ではなく確認 — 「火曜日の 3 時ですよね?」 「日時を確認してください」よりも優しい
5. 関連するヒントで終わります — 「約束の際には身分証明書を忘れずに持参してください」という役立つ内容で締めくくります。
これら 5 つのテクニックを電子商取引クライアントに実装した後、満足度スコアは 5 点満点中 3.6 から 4.3 に跳ね上がり、人間のエージェントへの転送リクエストは 28% 減少しました。
エラー回復スクリプト: 不快な経験の 85% は AI の誤解への対処方法に起因する
AIは発信者を誤解するでしょう。アクセント、背景ノイズ、範囲外のリクエスト - これらは避けられません。問題は、エラーが発生するかどうかではなく、次に何が起こるかです。 「エクスペリエンスが悪い」と評価された 12,000 件の通話を分析したところ、否定的な評価の 85% は、エラーそのものではなく、AI によるエラーの処理方法に起因していることがわかりました。
3 層のリカバリ フレームワーク
レイヤー 1: 穏やかな再試行 (1 番目の誤解)
「ごめんなさい、理解できませんでした。もう一度お願いします。」とは言わないでください。代わりに、「申し訳ありませんが、よく聞き取れませんでした。もう一度言っていただけますか?」または、質問を言い換えてみてください:「必要なものを別の方法で説明できますか?」
レイヤー 2: ガイド付きオプション (2 番目の誤解)
2回連続失敗で呼び出し側の忍耐力も薄れてきました。オープンエンド型からクローズドエンド型に切り替える: 「私がお手伝いする最も一般的なことは、予約と注文の問い合わせです。それはその内の 1 つですか、それとも別のものですか?」
レイヤー 3: グレースフル ハンドオフ (3 番目の誤解)
3 ストライクでトライは終了です。 「あなたが必要としていることが十分に理解できていないようです。助けてくれる人につないでください。しばらくお待ちください���」と言ってください。
影響
3 層の回復フレームワークを導入した後、当社のお客様は「誤解によるハングアップ」率が 34% から 11% に低下したことを確認しました。放棄したはずの発信者の大多数は、レイヤー 2 で正常に再接続されました。
AI 音声エージェントは毎日何百もの通話を処理します。各通話の最初の 5 秒、あらゆる意思決定ポイントでの言葉遣い、あらゆる誤解の後の対応など、これらはエンジニアリングの問題ではありません。それらは設計上の問題です。そして答えはすでに通話データの中にあります。

Pathors チーム
コンテンツチーム
AI テクノロジーを活用して顧客サービスとビジネス運営を変革することに情熱を注いでいます。
Pathors は、インテリジェントな音声アシスタント ソリューションで企業を支援し、顧客サービス、予約管理、ビジネス コンサルティングを合理化し、業務効率を向上させます。