Pathors AI는 복잡하거나 민감한 대화를 처리할 수 있나요?

Pathors AI는 결제 알림, 수금, 리드 자격 등 대량의 일상적인 통화에 가장 적합합니다. 우리는 대화형 대화와 대부분의 반대 의견을 처리하지만 판매 마감과 같이 전문적인 전문 지식이 필요한 통화는 숙련된 상담원에게 전달해야 합니다.

Pathors AI는 한 번에 여러 통화를 처리할 수 있나요?

예. 우리는 높은 동시성을 지원하며 100개 이상의 동시 호출을 통한 대용량 작업을 위해 설계되었습니다.

귀하가 처리하는 데이터는 얼마나 안전합니까?

표준 배포의 경우 보안 수준이 높은 클라우드 인프라와 신뢰할 수 있는 최고 수준의 AI 제공업체를 기반으로 실행됩니다. 기업 고객의 경우 온프레미스 옵션도 제공합니다.

Pathors AI가 기존 IVR 시스템과 다른 점은 무엇입니까?

엄격한 메뉴 대신 Pathors AI는 자연스러운 대화를 사용하여 의도를 이해하고 요청을 해결합니다. 이는 일반적으로 기존 IVR보다 더 높은 참여를 유도합니다.

전방 배치 엔지니어란 무엇입니까?

전방 배포 엔지니어는 팀과 협력하여 검색, 통합, 테스트, 출시 등 프로덕션에 즉시 사용 가능한 음성 워크플로를 제공하는 실무 엔지니어입니다.

Forward Deployed Engineer를 사용하면 얼마나 빨리 구현할 수 있습니까?

타임라인은 범위와 사용 사례에 따라 다릅니다. 짧은 인터뷰 후 우리는 계획을 확정합니다. 간단한 워크플로의 경우 일부 파일럿은 2주 만에 실행될 수 있지만 심층적인 통합에는 더 오랜 시간이 걸립니다.

구현 후에는 어떤 지원을 제공하나요?

Forward Deployed Engineer 참여를 통해 성능을 모니터링하고, 프롬프트와 흐름을 조정하고, 엣지 케이스를 반복하여 출시 후에도 결과가 계속 개선되도록 돕습니다.

Forward Deployed Engineer와 셀프 서비스를 언제 선택해야 합니까?

더 빠른 가치 실현 시간, 더 심층적인 통합 또는 더 복잡한 워크플로우를 원한다면 전방 배치 엔지니어를 선택하십시오. 셀프 서비스는 내부 구축을 선호하는 단순한 파일럿 및 팀에 매우 적합합니다.

AI 동향2025년 12월 28일

고객 서비스에서의 LLM 환각: 오답을 최소화하는 방법

브랜든 루

구구

고객이 반품 정책에 대해 문의합니다. AI는 "모든 상품을 90일 이내에 반품하시면 전액 환불받을 수 있습니다."라고 자신 있게 대답합니다. 실제 정책은 30일이며 교환만 가능합니다. 이는 버그가 아닙니다. 이는 LLM 환각이며, 고객 서비스에서 환불 분쟁, 규정 준수 위반 및 대규모 브랜드 손상을 유발할 수 있습니다.

LLM 환각이란 무엇이며 왜 발생합니까?

대규모 언어 모델은 가장 가능성이 높은 다음 토큰을 예측하여 텍스트를 생성합니다. 그들은 사실을 "알지" 못합니다. 즉, 훈련 데이터와 패턴을 일치시킵니다. 모델이 훈련 분포 외부의 쿼리를 만나거나 그럴듯한 답변이 여러 개 존재하는 경우 자신감 있게 들리지만 조작된 정보로 공백을 채웁니다.

고객 서비스에서 이는 다음과 같이 나타납니다.

조작된 정책: 존재하지 않는 반품 기간, 보증 조건 또는 가격을 만들어냅니다.

팬텀 주문 상태: 추적 시스템에 다르게 표시될 때 패키지가 배송되었다고 주장함

혼합된 정보: 다양한 제품이나 고객의 세부정보를 단일 응답으로 혼합합니다.

CS가 특히 취약한 이유

창의적인 글쓰기나 브레인스토밍과 달리 고객 서비스에서는 사실에 기반한 정확성이 요구됩니다. 모든 잘못된 답변에�� 구체적인 후속 비용이 발생합니다. 잘못 약속한 할인은 존중되어야 하며, 조작된 배송 날짜는 신뢰를 약화시키고, 잘못 인용된 규정 준수 정책은 규제 조치를 촉발할 수 있습니다.

전략 1: 검색 증강 생성(RAG)

RAG는 모델의 파라메트릭 메모리에 의존하는 대신 LLM이 검색된 문서를 기반으로 응답하도록 강제합니다.

작동 방식

1. 고객문의를 임베딩으로 변환

2. 임베딩은 검증된 지식(제품 사양, 정책, FAQ)의 벡터 데이터베이스를 검색합니다.

3. 가장 일치하는 문서가 프롬프트에 컨텍스트로 삽입됩니다.

4. LLM은 해당 문서를 기반으로 응답을 생성합니다.

실용적인 팁

지식 기반을 최신 상태로 유지하세요. 오래된 문서로 인해 오래된 답변이 생성됩니다.

문서를 작고 집중된 세그먼트(200-500개 토큰)로 나눕니다.

AI가 출처를 인용할 수 있도록 메타데이터(마지막 업데이트 날짜, 문서 출처)를 포함합니다.

생성 품질과 별도로 검색 품질을 테스트합니다.

전략 2: 출력 가드레일 및 검증

RAG를 사용하더라도 모델은 여전히 환각을 느낄 수 있습니다. 두 번째 방어 계층은 출력이 고객에게 도달하기 전에 검증합니다.

접근 방식

사실 확인 파이프라인: 보조 모델 또는 규칙 엔진이 지식 기반에 대한 응답을 상호 참조합니다.

엔티티 유효성 검사: 응답에서 엔터티(가격, 날짜, 주문 번호)를 추출하고 소스 시스템과 비교하여 확인합니다.

차단 목록 시행: 모델이 하지 말아야 할 약속("보장", "약속", 특정 달러 금액)을 하지 못하도록 방지합니다.

응답 템플릿: 위험성이 높은 답변(환불 정책, 법적 고지 사항)의 경우 무료 생성 대신 템플릿 응답을 사용하세요.

전략 3: 신뢰도 평가 및 확대

모든 쿼리에 생성된 답변이 필요한 것은 아닙니다. 모델이 불확실할 경우 그렇게 말하거나 에스컬레이션해야 합니다.

구현

1. 검색 관련성과 생성 확률을 기반으로 신뢰도 점수를 계산합니다.

2. 임계값 설정: 높은 신뢰도 → 자동 응답, 중간 → 주의 사항에 따라 응답, 낮음 → 인간에게 에스컬레이션

3. 검토 및 교육 데이터 수집을 위해 신뢰도가 낮은 모든 상호 작용을 기록합니다.

4. CSAT 및 봉쇄율과 함께 환각률을 주간 지표로 추적합니다.

전략 4: 지속적인 모니터링 및 피드백 루프

환각은 일회성 문제로 해결되는 문제가 아닙니다. 제품 카탈로그, 정책 및 고객 기반이 변경됨에 따라 발전합니다.

피드백 루프 구축

��릭 한 번으로 에이전트가 잘못된 AI 응답에 플래그를 지정할 수 있습니다.

매주 인적 검토를 위해 AI가 처리하는 대화의 5~10% 샘플

"수정 비율" 추적 - 에이전트가 AI 제안 응답을 수정하는 빈도

검증된 수정 사항을 지식 기반 및 미세 조정 데이터에 다시 공급합니다.

환각을 관리 가능하게 만들기

현재 LLM 기술로는 환각 제로를 달성할 수 없습니다. 그러나 올바른 아키텍처를 사용하면 환각률이 1% 미만입니다. 핵심은 계층화된 방어입니다. RAG로 모델을 기반으로 하고, 가드레일로 출력을 검증하고, 불확실할 경우 에스컬레이션하고, 지속적으로 성능을 모니터링합니다.

AI 고객 서비스로 성공하는 기업은 가장 앞선 모델을 갖춘 기업이 아니다. 그들은 해당 모델에 대해 가장 엄격한 엔지니어링을 갖춘 사람들입니다.

브랜든 루

구구

AI 기술을 활용하여 고객 서비스와 비즈니스 운영을 혁신하는 데 열정을 갖고 있습니다.

더 많은 기사 읽기