Voice Summary Agent para Service Cloud.
Cada llamada transcripta, resumida y auditada. Sin wrap manual, sin compliance ciego.
El agente de Agentforce que procesa llamadas de Service Cloud Voice en streaming: transcripción completa, resumen estructurado con commitments, next-steps y flags de compliance. Para contact centers donde la voz es el canal principal y el 80% de las llamadas se cierran sin resumen.
¿Qué hace Voice Summary Agent?
Voice Summary Agent es un agente autónomo de Agentforce que opera dentro de Service Cloud Voice. Cada vez que una llamada finaliza, el agente toma la transcripción completa, genera un resumen estructurado con causa raíz, resolución, commitments y next-steps, y detecta menciones de compliance sensibles. El resultado: cobertura de audit del 20% al 95%+ y wrap time de voz de 4-6 minutos a menos de 1 minuto.
Cómo funciona paso a paso
De la llamada entrante al resumen persistido en el Case. 7 pasos, sin wrap manual.
Llamada entra
Cliente llama al contact center vía Service Cloud Voice (Amazon Connect).
STT en streaming
Transcripción speech-to-text en tiempo real, adjunta a MessagingSession del Case.
Agente humano resuelve
Interacción normal, con transcripción corriendo en background.
Llamada finaliza
Al cierre, la transcripción completa está disponible.
IA genera resumen
Lee transcripción completa, extrae resumen + commitments + next-steps + flags de compliance.
Supervisor revisa flags
Si hay flags de compliance (PII, amenazas, reclamos regulatorios), supervisor recibe alerta.
Resumen persiste en Case
Se guarda en el Case para QA, reporting y compliance audit.
Ejemplo de interacción real
[Llamada de 12 minutos — disputa de cargo]
[Voice Summary genera:]
Arquitectura del agente
Los cuatro pilares que hacen funcionar a Voice Summary Agent dentro de tu org de Salesforce.
Data
Fuentes de grounding
- Service Cloud Voice (audio stream)
- Amazon Connect (CTI)
- MessagingSession + ConversationEntry (transcripción)
- Case context
- Account 360
Actions
Lo que el agente ejecuta
- Transcribir audio en streaming (STT)
- Generar resumen estructurado
- Extraer commitments y next-steps
- Detectar keywords de compliance/PII
- Alertar a supervisor
- Persistir en Case
Guardrails
Controles de confianza
- Trust Layer PII masking
- Retention policy de audio (configurable por regulación)
- Flag automático de palabras críticas
- Zero data retention del LLM
- Audit trail completo
Channels
Dónde opera el agente
- Service Cloud Voice (Amazon Connect)
- Partner CTI (Genesys, Cisco, NICE CXone)
- Supervisor Console (alertas)
Implementación en 5 fases
De discovery a producción. Voice Summary Agent requiere validación de STT y compliance: 8 a 10 semanas.
Discovery y voice audit
Evaluar setup de Service Cloud Voice, calidad de STT, volumen de llamadas, compliance requirements.
Data readiness
Configurar STT en streaming, validar calidad de transcripción, definir retention policy.
Agent build
Configurar prompts de resumen, listas de keywords de compliance, alertas a supervisor.
Testing y piloto
Test con grabaciones históricas, piloto con equipo de voz, validar calidad de resumen y flags.
Go-live y tuning
Rollout, tuning de STT por acento/dialecto, expansión de keywords de compliance.
Equipo típico de implementación
Requisitos para arrancar
Lo que necesitás tener listo antes de poner Voice Summary Agent en producción.
Datos mínimos
- Service Cloud Voice configurado con Amazon Connect (o partner CTI)
- STT en streaming habilitado
- Retention policy de audio + transcripción definida
Licencias
- Service Cloud Enterprise+
- Agentforce for Service
- Service Cloud Voice add-on
- Amazon Connect (costos de telefonía + STT)
Integraciones
- Amazon Connect (CTI nativo)
- STT provider (Amazon Transcribe incluido en Connect)
- Service Console (panel de transcripción)
- Supervisor Console (alertas)
Org readiness
- Sponsor en Operaciones de voz
- Compliance/Legal con retention policy firmada
- QA team de voz activo
- Infra de Amazon Connect estable
KPIs: antes y después
Tenemos casos en este agente — hablemos para compartir los relevantes a tu industria.
| Métrica | Antes (manual) | Después (agente) | Cambio |
|---|---|---|---|
| Cases con resumen post-llamada | 20% | 95%+ | +75 ppt |
| Tiempo de wrap voz | 4-6 min | < 1 min | -85% |
| Compliance audit coverage | Baseline | +5× | +5× |
| Commitments documentados | Rara vez | Siempre | Completo |
| Flags de compliance detectados | Manual/aleatorio | Automático | Sistemático |
| Time-to-value post go-live | N/A | 3-4 semanas | Rápido |
Riesgos comunes y cómo los mitigamos
STT con ruido
Audio de baja calidad degrada la transcripción.
Mitigación: Threshold de calidad de audio, flag de "transcripción con baja confianza", fallback a wrap manual.
Dialectos y acentos
STT optimizado para español neutro, menor accuracy en acentos regionales.
Mitigación: Tuning del modelo STT por país, testing con grabaciones reales de cada región.
PII en audio y transcripción
Datos sensibles en la grabación.
Mitigación: Masking post-transcripción, retention policy con borrado automático, acceso restringido al audio.
Latencia de STT
STT lento afecta la experiencia del agente.
Mitigación: Streaming con buffer, transcripción parcial visible en tiempo real, resumen solo post-llamada.
Resistencia cultural a la grabación
Agentes incómodos con transcripción permanente.
Mitigación: Comunicación clara del propósito (QA y compliance, no vigilancia), consentimiento del cliente, opt-out del agente para coaching.
Preguntas Frecuentes
Sí. Voice Summary Agent requiere transcripción de las llamadas. Service Cloud Voice con Amazon Connect provee el STT nativo. Si usás otro CTI (Genesys, Cisco), se requiere integración adicional para el stream de transcripción.
Sí. El STT corre en streaming durante la llamada. La transcripción aparece en el Case en tiempo real. El resumen se genera al finalizar la llamada, típicamente en menos de 1 minuto.
La retention policy se define con Legal y Compliance. Típicamente: transcripción retenida 12-24 meses, audio 6-12 meses, borrado automático al vencimiento. Todo configurable por regulación y país.
Sí. El agente tiene listas de keywords configurables (reclamo formal, defensa del consumidor, amenaza legal, PII sensible). Cuando detecta una mención, genera un flag y alerta al supervisor en tiempo real.
Sí. Amazon Transcribe soporta español (variantes) y portugués brasileño. La accuracy varía por acento y ruido, pero en condiciones normales de contact center es ≥85%. Se puede tunear por región.
Cada llamada, documentada y auditada.
Hablá con un Service Architect de Solu. Te mostramos cómo Voice Summary transforma tu operación de voz.