Search & Discovery Agent para Commerce Cloud.
El buscador deja de fallar en lenguaje natural. La página de zero results desaparece.
El agente OOTB de Agentforce que actúa como middleware invisible entre el buscador del storefront y el catálogo: interpreta intención, expande la query con sinónimos semánticos, ejecuta búsqueda vectorial sobre Catalog DMO con embeddings, hace re-ranking dinámico por stock, margen y comportamiento, y recupera con propuestas alternativas cuando hay zero results. Pensado para equipos de Search, Site Operations, Merchandising y UX en retailers donde el "no results" mata conversión.
¿Qué hace Search & Discovery Agent?
Es un agente OOTB de Agentforce que opera como capa intermedia transparente para el frontend. Recibe la query del shopper en texto, voz o imagen, la clasifica por intención (navegacional, transaccional, informacional, comparativa), la expande semánticamente, ejecuta búsqueda vectorial sobre Catalog DMO, combina similitud semántica con señales de negocio (stock, margen, rating, sell-through estacional) y devuelve resultados rankeados al frontend. Cuando el shopper queda con un set demasiado amplio, propone refinamientos en lenguaje natural; cuando hay zero results, expande agresivamente, relaja filtros y propone alternativas.
Cómo funciona paso a paso
De la query a los resultados rankeados. 5 pasos invisibles para el shopper.
Clasificación de intent y expansión semántica
Query Intent Resolver clasifica la query (navegacional, transaccional, informacional, comparativa). Si es ambigua, expandQuery genera variantes semánticas usando el contexto del catálogo y la sesión.
Búsqueda vectorial sobre Catalog DMO
semanticSearch ejecuta nearest neighbor search contra el vector store (Pinecone, Weaviate o Data Cloud Vector Store nativo) usando el embedding de la query. Recupera top-K candidatos por similitud.
Hidratación con señales de negocio
Inventory Hydrator y Product Attributes Hydrator enriquecen los candidatos con stock real, atributos extendidos y filtros aplicables. Browsing Context Hydrator personaliza por sesión sin requerir autenticación.
Re-ranking dinámico
Combina score semántico con señales de negocio: stock, margen, rating, sell-through estacional y comportamiento de la sesión. Devuelve los primeros 24-48 productos rankeados al frontend vía SCAPI.
Refinamiento o recovery según resultado
Si hay más de 200 ítems, suggestRefinement propone el filtro más discriminante en lenguaje natural. Si hay zero results, No-results Recovery expande agresivamente y propone alternativas antes de mostrar página vacía.
Ejemplo de interacción real
[Shopper escribe en el buscador del storefront]
[El agente interpreta y devuelve]
Arquitectura del agente
Topics, Actions, Hydrators y Effectors que sostienen al Search & Discovery Agent.
Topics
Dominios de razonamiento
- Query Intent Resolver
- Refinement Helper
- Compare Mode
- No-results Recovery
- Visual Search (CLIP / Einstein Vision)
- Voice Search Adapter
Actions
Lo que ejecuta
- semanticSearch (vector store)
- expandQuery con sinónimos
- applyFilters desde lenguaje natural
- suggestRefinement (filtro más discriminante)
- similarItems (alternativas)
- askClarifyingQuestion (máximo 1 por turno)
Hydrators y DMOs
Fuentes de contexto
- Catalog embeddings (vector field)
- Product Attributes Hydrator
- Browsing context (sesión)
- Inventory en tiempo real
- Search Term DMO (queries históricas)
- Click DMO + Session Context DMO
Effectors y Trust Layer
Escrituras y guardrails
- Search result ranking writes
- Synonym dictionary updates
- A/B test result logs en Data Cloud
- No-PII en query logs (session ID hasheado)
- Masking de queries sensibles (médico, sexual)
- Auditabilidad del ranking explicable
Implementación en 5 fases
El driver principal es la calidad del catálogo y la elección del vector store. Timing típico: 9 a 12 semanas.
Discovery y elección de stack semántico
Auditamos calidad de atributos del catálogo, evaluamos vector store (Data Cloud Vector Store nativo, Pinecone o Weaviate) según volumen de SKUs, latencia objetivo y presupuesto, y definimos el modelo de embedding (Einstein, multilingual-e5, OpenAI).
Generación e indexado de embeddings
Pipeline de generación de embeddings sobre Catalog DMO, configuración del vector store, sincronización incremental ante cambios de catálogo y validación de calidad de embeddings con queries adversariales.
Agent build y re-ranker
Configuración de Topics, Actions y políticas en Agent Builder, integración del re-ranker con señales de negocio y montaje del middleware sobre el SCAPI search endpoint.
A/B testing vs buscador actual
Rollout 50/50 del agente vs el buscador vigente. Comparamos zero-results rate, CTR, conversion post-búsqueda y search-to-cart velocity. Calibramos thresholds de refinamiento y recovery.
Go-live, voice y visual search
Cutover total al agente. Habilitación de voice search en mobile y visual search si la vertical lo justifica (fashion, home deco). Tuning mensual del re-ranker.
Equipo típico de implementación
Requisitos para arrancar
Lo que necesitás listo antes del go-live.
Datos mínimos
- Catalog DMO rico con atributos extendidos
- Embeddings configurados sobre el catálogo
- Histórico de búsquedas para training del re-ranking
- Inventory en tiempo real para excluir OOS
Licencias
- Salesforce Commerce Cloud B2C o B2B
- Commerce Cloud Agentic Edition
- Data Cloud for Commerce (Vector Store nativo) o Pinecone / Weaviate
- Einstein Vision (opcional, para Visual Search)
Integraciones
- SCAPI search endpoint
- Vector DB (Pinecone, Weaviate o Data Cloud nativo)
- Modelo de embedding (Einstein, OpenAI, multilingual-e5)
- Modelo multimodal (CLIP, GPT-4o Vision) si Visual Search
Org readiness
- Política de retención de queries documentada
- Equipo de Search / Site Operations entrenado
- Pipeline de actualización de embeddings ante cambios de catálogo
- Dashboard de queries con zero results para feedback al merchandising
KPIs: antes y después
KPIs esperados al implementar este agente. Rangos referenciales para planificación; los resultados reales dependen del estado de los datos y la operación de cada empresa.
| Métrica | Antes (keyword matching) | Después (Search & Discovery) | Cambio |
|---|---|---|---|
| Tasa de zero-results | Baseline | -50 a 70% | -50-70% |
| CTR de resultados | Baseline | +20 a 40% | +20-40% |
| Conversion post-búsqueda | Baseline | +15 a 25% | +15-25% |
| Search-to-cart velocity | Baseline | -30 a 40% | -30-40% |
| Queries en lenguaje natural exitosas | Bajo recall | Alto recall + alta precisión | Lift cualitativo fuerte |
| Tiempo a primer click | Baseline | -20 a 35% | -20-35% |
Verticales de mayor impacto: fashion (atributos de estilo, ocasión, opacidad), home deco (estilo, materiales, dimensiones), beauty (skin type, restricciones), electrónica (compatibilidad técnica), supermercado (sinónimos regionales y restricciones dietéticas). El factor común: queries en lenguaje natural que el keyword matching no resuelve.
Tenemos casos en este agente — hablemos para compartir los relevantes a tu industria.
Riesgos comunes y cómo los mitigamos
Sesgo del modelo en categorías mayoritarias
El re-ranker favorece bestsellers y entierra productos de cola larga.
Mitigación: fairness floor por categoría, exposición mínima garantizada para productos nuevos, evaluación periódica de la distribución de exposición y A/B contra ranking puramente semántico.
Queries multilingües con cobertura desigual
Buen rendimiento en español neutro, peor en portugués o regionalismos mexicanos.
Mitigación: embeddings multilingual-e5-large para LATAM, evaluación específica por idioma y país, y diccionarios de sinónimos por mercado.
Dependencia de la calidad del Catalog
Atributos incompletos o inconsistentes degradan los embeddings y los resultados.
Mitigación: auditoría de calidad como entregable de la fase 1, integración con Merchandiser Agent para enrichment continuo y bloqueo de queries en categorías por debajo del umbral de calidad.
Latencia del re-ranking sobre catálogos grandes
Búsquedas con 200K SKUs pueden superar el SLA de respuesta del frontend.
Mitigación: Pinecone con filtrado híbrido (vectorial + keyword) para reducir candidatos, cache por sesión y SLA explícito documentado por percentil P95.
Queries sensibles loggeadas sin masking
Búsquedas médicas, sexuales o de salud mental quedan en logs identificables.
Mitigación: capa de clasificación de sensibilidad antes de loguear, masking automático por categoría, session ID hasheado con rotación diaria y política de retención explícita.
Preguntas Frecuentes
Sí, pero de forma transparente. El agente actúa como middleware sobre el SCAPI search endpoint: el frontend sigue invocando la misma API y recibe los resultados ya enriquecidos. No requiere rewriting del storefront. La fase de A/B testing permite validar el lift antes del cutover total.
Para catálogos hasta 5M de vectores con latencia 50-100 ms, el Vector Store nativo de Data Cloud es la primera opción: cero integraciones externas, costos integrados al contrato. Para catálogos más grandes o SLAs sub-20 ms, Pinecone es la alternativa por defecto. Weaviate cuando se necesita filtrado híbrido vectorial + keyword.
Es altamente recomendado. Data Cloud es el lugar donde vive el Product DMO con vector field, el Search Term DMO, el Click DMO y el Session Context DMO. Sin Data Cloud, el agente puede operar contra un vector store externo, pero pierde la unificación de señales y la trazabilidad para evaluación.
Sí. Voice Search Adapter normaliza transcripciones del Speech-to-Text del dispositivo, corrige errores y aplica el mismo pipeline semántico. Visual Search acepta imágenes, genera embedding visual con CLIP o Einstein Vision y compara contra los embeddings visuales del catálogo. Visual search rinde mejor en fashion y home deco.
Combinación de métricas: zero-results rate, CTR por posición, conversion post-búsqueda, search-to-cart velocity y NDCG sobre un golden set de queries con relevancia anotada manualmente. Cada release pasa por evaluación contra el golden set antes del promote a producción.
El Inventory Hydrator se ejecuta como capa de filtrado antes del re-ranking. Los productos OOS se degradan en el ranking o se excluyen según la configuración. Para algunos clientes preferimos mostrar el producto sin stock con un mensaje "disponible en X días" para no sacrificar relevancia, pero la decisión es configurable por categoría.
Sí. La integración es vía SCAPI (Salesforce Commerce API), por lo que funciona idénticamente con PWA Kit, LWR Store o storefronts custom headless. La capa middleware es invisible para el frontend, que sigue invocando los mismos endpoints SCAPI.
El buscador deja de ser el cuello de botella de la conversión.
Hablá con un Commerce Architect de Solu. Auditamos tu catálogo, tus queries históricas y proyectamos el lift esperable contra tu buscador actual.