OOTB — Out of the Box

Search & Discovery Agent para Commerce Cloud.

El buscador deja de fallar en lenguaje natural. La página de zero results desaparece.

El agente OOTB de Agentforce que actúa como middleware invisible entre el buscador del storefront y el catálogo: interpreta intención, expande la query con sinónimos semánticos, ejecuta búsqueda vectorial sobre Catalog DMO con embeddings, hace re-ranking dinámico por stock, margen y comportamiento, y recupera con propuestas alternativas cuando hay zero results. Pensado para equipos de Search, Site Operations, Merchandising y UX en retailers donde el "no results" mata conversión.

Search & Discovery Agent

¿Qué hace Search & Discovery Agent?

Es un agente OOTB de Agentforce que opera como capa intermedia transparente para el frontend. Recibe la query del shopper en texto, voz o imagen, la clasifica por intención (navegacional, transaccional, informacional, comparativa), la expande semánticamente, ejecuta búsqueda vectorial sobre Catalog DMO, combina similitud semántica con señales de negocio (stock, margen, rating, sell-through estacional) y devuelve resultados rankeados al frontend. Cuando el shopper queda con un set demasiado amplio, propone refinamientos en lenguaje natural; cuando hay zero results, expande agresivamente, relaja filtros y propone alternativas.

Búsqueda semántica con re-ranking Vectores de embedding sobre Catalog DMO + señales de negocio para devolver resultados que efectivamente convierten.
Refinamiento conversacional inteligente Propone el filtro más discriminante en lenguaje natural en lugar de mostrar todas las facetas disponibles.
Cero "no results" para el shopper No-results Recovery expande la query, relaja filtros y propone alternativas antes de mostrar página vacía.
Visual y voice search El shopper puede subir una foto o hablar. El agente genera embedding visual o normaliza la transcripción y busca igual.

Cómo funciona paso a paso

De la query a los resultados rankeados. 5 pasos invisibles para el shopper.

1

Clasificación de intent y expansión semántica

Query Intent Resolver clasifica la query (navegacional, transaccional, informacional, comparativa). Si es ambigua, expandQuery genera variantes semánticas usando el contexto del catálogo y la sesión.

2

Búsqueda vectorial sobre Catalog DMO

semanticSearch ejecuta nearest neighbor search contra el vector store (Pinecone, Weaviate o Data Cloud Vector Store nativo) usando el embedding de la query. Recupera top-K candidatos por similitud.

3

Hidratación con señales de negocio

Inventory Hydrator y Product Attributes Hydrator enriquecen los candidatos con stock real, atributos extendidos y filtros aplicables. Browsing Context Hydrator personaliza por sesión sin requerir autenticación.

4

Re-ranking dinámico

Combina score semántico con señales de negocio: stock, margen, rating, sell-through estacional y comportamiento de la sesión. Devuelve los primeros 24-48 productos rankeados al frontend vía SCAPI.

5

Refinamiento o recovery según resultado

Si hay más de 200 ítems, suggestRefinement propone el filtro más discriminante en lenguaje natural. Si hay zero results, No-results Recovery expande agresivamente y propone alternativas antes de mostrar página vacía.

Ejemplo de interacción real

[Shopper escribe en el buscador del storefront]

"Remera blanca para correr en verano que no transparente."

[El agente interpreta y devuelve]

12 resultados rankeados con: color blanco, categoría running, atributo "tela no transparente / opacidad alta", talles disponibles. Filtros sugeridos en lenguaje natural: "¿Querés que sea sin mangas o con mangas cortas?" antes de mostrar la página completa.

Arquitectura del agente

Topics, Actions, Hydrators y Effectors que sostienen al Search & Discovery Agent.

Topics

Dominios de razonamiento

  • Query Intent Resolver
  • Refinement Helper
  • Compare Mode
  • No-results Recovery
  • Visual Search (CLIP / Einstein Vision)
  • Voice Search Adapter

Actions

Lo que ejecuta

  • semanticSearch (vector store)
  • expandQuery con sinónimos
  • applyFilters desde lenguaje natural
  • suggestRefinement (filtro más discriminante)
  • similarItems (alternativas)
  • askClarifyingQuestion (máximo 1 por turno)

Hydrators y DMOs

Fuentes de contexto

  • Catalog embeddings (vector field)
  • Product Attributes Hydrator
  • Browsing context (sesión)
  • Inventory en tiempo real
  • Search Term DMO (queries históricas)
  • Click DMO + Session Context DMO

Effectors y Trust Layer

Escrituras y guardrails

  • Search result ranking writes
  • Synonym dictionary updates
  • A/B test result logs en Data Cloud
  • No-PII en query logs (session ID hasheado)
  • Masking de queries sensibles (médico, sexual)
  • Auditabilidad del ranking explicable

Implementación en 5 fases

El driver principal es la calidad del catálogo y la elección del vector store. Timing típico: 9 a 12 semanas.

1
Sem 1-2

Discovery y elección de stack semántico

Auditamos calidad de atributos del catálogo, evaluamos vector store (Data Cloud Vector Store nativo, Pinecone o Weaviate) según volumen de SKUs, latencia objetivo y presupuesto, y definimos el modelo de embedding (Einstein, multilingual-e5, OpenAI).

Search Lead · IT · Solu Architect Decisión de vector store + modelo de embedding
2
Sem 2-4

Generación e indexado de embeddings

Pipeline de generación de embeddings sobre Catalog DMO, configuración del vector store, sincronización incremental ante cambios de catálogo y validación de calidad de embeddings con queries adversariales.

Data Engineer · ML Engineer Catálogo indexado + pipeline de refresh
3
Sem 4-7

Agent build y re-ranker

Configuración de Topics, Actions y políticas en Agent Builder, integración del re-ranker con señales de negocio y montaje del middleware sobre el SCAPI search endpoint.

Agentforce Architect · Frontend Dev Agente en sandbox + middleware funcionando
4
Sem 7-10

A/B testing vs buscador actual

Rollout 50/50 del agente vs el buscador vigente. Comparamos zero-results rate, CTR, conversion post-búsqueda y search-to-cart velocity. Calibramos thresholds de refinamiento y recovery.

Search Lead · QA · Analytics Reporte de A/B + decisión de cutover
5
Sem 10-12+

Go-live, voice y visual search

Cutover total al agente. Habilitación de voice search en mobile y visual search si la vertical lo justifica (fashion, home deco). Tuning mensual del re-ranker.

Search Leadership · Solu Managed Service Dashboard de calidad de búsqueda en producción

Equipo típico de implementación

Agentforce Architect Diseño del agente, Topics, ranking
ML Engineer Embeddings, re-ranker, evaluación
Data Engineer Vector store, sync de catálogo, DMOs
Frontend Developer SCAPI middleware, voice / visual UI
Search Analyst Evaluación de queries, calibración

Requisitos para arrancar

Lo que necesitás listo antes del go-live.

Datos mínimos

  • Catalog DMO rico con atributos extendidos
  • Embeddings configurados sobre el catálogo
  • Histórico de búsquedas para training del re-ranking
  • Inventory en tiempo real para excluir OOS

Licencias

  • Salesforce Commerce Cloud B2C o B2B
  • Commerce Cloud Agentic Edition
  • Data Cloud for Commerce (Vector Store nativo) o Pinecone / Weaviate
  • Einstein Vision (opcional, para Visual Search)

Integraciones

  • SCAPI search endpoint
  • Vector DB (Pinecone, Weaviate o Data Cloud nativo)
  • Modelo de embedding (Einstein, OpenAI, multilingual-e5)
  • Modelo multimodal (CLIP, GPT-4o Vision) si Visual Search

Org readiness

  • Política de retención de queries documentada
  • Equipo de Search / Site Operations entrenado
  • Pipeline de actualización de embeddings ante cambios de catálogo
  • Dashboard de queries con zero results para feedback al merchandising

KPIs: antes y después

KPIs esperados al implementar este agente. Rangos referenciales para planificación; los resultados reales dependen del estado de los datos y la operación de cada empresa.

Métrica Antes (keyword matching) Después (Search & Discovery) Cambio
Tasa de zero-results Baseline -50 a 70% -50-70%
CTR de resultados Baseline +20 a 40% +20-40%
Conversion post-búsqueda Baseline +15 a 25% +15-25%
Search-to-cart velocity Baseline -30 a 40% -30-40%
Queries en lenguaje natural exitosas Bajo recall Alto recall + alta precisión Lift cualitativo fuerte
Tiempo a primer click Baseline -20 a 35% -20-35%

Verticales de mayor impacto: fashion (atributos de estilo, ocasión, opacidad), home deco (estilo, materiales, dimensiones), beauty (skin type, restricciones), electrónica (compatibilidad técnica), supermercado (sinónimos regionales y restricciones dietéticas). El factor común: queries en lenguaje natural que el keyword matching no resuelve.

Tenemos casos en este agente — hablemos para compartir los relevantes a tu industria.

Riesgos comunes y cómo los mitigamos

Sesgo del modelo en categorías mayoritarias

El re-ranker favorece bestsellers y entierra productos de cola larga.

Mitigación: fairness floor por categoría, exposición mínima garantizada para productos nuevos, evaluación periódica de la distribución de exposición y A/B contra ranking puramente semántico.

Queries multilingües con cobertura desigual

Buen rendimiento en español neutro, peor en portugués o regionalismos mexicanos.

Mitigación: embeddings multilingual-e5-large para LATAM, evaluación específica por idioma y país, y diccionarios de sinónimos por mercado.

Dependencia de la calidad del Catalog

Atributos incompletos o inconsistentes degradan los embeddings y los resultados.

Mitigación: auditoría de calidad como entregable de la fase 1, integración con Merchandiser Agent para enrichment continuo y bloqueo de queries en categorías por debajo del umbral de calidad.

Latencia del re-ranking sobre catálogos grandes

Búsquedas con 200K SKUs pueden superar el SLA de respuesta del frontend.

Mitigación: Pinecone con filtrado híbrido (vectorial + keyword) para reducir candidatos, cache por sesión y SLA explícito documentado por percentil P95.

Queries sensibles loggeadas sin masking

Búsquedas médicas, sexuales o de salud mental quedan en logs identificables.

Mitigación: capa de clasificación de sensibilidad antes de loguear, masking automático por categoría, session ID hasheado con rotación diaria y política de retención explícita.

Preguntas Frecuentes

Sí, pero de forma transparente. El agente actúa como middleware sobre el SCAPI search endpoint: el frontend sigue invocando la misma API y recibe los resultados ya enriquecidos. No requiere rewriting del storefront. La fase de A/B testing permite validar el lift antes del cutover total.

Para catálogos hasta 5M de vectores con latencia 50-100 ms, el Vector Store nativo de Data Cloud es la primera opción: cero integraciones externas, costos integrados al contrato. Para catálogos más grandes o SLAs sub-20 ms, Pinecone es la alternativa por defecto. Weaviate cuando se necesita filtrado híbrido vectorial + keyword.

Es altamente recomendado. Data Cloud es el lugar donde vive el Product DMO con vector field, el Search Term DMO, el Click DMO y el Session Context DMO. Sin Data Cloud, el agente puede operar contra un vector store externo, pero pierde la unificación de señales y la trazabilidad para evaluación.

Sí. Voice Search Adapter normaliza transcripciones del Speech-to-Text del dispositivo, corrige errores y aplica el mismo pipeline semántico. Visual Search acepta imágenes, genera embedding visual con CLIP o Einstein Vision y compara contra los embeddings visuales del catálogo. Visual search rinde mejor en fashion y home deco.

Combinación de métricas: zero-results rate, CTR por posición, conversion post-búsqueda, search-to-cart velocity y NDCG sobre un golden set de queries con relevancia anotada manualmente. Cada release pasa por evaluación contra el golden set antes del promote a producción.

El Inventory Hydrator se ejecuta como capa de filtrado antes del re-ranking. Los productos OOS se degradan en el ranking o se excluyen según la configuración. Para algunos clientes preferimos mostrar el producto sin stock con un mensaje "disponible en X días" para no sacrificar relevancia, pero la decisión es configurable por categoría.

Sí. La integración es vía SCAPI (Salesforce Commerce API), por lo que funciona idénticamente con PWA Kit, LWR Store o storefronts custom headless. La capa middleware es invisible para el frontend, que sigue invocando los mismos endpoints SCAPI.

El buscador deja de ser el cuello de botella de la conversión.

Hablá con un Commerce Architect de Solu. Auditamos tu catálogo, tus queries históricas y proyectamos el lift esperable contra tu buscador actual.