CUSTOM — Diseñado por Solu

Predictive Score Agent para Data Cloud.

Scores predictivos en producción en semanas, no en meses.

Agente custom orientado a Data Science Lead, Marketing Analytics y Customer Success. Orquesta el ciclo completo de scores predictivos sobre Data Cloud y Einstein Studio: propensity to buy, churn risk, LTV y next-best-action. Sugiere features, valida training data, deploya como Calculated Insight o Activation Target y monitorea drift desde el día uno. Reemplaza el ML engineering manual de scores específicos por un flujo agent-orchestrated con fairness audit y model lineage.

Volver a Data Cloud

Predictive Score Agent

¿Qué hace Predictive Score Agent?

Es un agente custom que orquesta el ciclo end-to-end de scores predictivos sobre Data Cloud y Einstein Studio. Decompone el use-case, propone features sobre los DMOs disponibles, genera training set sin leakage, recomienda modelo (AutoML o BYOM), calibra el output, lo deploya como CI o Activation Target y deja drift monitoring activo. Conserva model lineage y memoria del rendimiento histórico para acelerar la próxima iteración.

Use-case decomposition Traduce un objetivo de negocio en variable target, ventana y features candidatas.

Training set sin leakage Generación con identity resolution longitudinal y validación de leakage automatizada.

Deploy como CI o Activation Target El score queda accesible para campañas, segmentos y dashboards sin pipelines manuales.

Drift monitoring activo Alertas tempranas cuando cambian la distribución de features o la calibración del score.

Cómo funciona paso a paso

Del use-case al score productivo con drift monitoring. 6 pasos.

Decomposition del use-case

El equipo describe el objetivo (anticipar churn B2B, propensión a un upsell, LTV a 12 meses). El Use-case Decomposer define variable target, ventana de observación y horizonte de predicción.

Feature engineering propuesto

El Feature Suggester recorre DMOs y CIs disponibles, propone features candidatas con justificación y descarta las que no aportan señal o introducen leakage potencial.

Generación del training set

generateTrainingSet aplica identity resolution longitudinal, alinea ventanas, valida ausencia de leakage y deja el dataset versionado en el feature store interno.

Train y calibrate

El Model Recommender sugiere algoritmo (Einstein Studio AutoML o BYOM en sandbox) según la naturaleza del problema. trainModel ejecuta el entrenamiento y el Calibrator alinea el score con la realidad histórica.

Deploy con governance

deployAsCI publica el score como Calculated Insight accesible para campaign builders y dashboards. El fairness audit queda registrado y los Activation Targets se sincronizan con el catálogo.

Drift monitoring y retrain

monitorDrift compara distribuciones live contra training. Cuando supera threshold, retrain dispara una iteración o deprecate retira el score. El model lineage queda actualizado.

Ejemplo de interacción real

[Customer Success Lead en Slack]

"Necesitamos un churn score B2B con horizonte a 90 días, accesible desde la consola de CSMs y desde campañas de win-back."

[El agente responde]

"Decompongo: target = churn 90 días, ventana de observación 180 días. Propongo 22 features sobre Account, Activity y Product Usage. Sugiero XGBoost en Einstein Studio AutoML por baseline rápido. Genero el training set con identity longitudinal, audito fairness por segmento y dejo el score como CI con drift monitoring activo. Quedará disponible en consola y en Activation Targets en cuanto apruebes."

Arquitectura del agente

Topics, Actions, Hydrators, Effectors, Channels, DMOs, Trust Layer y Memory.

Topics

Dominios de razonamiento

Use-case Decomposer
Feature Suggester
Training Set Curator
Model Recommender
Calibrator
Drift Monitor

Actions

Lo que ejecuta

proposeScore
generateTrainingSet
trainModel
deployAsCI
monitorDrift
retrain / deprecate

Hydrators y DMOs

Fuentes de contexto

DMOs y CIs disponibles
Identity Resolution Graph
Label datasets
Modelos previos y métricas
Einstein Studio model registry
Feature store interno

Effectors, Channels, Trust, Memory

Escrituras y guardrails

Write Einstein Studio model
Deploy as CI / Activation Target
Channels: Lightning, Slack, Tableau Pulse
Trust Layer con fairness audit
Sin PII en features sin justificación
Memory: model lineage histórico

Implementación en 5 fases

Los factores críticos son la calidad de las labels y el feature engineering pipeline.

Fase 1

Discovery del use-case

Definimos objetivo de negocio, variable target y horizonte. Validamos disponibilidad de labels limpias y representativas en Data Cloud.

Data Science Lead · Solu Use-case canvas con target, ventana y labels

Fase 2

Feature pipeline y feature store

Construimos pipeline de features sobre DMOs, definimos governance y dejamos el feature store accesible para entrenamiento e inferencia.

Data Engineer · Solu Data Architect Pipeline + feature store versionado

Fase 3

Configuración del agente y fairness audit

Definimos Topics, Actions, política de fairness, BYOM si aplica y reglas de approval del modelo. Calibramos el monitoring de drift.

Agentforce Architect · ML Engineer Agente en sandbox con audit policy

Fase 4

Piloto sobre primer use-case

Validamos con un score real (churn, propensión, LTV). Medimos AUC, calibration y aceptación del modelo por parte de los consumidores.

Data Scientist · Marketing · QA Modelo en producción + benchmark

Fase 5

Go-live multi-score y monitoring continuo

Rollout multi-score con fairness audit recurrente. Drift monitoring centralizado y catálogo de modelos vivo con owner por score.

CDO · Solu Managed Service Catálogo de scores + drift dashboard

Perfiles Solu y participantes cliente

Agentforce Architect (Solu) Topics, Actions, Trust Layer

ML Engineer (Solu) Einstein Studio, AutoML, BYOM

Data Architect (Solu) Feature store, identity longitudinal

Data Science Lead (Cliente) Use-cases, labels, evaluación

Compliance Owner (Cliente) Fairness audit, approval del modelo

Requisitos para arrancar

Lo que conviene tener listo antes del piloto.

Datos

Labels limpias (purchases, churns, conversions)
Identity resolution longitudinal estable
DMOs y CIs documentados
Histórico suficiente para la ventana del problema

Integraciones

Einstein Studio activo
Feature pipeline o feature store interno
Lightning, Slack vía MCP, Tableau Pulse
Activation Targets para distribución del score

Organizacional

Owner del score (Data Science o Marketing)
Governance de model approval con fairness audit
Política de retrain y deprecation
Sponsor de Marketing o Customer Success

Qué se busca optimizar

Dimensiones operativas y de calidad del modelo, planteadas como marco genérico.

AUC y calibration

Buscamos modelos con AUC competitiva y calibration alineada al uso (campañas, scoring de leads, NBA).

Time-to-production-model

Comprimir el ciclo de meses a semanas cuando los DMOs y labels existen, sin saltar fairness audit.

Velocidad de retrain ante drift

Cuando aparece drift, accionar retrain o deprecate antes de que afecte a las campañas que dependen del score.

Lift en uso de campañas

Medir el lift incremental cuando el score se aplica a una campaña vs. baseline sin segmentación predictiva.

Cobertura del catálogo de scores

Cuántos use-cases priorizados de marketing y CS están cubiertos con un score oficial vivo.

Calidad del fairness audit

Modelos auditados sin disparidades materiales por segmento, con evidencia versionada.

Qué considerar al implementar

Cinco focos para que los scores se mantengan confiables y útiles a lo largo del tiempo.

Labels limpias y representativas

La calidad del modelo depende de la calidad de las labels. Vale la pena auditar definiciones de churn, conversión y compras para evitar ambigüedades.

Feature engineering pipeline maduro

Un pipeline reproducible, versionado y monitoreado evita features fantasma y diferencias entre training y serving.

Identity resolution longitudinal

Sin identidad estable, los scores se contaminan con cambios de IDs. Una base sólida de identity resolution sostiene tanto el training como la inferencia.

Governance de model approval

Los scores que tocan customer-facing decisions merecen un approval workflow con fairness audit y owner claramente definido.

Política de drift y retrain

Definir thresholds de drift, frecuencia de retrain y criterios de deprecation desde el inicio evita que un score quede vivo pero degradado.

Preguntas Frecuentes

¿Reemplaza al equipo de data science? −

No. Lo que cambia es el reparto del trabajo: el equipo se concentra en use-cases nuevos, fairness, calibración y modelos avanzados. El agente se encarga del pipeline repetitivo (feature suggestion, training set, deploy, drift) que hoy consume la mayor parte del tiempo.

¿Soporta BYOM (bring your own model)? +

Sí. El agente registra modelos externos en Einstein Studio, los expone como CI o Activation Target y aplica el mismo flujo de fairness audit, calibration y drift monitoring.

¿Cómo audita fairness y bias? +

Antes de deploy, el agente compara métricas por segmento sensible y deja un reporte de fairness versionado. Si las disparidades superan el threshold, escala al owner para revisar features y datos antes de aprobar.

¿Funciona con Einstein Studio AutoML? +

Sí. AutoML es el path por defecto cuando el use-case lo permite. El agente recomienda el algoritmo, dispara el training, calibra el output y publica el modelo aprovechando el registry de Einstein Studio.

¿Cómo monitorea drift? +

monitorDrift compara distribuciones live de features y la calibración del score contra el baseline de training. Cuando supera threshold, abre un ticket o dispara retrain según la política configurada.

¿Cómo evita data leakage? +

El Training Set Curator alinea ventanas, valida la temporalidad de cada feature y bloquea aquellas que solo existen después del evento target. Si detecta sospechas, deja el caso visible al data scientist antes de entrenar.

De use-case a score productivo, con fairness audit y drift monitoring.

Conversemos con un Data Architect de Solu. En una sesión de discovery revisamos labels, features e infra para proyectar el time-to-production-model en tu organización.

Ver todos los agentes de Data Cloud