CUSTOM — Solu Built

PII Redaction & Tokenization Agent.

El DPO deja de aprobar exports a mano. La redaction de PII pasa a ser un policy enforcement automático y auditable.

Agente custom de Agentforce que aplica masking, redaction o tokenization dinámica de PII en outputs antes de exports a third-parties, activations, prompts a LLMs y dashboards de stakeholders sin clearance. Va más allá del Trust Layer Salesforce: aplica policies LATAM-específicas (CPF Brasil, CURP México, DNI Argentina, RUT Chile) y mantiene un audit propio del access. Reduce el riesgo regulatorio sin frenar el flujo de datos legítimo.

Volver a Data Cloud

Identidad y Resolución

¿Qué hace el PII Redaction & Tokenization Agent?

Es un agente custom desarrollado sobre Agentforce que aplica masking, redaction y tokenization dinámica sobre cualquier output que contenga PII. Detecta campos sensibles con patterns LATAM-específicos (CPF, CURP, DNI, RUT) y con detección ML, aplica la policy correspondiente según audience, destination y purpose, tokeniza con vault encrypted cuando se necesita reversibilidad, calcula re-identification risk score por output y deja un audit trail completo. El Trust Layer Salesforce queda amplificado, no reemplazado: este agente extiende el masking a exports, activations a third-parties y dashboards externos al Trust Layer nativo.

PII detection LATAM-aware Combina regex específicos (CPF, CURP, DNI, RUT) con detección ML para campos no estructurados.

Policy enforcement por contexto Aplica la policy correcta según audience, destination y purpose de cada output.

Tokenization reversible con vault Vault encrypted para tokenization reversible bajo dual-control cuando la policy lo permite.

Re-identification risk scoring Calcula score por output para anticipar riesgo residual antes de que el dato salga del control de Data Cloud.

Cómo funciona paso a paso

De la detección al audit periódico. 6 pasos diseñados para reducir el riesgo regulatorio sin frenar el flujo de datos legítimo.

Detect PII

El PII Detector LATAM-aware combina patterns explícitos (CPF, CURP, DNI, RUT, email, teléfono) con detección ML para campos no estructurados. Cubre tanto el catálogo metadata-driven como el contenido in-flight.

Apply policy según contexto

Policy Engine identifica la audience (research, marketing, support, third-party), la destination (export S3, activación a Meta, dashboard a stakeholder externo) y el purpose. Selecciona la policy correspondiente con sus reglas de masking, supresión y k-anonymity.

Tokenize si reversibilidad necesaria

Cuando la policy lo permite, Tokenization Service genera tokens reversibles guardados en vault encrypted. Para uso de training de modelos, la tokenization es irreversible. Reversibility Manager controla quién puede detokenizar y bajo qué dual-control.

Log access

Audit Logger registra el evento completo: timestamp, identidad del solicitante, policy aplicada, campos tokenizados, destination y purpose. La traza queda inmutable y es la evidencia ante el regulador.

Audit periódico

El agente corre auditorías periódicas sobre los logs: top-N de access por usuario y purpose, anomalías de access pattern, exports sin policy aplicada. Genera un reporte para DPO y Compliance con cadencia mensual o ante eventos disparadores.

Review de risk score

Re-identification Risk Scorer evalúa cada output con score (0 a 1). Outputs sobre threshold pasan a review manual del DPO. La memoria del agente se enriquece con cada decisión para calibrar futuros scoring.

Ejemplo de interacción

[Solicitud research-internal, dataset claims]

"Un equipo de research solicita un dataset de claims para training de un modelo. El agente identifica los campos con PII, aplica masking según la policy 'research-internal' (k-anonymity 5, supresión de campos sensibles), genera el dataset tokenized con re-identification risk score 0.04, registra el access log y entrega el dataset listo para training."

[Audit log generado]

Policy: research-internal · k-anonymity: 5 · Risk score: 0.04 · Tokenization: irreversible · Audit ID registrado

Arquitectura del agente

Topics, Actions, Hydrators, Effectors, Channels, DMOs, Trust Layer y Memory.

Topics

Dominios de razonamiento

PII Detector LATAM-aware
Policy Engine
Tokenization Service
Reversibility Manager
Audit Logger
Re-identification Risk Scorer

Actions y Channels

Lo que ejecuta y dónde comunica

detectPII · applyPolicy
tokenize · detokenize
generateAuditTrail · scoreRisk
Lightning
Slack vía MCP · Audit dashboards
Email para DPO y Compliance

Hydrators y DMOs

Fuentes de contexto

DMO field-level metadata
Regex y ML PII patterns
Customer policies versionadas
Prior tokenizations
Vault encrypted de tokens
Audit Trail DMO

Effectors, Trust Layer y Memory

Escrituras, guardrails y aprendizaje

Mask field on read
Write tokenized version
Log access inmutable
AMPLIFICA el Trust Layer Salesforce con policies adicionales y audit propio
Memory de policies por audiencia, destination y purpose
Calibración de risk scoring por feedback DPO

Implementación en 5 fases

El driver crítico es la calidad del PII catalog y la firma del DPO sobre las policies. Timing típico: 8 a 12 semanas.

Sem 1-2

PII catalog y patterns LATAM

Inventariamos campos PII por DMO, validamos patterns LATAM (CPF, CURP, DNI, RUT) y definimos qué se trata como sensible. El catalog queda versionado y firmado por DPO.

DPO · Compliance · Solu PII catalog versionado por DMO

Sem 2-4

Policy library por contexto

Definimos las policies por combinación audience / destination / purpose. Cada policy tiene reglas de masking, supresión, k-anonymity y reversibilidad explícitas. DPO firma cada versión.

DPO · Data Governance · Compliance Policy library firmada y versionada

Sem 4-7

Agent build, vault y audit dashboard

Construimos Topics y Actions en Agent Builder, deployamos el vault encrypted (Heroku Postgres es una opción común), configuramos governance de keys management y armamos el audit dashboard accesible.

Agentforce Architect · Security Engineer Agente en sandbox + vault + audit dashboard

Sem 7-9

Shadow mode y validación

El agente opera en shadow: detecta PII y propone policy sin aplicar masking real. Comparamos su salida contra revisión manual del DPO y ajustamos thresholds para minimizar false negatives.

DPO · Security Lead · Solu Reporte shadow + ajustes de detección

Sem 9-12+

Go-live y mejora continua

Cutover. Monitoreamos cobertura de PII detection, false negatives, latencia del masking, % de exports con policy aplicada y calidad del re-identification risk scoring. La memoria del agente se enriquece con cada output procesado.

DPO · Data Governance · Solu Managed Service Audit dashboard productivo + cadencia de tuning mensual

Equipo típico de implementación

Agentforce Architect Diseño del agente, lógica de policies y risk scoring

DPO Firma de policies, validación de cumplimiento regulatorio

Security Engineer Vault encrypted, keys management, dual-control

Data Governance Lead PII catalog, ownership por DMO, audit dashboard

Compliance Lead Linaje regulatorio por país, evidencia ante regulador

Requisitos para arrancar

Lo que conviene tener listo antes del go-live.

Datos mínimos

PII catalog completo por DMO
Patterns LATAM validados (CPF, CURP, DNI, RUT)
Histórico de exports y access logs accesible
Métricas de baseline de cobertura PII actual

Licencias

Salesforce Data Cloud
Agentforce Platform
Heroku Postgres u otra base encrypted para vault
Audit dashboard (Tableau, CRM Analytics u otro BI)

Integraciones

Vault de tokens encrypted con keys management
Sources externos (Snowflake, BigQuery) vía zero-copy
Slack vía MCP para alertas de access anómalo
Email para reportes a DPO y Compliance

Org readiness

Policies por contexto firmadas por DPO
Governance de keys management con rotación periódica
Audit dashboard accesible para DPO y Compliance
Política de dual-control para detokenization

Qué se busca optimizar

Lo que el agente busca mejorar — los rangos exactos dependen del baseline de cada compañía.

No prometemos cifras atribuidas a casos. Detallamos las dimensiones que el PII Redaction & Tokenization Agent ataca y la dirección esperada del cambio.

Cobertura de PII detection

% del catálogo PII cubierto por detección automática. La meta razonable es superar el 95% sobre el catálogo definido.

Tasa de false negatives

% de campos PII no detectados que llegan a outputs. El objetivo es tender a cero, validado por auditorías periódicas.

Latencia del masking

Tiempo de aplicación de la policy compatible con queries interactivas y dashboards en tiempo casi real.

Tiempo de auditoría regulatoria

Cuánto tarda el equipo en producir evidencia ante el regulador. Con audit log estructurado, pasa de días a horas.

% de exports con policy aplicada

% de exports, activations y dashboards con policy enforcement automático y log activo. La meta es tender al 100%.

Calidad del re-identification risk scoring

Validada por feedback del DPO: % de outputs sobre threshold que efectivamente requerían review manual.

Qué considerar al implementar

Cinco prácticas que aceleran el time-to-value y sostienen la confianza del DPO y Compliance.

PII catalog detallado por DMO

El catalog tiene que estar versionado y validado a nivel de campo. Empezar por los DMOs con mayor exposición regulatoria y expandir con cadencia trimestral.

Policies por audience, destination y purpose

Una policy genérica subprotege algunos contextos y sobreprotege otros. Conviene definir matriz por combinación de las tres dimensiones, con DPO como aprobador.

DPO involucrado en aprobación

El DPO firma cada policy. Sin esa firma, el agente no la activa. Esa traza es la base de la evidencia regulatoria si surge una solicitud de auditoría.

Vault de tokens encrypted

Heroku Postgres es una opción común con encryption at-rest y keys gestionadas por KMS. Cualquier vault cumple si tiene encryption, dual-control y rotación periódica de keys.

Governance de keys management

Las keys se rotan con cadencia documentada. Cada rotación queda en el audit log. La compromisión de una key sin rotación previa es un escenario que se evita con disciplina operativa.

Preguntas frecuentes

¿Cumple con LGPD, LFPDPPP, Habeas Data, Ley 19.628 Chile, Ley 1581 Colombia? −

Sí. Las policies se versionan por país y por purpose. El audit log preserva el linaje completo: quién accedió, qué policy aplicó, qué versión de la regulación regía. Ese log es la evidencia ante el regulador.

¿Soporta CCPA y GDPR? +

Sí. CCPA y GDPR están cargados como policies estándar. La diferencia es la granularidad de los rights (right to delete, right to access) y el agente las atiende vía actions específicos.

¿Cómo se integra con el Trust Layer existente? +

Lo amplifica, no lo reemplaza. El Trust Layer Salesforce protege prompts y outputs de Einstein/Agentforce. Este agente extiende el masking a exports, activations a third-parties y dashboards externos al Trust Layer nativo.

¿Es reversible la tokenization? +

Configurable por policy. Para datos que requieren re-identification ulterior (auditoría regulatoria, soporte al cliente), la tokenization es reversible con dual-control. Para training de modelos, la tokenization es irreversible.

¿Funciona con sources externos (Snowflake, BigQuery)? +

Sí. El masking se aplica on-read antes de que el dato salga de Data Cloud. Para sources zero-copy, el agente intercepta la query y aplica la policy antes de devolver el resultset.

¿Cómo audita el access? +

Cada export, cada query, cada prompt queda registrado con timestamp, identidad, policy aplicada y campos tokenizados. El dashboard de audit muestra serie temporal y top-N de access por usuario y por purpose.

Tus exports ya cargan PII. Solo falta un agente que aplique la policy correcta cada vez.

Hablá con un Data Architect de Solu. Mapeamos tu PII catalog, definimos policies por contexto y proyectamos la cobertura de masking para tu operación.

Ver todos los agentes de Data Cloud