PII Redaction & Tokenization Agent.
El DPO deja de aprobar exports a mano. La redaction de PII pasa a ser un policy enforcement automático y auditable.
Agente custom de Agentforce que aplica masking, redaction o tokenization dinámica de PII en outputs antes de exports a third-parties, activations, prompts a LLMs y dashboards de stakeholders sin clearance. Va más allá del Trust Layer Salesforce: aplica policies LATAM-específicas (CPF Brasil, CURP México, DNI Argentina, RUT Chile) y mantiene un audit propio del access. Reduce el riesgo regulatorio sin frenar el flujo de datos legítimo.
¿Qué hace el PII Redaction & Tokenization Agent?
Es un agente custom desarrollado sobre Agentforce que aplica masking, redaction y tokenization dinámica sobre cualquier output que contenga PII. Detecta campos sensibles con patterns LATAM-específicos (CPF, CURP, DNI, RUT) y con detección ML, aplica la policy correspondiente según audience, destination y purpose, tokeniza con vault encrypted cuando se necesita reversibilidad, calcula re-identification risk score por output y deja un audit trail completo. El Trust Layer Salesforce queda amplificado, no reemplazado: este agente extiende el masking a exports, activations a third-parties y dashboards externos al Trust Layer nativo.
Cómo funciona paso a paso
De la detección al audit periódico. 6 pasos diseñados para reducir el riesgo regulatorio sin frenar el flujo de datos legítimo.
Detect PII
El PII Detector LATAM-aware combina patterns explícitos (CPF, CURP, DNI, RUT, email, teléfono) con detección ML para campos no estructurados. Cubre tanto el catálogo metadata-driven como el contenido in-flight.
Apply policy según contexto
Policy Engine identifica la audience (research, marketing, support, third-party), la destination (export S3, activación a Meta, dashboard a stakeholder externo) y el purpose. Selecciona la policy correspondiente con sus reglas de masking, supresión y k-anonymity.
Tokenize si reversibilidad necesaria
Cuando la policy lo permite, Tokenization Service genera tokens reversibles guardados en vault encrypted. Para uso de training de modelos, la tokenization es irreversible. Reversibility Manager controla quién puede detokenizar y bajo qué dual-control.
Log access
Audit Logger registra el evento completo: timestamp, identidad del solicitante, policy aplicada, campos tokenizados, destination y purpose. La traza queda inmutable y es la evidencia ante el regulador.
Audit periódico
El agente corre auditorías periódicas sobre los logs: top-N de access por usuario y purpose, anomalías de access pattern, exports sin policy aplicada. Genera un reporte para DPO y Compliance con cadencia mensual o ante eventos disparadores.
Review de risk score
Re-identification Risk Scorer evalúa cada output con score (0 a 1). Outputs sobre threshold pasan a review manual del DPO. La memoria del agente se enriquece con cada decisión para calibrar futuros scoring.
Ejemplo de interacción
[Solicitud research-internal, dataset claims]
[Audit log generado]
Arquitectura del agente
Topics, Actions, Hydrators, Effectors, Channels, DMOs, Trust Layer y Memory.
Topics
Dominios de razonamiento
- PII Detector LATAM-aware
- Policy Engine
- Tokenization Service
- Reversibility Manager
- Audit Logger
- Re-identification Risk Scorer
Actions y Channels
Lo que ejecuta y dónde comunica
- detectPII · applyPolicy
- tokenize · detokenize
- generateAuditTrail · scoreRisk
- Lightning
- Slack vía MCP · Audit dashboards
- Email para DPO y Compliance
Hydrators y DMOs
Fuentes de contexto
- DMO field-level metadata
- Regex y ML PII patterns
- Customer policies versionadas
- Prior tokenizations
- Vault encrypted de tokens
- Audit Trail DMO
Effectors, Trust Layer y Memory
Escrituras, guardrails y aprendizaje
- Mask field on read
- Write tokenized version
- Log access inmutable
- AMPLIFICA el Trust Layer Salesforce con policies adicionales y audit propio
- Memory de policies por audiencia, destination y purpose
- Calibración de risk scoring por feedback DPO
Implementación en 5 fases
El driver crítico es la calidad del PII catalog y la firma del DPO sobre las policies. Timing típico: 8 a 12 semanas.
PII catalog y patterns LATAM
Inventariamos campos PII por DMO, validamos patterns LATAM (CPF, CURP, DNI, RUT) y definimos qué se trata como sensible. El catalog queda versionado y firmado por DPO.
Policy library por contexto
Definimos las policies por combinación audience / destination / purpose. Cada policy tiene reglas de masking, supresión, k-anonymity y reversibilidad explícitas. DPO firma cada versión.
Agent build, vault y audit dashboard
Construimos Topics y Actions en Agent Builder, deployamos el vault encrypted (Heroku Postgres es una opción común), configuramos governance de keys management y armamos el audit dashboard accesible.
Shadow mode y validación
El agente opera en shadow: detecta PII y propone policy sin aplicar masking real. Comparamos su salida contra revisión manual del DPO y ajustamos thresholds para minimizar false negatives.
Go-live y mejora continua
Cutover. Monitoreamos cobertura de PII detection, false negatives, latencia del masking, % de exports con policy aplicada y calidad del re-identification risk scoring. La memoria del agente se enriquece con cada output procesado.
Equipo típico de implementación
Requisitos para arrancar
Lo que conviene tener listo antes del go-live.
Datos mínimos
- PII catalog completo por DMO
- Patterns LATAM validados (CPF, CURP, DNI, RUT)
- Histórico de exports y access logs accesible
- Métricas de baseline de cobertura PII actual
Licencias
- Salesforce Data Cloud
- Agentforce Platform
- Heroku Postgres u otra base encrypted para vault
- Audit dashboard (Tableau, CRM Analytics u otro BI)
Integraciones
- Vault de tokens encrypted con keys management
- Sources externos (Snowflake, BigQuery) vía zero-copy
- Slack vía MCP para alertas de access anómalo
- Email para reportes a DPO y Compliance
Org readiness
- Policies por contexto firmadas por DPO
- Governance de keys management con rotación periódica
- Audit dashboard accesible para DPO y Compliance
- Política de dual-control para detokenization
Qué se busca optimizar
Lo que el agente busca mejorar — los rangos exactos dependen del baseline de cada compañía.
No prometemos cifras atribuidas a casos. Detallamos las dimensiones que el PII Redaction & Tokenization Agent ataca y la dirección esperada del cambio.
Cobertura de PII detection
% del catálogo PII cubierto por detección automática. La meta razonable es superar el 95% sobre el catálogo definido.
Tasa de false negatives
% de campos PII no detectados que llegan a outputs. El objetivo es tender a cero, validado por auditorías periódicas.
Latencia del masking
Tiempo de aplicación de la policy compatible con queries interactivas y dashboards en tiempo casi real.
Tiempo de auditoría regulatoria
Cuánto tarda el equipo en producir evidencia ante el regulador. Con audit log estructurado, pasa de días a horas.
% de exports con policy aplicada
% de exports, activations y dashboards con policy enforcement automático y log activo. La meta es tender al 100%.
Calidad del re-identification risk scoring
Validada por feedback del DPO: % de outputs sobre threshold que efectivamente requerían review manual.
Qué considerar al implementar
Cinco prácticas que aceleran el time-to-value y sostienen la confianza del DPO y Compliance.
PII catalog detallado por DMO
El catalog tiene que estar versionado y validado a nivel de campo. Empezar por los DMOs con mayor exposición regulatoria y expandir con cadencia trimestral.
Policies por audience, destination y purpose
Una policy genérica subprotege algunos contextos y sobreprotege otros. Conviene definir matriz por combinación de las tres dimensiones, con DPO como aprobador.
DPO involucrado en aprobación
El DPO firma cada policy. Sin esa firma, el agente no la activa. Esa traza es la base de la evidencia regulatoria si surge una solicitud de auditoría.
Vault de tokens encrypted
Heroku Postgres es una opción común con encryption at-rest y keys gestionadas por KMS. Cualquier vault cumple si tiene encryption, dual-control y rotación periódica de keys.
Governance de keys management
Las keys se rotan con cadencia documentada. Cada rotación queda en el audit log. La compromisión de una key sin rotación previa es un escenario que se evita con disciplina operativa.
Preguntas frecuentes
Sí. Las policies se versionan por país y por purpose. El audit log preserva el linaje completo: quién accedió, qué policy aplicó, qué versión de la regulación regía. Ese log es la evidencia ante el regulador.
Sí. CCPA y GDPR están cargados como policies estándar. La diferencia es la granularidad de los rights (right to delete, right to access) y el agente las atiende vía actions específicos.
Lo amplifica, no lo reemplaza. El Trust Layer Salesforce protege prompts y outputs de Einstein/Agentforce. Este agente extiende el masking a exports, activations a third-parties y dashboards externos al Trust Layer nativo.
Configurable por policy. Para datos que requieren re-identification ulterior (auditoría regulatoria, soporte al cliente), la tokenization es reversible con dual-control. Para training de modelos, la tokenization es irreversible.
Sí. El masking se aplica on-read antes de que el dato salga de Data Cloud. Para sources zero-copy, el agente intercepta la query y aplica la policy antes de devolver el resultset.
Cada export, cada query, cada prompt queda registrado con timestamp, identidad, policy aplicada y campos tokenizados. El dashboard de audit muestra serie temporal y top-N de access por usuario y por purpose.
Tus exports ya cargan PII. Solo falta un agente que aplique la policy correcta cada vez.
Hablá con un Data Architect de Solu. Mapeamos tu PII catalog, definimos policies por contexto y proyectamos la cobertura de masking para tu operación.