Agent Governance Series

Ocho papers que establecen los fundamentos formales de la gobernanza de agentes autónomos. Cada paper aborda una capa distinta — desde la atomicidad en la frontera de decisión hasta la validación empírica en agentes LangGraph reales — formando una arquitectura irreducible para la ejecución gobernada.

Autor: Marcelo Fernandez · TraslaIA · agentcontrolprotocol.xyz

Secuencia de Lectura

Cada paper construye sobre el anterior. La serie puede leerse secuencialmente o por capa.

P0 — Fronteras de Decisión Atómica
¿Por qué la atomicidad en la frontera de decisión es un requisito estructural?
P1 — Agent Control Protocol (ACP)
¿Cómo implementamos esa frontera como un protocolo de cumplimiento concreto?
P2 — De Admisión a Invariantes (IML)
¿Qué podemos observar realmente por encima de la frontera de cumplimiento?
P3/4 — Estructura de Gobernanza Irreducible
¿Es la arquitectura multicapa irreducible? ¿Quién ejecuta y bajo qué restricciones de asignación?
P5 — Modelo de Autoridad Reconstructiva (RAM)
Dada la observabilidad parcial, ¿cuándo es válida la autoridad de ejecución?
P6 — Operacionalización de la Autoridad Reconstructiva
¿Cómo implementamos RAM como protocolo de runtime en un sistema real?
P7 — Cerrando la Brecha de Ejecución (Empírico)
¿El stack completo cierra la brecha entre gobernanza y ejecución en agentes LLM reales?

Papers

P0

Atomic Decision Boundaries: A Structural Requirement for Guaranteeing Execution-Time Admissibility in Autonomous Systems

Demuestra que ningún sistema que separe evaluación de ejecución puede garantizar admisibilidad en tiempo de ejecución. Introduce la frontera de decisión atómica — la condición bajo la cual la decisión y la transición de estado son un único paso indivisible — y clasifica RBAC, OPA y ACP en una taxonomía estructural de mecanismos de gobernanza.

P1

Agent Control Protocol: ACP v1.30 — Admission Control for Agent Actions

La especificación ACP. Control de admisión temporal que aplica propiedades de comportamiento sobre trazas de ejecución mediante un pipeline de 6 etapas, tokens de ejecución, cadenas de delegación criptográficas y un motor de riesgo con estado (ACP-RISK-3.0). Verificado con TLA+ sobre 4,29 × 10⁹ estados con 9 invariantes de seguridad y 4 propiedades temporales.

P2

From Admission to Invariants: Epistemological Limits of Local Observability in Agent Governance

Demuestra que las señales de cumplimiento son epistemológicamente insuficientes para detectar deriva de comportamiento. Introduce la Capa de Medición de Invariantes (IML): un estimador consistente de la desviación de comportamiento D̂(τ, A₀) con retardo de detección finito, validado en agentes LangGraph, pipelines webhook y ejecutores de agente único.

P3/4

Irreducible Governance Structure for Autonomous Agent Systems: Fair Allocation, Strategy-Proofness, and Multi-Scale Composition

Establece la asignación como una dimensión de gobernanza de primer orden. Demuestra la amplificación Sybil (cualquier mecanismo de asignación es vulnerable a la multiplicación de identidades) y una imposibilidad de resistencia estratégica análoga al teorema de Arrow. El resultado central es el teorema de irreducibilidad: bajo observabilidad finita, ningún subconjunto estricto de las cuatro capas de gobernanza puede replicar las garantías de la arquitectura completa.

P5

Reconstructive Authority Model: Runtime Execution Validity Under Partial Observability

Separa integridad de cobertura: la atestación criptográfica prueba confianza en la medición, no la completitud de la realidad relevante para la ejecución. El Modelo de Autoridad Reconstructiva (RAM) introduce una puerta de reconstrucción sobre un envelope de cobertura explícito y demuestra que la cobertura es condición necesaria para la validez de ejecución. Las tasas de ejecución inválida son proporcionales a la fracción de estado no observable (1 − |S_p|/|S_r|).

P6

Operationalizing Reconstructive Authority: Runtime Construction, Dependency Resolution, and Execution Gating in Autonomous Agent Systems

Provee el cumplimiento en runtime de RAM. Introduce un protocolo de ejecución concreto con resolución dinámica de dependencias, reconstrucción de autoridad en tiempo de acción y un Recovery Loop que integra la detección de deriva de IML con la compuerta de ejecución de ACP. Demuestra el Teorema de Seguridad de Ejecución (ninguna acción ejecuta sin autoridad construible) y la Vivacidad Condicional (la ejecución se reanuda cuando las variables que definen la autoridad se vuelven observables).

P7

Closing the Execution Gap in LLM Agent Systems: Empirical Evidence for Compliant Drift, Partial Observability, and Integrated Runtime Governance

Primera validación empírica del stack completo ACP+IML+RAM+RecoveryLoop en agentes LangGraph reales. Introduce la Deriva Compliant — el fenómeno en que g(τ)=0 en todo momento (todas las decisiones aprobadas) mientras D̂ crece monótonamente — y demuestra que es real, medible y cerrable. Cuatro experimentos: detección de deriva sobre 6 seeds y 2 familias de LLM (Mistral 15B, DeepSeek-R1 8B), 10k trials Monte Carlo bajo observabilidad parcial, coordinación multi-agente hasta N=16, e integración del stack completo sobre 2000 pasos. Introduce 3 refinamientos teóricos al framework formal.

Las Cuatro Capas de Gobernanza

La serie establece cuatro dimensiones ortogonales de gobernanza de agentes. El teorema de irreducibilidad (P3/4) demuestra que ninguna puede eliminarse sin pérdida de corrección o estabilidad.

Temporal

Decisión y mutación de estado como un único paso indivisible. Elimina la brecha entre evaluación y ejecución. P0, P1

Estado

Cumplimiento de restricciones sobre el estado del sistema mediante evaluación de riesgo con estado y tokens de ejecución. P1

Comportamental

Detección y medición de deriva por encima de la frontera de cumplimiento. Las señales de cumplimiento son insuficientes — se necesita una capa de medición separada. P2

Población

Asignación del acceso a ejecución entre agentes competidores bajo restricciones de recursos compartidos. La asignación justa y la resistencia estratégica no pueden alcanzarse simultáneamente. P3/4

P5 y P6 abordan una quinta dimensión ortogonal a las cuatro anteriores: validez de autoridad en runtime bajo observabilidad parcial — la pregunta de si la ejecución es válida dado lo que el sistema puede observar realmente en el momento de la acción.

Todos los papers están disponibles en Zenodo con DOIs permanentes. Los preprints están en arXiv (donde disponibles).

Colección en Zenodo Modelo de Gobernanza ACP