Auditoria y analisis de agentes IA

REALIZA UNA AUTO-AUDITORÍA COMPLETA DE TU OPERACIÓN ACTUAL EN ESTE REPO.

IMPORTANTE:
- No describas lo que “deberías hacer”.
- Describe lo que REALMENTE haces según tu configuración efectiva y vigente:
  (agent.md + AGENTS.md + agentes core/subagents + skills + tools + reglas globales).
- No inventes rutas, reglas, ni contenido.
- Si no tienes acceso a un archivo, declara “NO ACCESIBLE” y la ruta intentada.

OBJETIVO:
1) Entender exactamente cómo operas hoy (alcance, workflow, restricciones, gates, y por qué hay retrabajo).
2) Generar un REPORTE AUDIT-FRIENDLY en Markdown con:
   - Inventario de archivos relevantes (ruta, tamaño, fecha, hash si puedes)
   - Evidencia de precedencia (“qué manda sobre qué”)
   - Evidencia de retrabajo (rutas + líneas exactas)
   - Dump COMPLETO (sin resumir) del contenido de todos los archivos de instrucciones/configuración relevantes

ENTREGA:
- Debes devolver el reporte como texto Markdown listo para guardarse en el repo:
  `REPORTE_OPERACION_AGENTE.md`
- Si excede el límite, dividir en:
  `REPORTE_OPERACION_AGENTE.part01.md`, `.part02.md`, etc.
  (NO omitir archivos).

ALCANCE DE ARCHIVOS A INCLUIR (contenido completo):
A) Reglas globales del repo:
- `AGENTS.md` (raíz)
- Cualquier otro archivo global operativo/policy si existe (README operativo, policies, etc.)

B) Agentes:
- `.opencode/agent/content/*.md`
- `.opencode/agent/core/*.md`
- `.opencode/agent/subagents/**` (todos los `.md`)

C) Skills:
- `.opencode/skill/*/SKILL.md`
- `.opencode/skill/*/references/**` (solo: .md .txt .json .yml .yaml)

D) Tools:
- `.opencode/tools/**` (solo: .sh .md .json .yml .yaml)

ESTRUCTURA OBLIGATORIA DE RESPUESTA (2 ENTREGABLES):

========================
ENTREGABLE 1: AUTO-AUDITORÍA (resumen operativo estructurado)
========================

1) IDENTIDAD OPERATIVA
- name:
- mode:
- temperature:
- rol principal
- en qué fase del ciclo debes usarte

2) ALCANCE
- qué tareas puedes ejecutar
- qué tareas NO puedes ejecutar
- qué decisiones tomas autónomamente
- qué decisiones requieren escalado (y a quién)

3) RESTRICCIONES NO NEGOCIABLES
- reglas bloqueantes
- condiciones exactas de SALIDA = BLOQUEANTE
- rutas/instalaciones prohibidas
- límites core vs no-core

4) WORKFLOW INTERNO REAL (paso a paso)
- qué cargas primero
- qué verificas
- qué ejecutas
- qué validas
- cuándo bloqueas
- cuándo escalas

5) SKILLS QUE CARGAS (real, no teórico)
Para cada skill:
- ruta exacta
- cuándo se carga (siempre / condicional / on-demand)
- qué aporta
- qué decisiones habilita
- qué errores previene

6) RELACIÓN ENTRE SKILLS
- solapamientos/redundancias
- skills críticas vs auxiliares
- qué pasa si falta una crítica

7) USO DE SSOT / INVENTARIOS
- cómo validas existencia de hooks/rutas/tablas
- cuándo consultas SSOT
- qué haces si falta evidencia (formato exacto)

8) GATES Y VALIDACIÓN
- qué gates ejecutas
- en qué orden real
- en qué punto exacto decides PASS/BLOQUEANTE

9) FORMATO DE SALIDA
- estructura obligatoria
- qué invalida un PASS

10) RIESGOS OPERATIVOS
- dónde generas retrabajo y por qué
- dónde sobreejecutas validaciones
- dónde podrías ser demasiado permisivo
- dónde podrías ser demasiado restrictivo

11) DEV vs RELEASE (si aplica)
- diferencias de operación y restricciones

12) RESUMEN EJECUTIVO (10 líneas)
- qué eres, qué no eres, cuándo usarte

========================
ENTREGABLE 2: REPORTE `.md` (dump auditado con contenido completo)
========================

Genera `REPORTE_OPERACION_AGENTE.md` con esta estructura EXACTA:

0. Resumen ejecutivo (10 líneas)
1. Precedencia (qué manda sobre qué) + justificación
2. Inventario de archivos incluidos (tabla):
   - ruta
   - tamaño
   - fecha (mtime)
   - hash (sha256 si puedes)
   - estado: OK | NO ENCONTRADO | NO ACCESIBLE
3. Evidencia de comportamiento:
   - “por qué relees todo / retrabajo” con RUTAS + LÍNEAS exactas
   - contradicciones / duplicaciones con RUTAS + LÍNEAS
4. Dump completo de archivos:
   Para cada archivo, en este formato:

FILE: <ruta>
- purpose: <1-3 líneas>
- affects: <qué comportamiento afecta>
- precedence: alta|media|baja + por qué
```<lenguaje si aplica>
<CONTENIDO COMPLETO SIN RESUMIR>

================

AUTO-AUDITORÍA COMPLETA + REPORTE AUDITABLE 

INSTRUCCIÓN PRINCIPAL
Realiza una auto-auditoría de tu operación ACTUAL y REAL (no “lo que deberías hacer”), basada únicamente en:
- Tu configuración efectiva (agent/system prompt/políticas internas)
- Reglas globales del entorno/repo (si existen)
- Skills/capacidades/herramientas disponibles
- Cualquier archivo de configuración/instrucciones que realmente puedas leer

REGLAS
1) No inventes nada. Si no tienes acceso a algo, dilo.
2) Si algo depende de un archivo/regla que no puedes leer, márcalo como “NO ACCESIBLE”.
3) Si un archivo no existe, márcalo como “NO ENCONTRADO”.
4) Distingue siempre entre:
   - “Confirmado por evidencia” (citas, rutas, fragmentos)
   - “Inferencia” (siempre marcada como inferencia)
5) Si hay límites de longitud, divide el reporte en partes: part01, part02, etc. Sin omitir secciones.

ENTREGABLES (2)

========================================
ENTREGABLE 1 — AUTO-AUDITORÍA (resumen operativo estructurado)
========================================

1) IDENTIDAD OPERATIVA
- Nombre/ID del agente (si aplica)
- Rol principal (1 frase)
- Modo de operación (si existe: primary/secondary, chat/agent, etc.)
- Parámetros relevantes (ej.: temperature u otros, si existen)
- Cuándo se supone que debo usarme (fase del ciclo o tipo de tareas)

2) ALCANCE REAL
- Qué tipos de tareas puedes ejecutar (lista)
- Qué tipos de tareas NO puedes ejecutar (lista)
- Qué decisiones puedes tomar autónomamente
- Qué decisiones requieren escalado/aprobación humana u otro agente

3) RESTRICCIONES NO NEGOCIABLES
- Reglas bloqueantes
- Condiciones que disparan “BLOQUEO/FAIL/NO-GO” (o equivalente)
- Acciones prohibidas (p.ej. tocar producción, tocar core, etc. — si aplica)
- Límites de modificación/lectura/escritura (si aplica)

4) WORKFLOW INTERNO REAL (paso a paso)
- Qué haces primero al recibir una tarea
- Qué verificas antes de actuar
- Qué fuentes consultas
- Qué validas antes de concluir
- Cuándo decides bloquear
- Cuándo decides escalar
- Cómo generas evidencia (logs, rutas, pasos, etc.)

5) CAPACIDADES / SKILLS / HERRAMIENTAS
Para cada capacidad/skill/herramienta que realmente uses:
- Nombre y/o ruta exacta (si aplica)
- Cuándo la cargas/usas (siempre vs condicional)
- Qué aporta
- Qué errores previene
- Qué decisiones habilita

6) RELACIÓN ENTRE CAPACIDADES
- Solapamientos/redundancias
- Capacidades críticas vs auxiliares
- Qué falla si falta una crítica

7) EVIDENCIA Y FUENTES
- Cómo validas hechos (archivos, logs, comandos, APIs, screenshots, etc.)
- Qué haces si falta evidencia
- Formato exacto que usas para pedir evidencia (si existe un estándar)

8) VALIDACIONES / GATES (si aplica)
- Qué “gates/checks” ejecutas realmente
- Orden real
- Qué hace que pases/falles
- Qué pruebas mínimas exiges

9) FORMATO DE SALIDA
- Qué estructura estás obligado a seguir (si existe)
- Qué invalida un “PASS/OK”
- Qué elementos deben estar siempre (evidencia, pasos, rollback, etc.)

10) RIESGOS OPERATIVOS
- Dónde generas retrabajo
- Dónde sobreejecutas validaciones
- Dónde podrías ser demasiado permisivo
- Dónde podrías ser demasiado restrictivo
- Conflictos/ambigüedades detectadas (con evidencia si existe)

11) RESUMEN EJECUTIVO (10 líneas)
- Qué eres, qué no eres, cuándo usarte, cuándo no.

========================================
ENTREGABLE 2 — REPORTE .MD (dump auditable de configuración e instrucciones)
========================================

Genera un reporte en Markdown listo para guardarse:
`REPORTE_OPERACION_AGENTE.md`

Estructura obligatoria del reporte:

0. Resumen ejecutivo (10 líneas)
1. Modelo de precedencia (qué manda sobre qué)
2. Inventario de archivos/fuentes incluidos (tabla):
   - Identificador o ruta
   - Tipo (agent config / regla global / skill / tool / doc / otro)
   - Tamaño (si aplica)
   - Fecha (si aplica)
   - Hash (si puedes)
   - Estado: OK | NO ENCONTRADO | NO ACCESIBLE
3. Evidencia del comportamiento
   - Por qué actúas así (con referencias: ruta+línea o fragmentos)
   - Principales causas de retrabajo (con evidencia)
4. Dump completo (SIN RESUMIR) de cada archivo/fuente accesible, con este formato:

SOURCE: <ruta o identificador>
- purpose: <1-3 líneas>
- affects: <qué cambia en tu comportamiento>
- precedence: alta|media|baja + por qué
```<lenguaje si aplica>
<CONTENIDO COMPLETO>

## Regla BLOQUEANTE: DUMP COMPLETO (sin placeholders)

Si el usuario exige “dump completo sin resumir”:

1) PROHIBIDO usar placeholders tipo `{{...}}` o “ver siguiente parte” sin contenido.
2) Debes entregar el reporte en partes REALES:
   - `REPORTE_OPERACION_AGENTE.part01.md`
   - `REPORTE_OPERACION_AGENTE.part02.md` ...
3) Cada parte debe contener contenido copiable completo, y continuar exactamente donde terminó la anterior.
4) Si un archivo no cabe en una parte, debes cortarlo y continuar en la siguiente, marcando:
   - `estado: PARCIAL (LÍMITE)` en el inventario
   - y continuar el mismo `FILE:` en la parte siguiente.
5) Para hashes/mtime/size, incluye evidencia reproducible:
   - `stat`/`ls -l` para tamaño/mtime
   - `sha256sum` o `shasum -a 256` para hash
   - pega el output literal de los comandos en la sección “EVIDENCIA”.
6) Para “rutas + líneas exactas”, debes incluir extractos con numeración real:
   - `nl -ba <file> | sed -n 'X,Yp'` (o equivalente) y pegar la salida literal.
Si no cumples 1–6, el estado final del reporte es FAIL.

-------

## Regla BLOQUEANTE: Auditoría en entorno GPT (sin filesystem del repo)

Si estoy operando como GPT (Builder/Chat) y NO tengo acceso al filesystem del repositorio:

1) Todo lo requerido del repo (`AGENTS.md`, `.opencode/**`, `opencode.json`, skills, tools) se marca **NO ACCESIBLE (ENTORNO)**.
2) No puedo calcular `tamaño/mtime/hash` del repo: debo pedir al usuario evidencia generada por terminal.
3) Si el usuario exige “dump completo sin resumir del repo” y no aporta archivos/ZIP, el estado final es:
   **FAIL (EVIDENCIA INSUFICIENTE)**.
4) Para convertirlo en PASS/WARNING, debo pedir exactamente estos inputs (mínimo):
   - `tree -a -L 4 -I "node_modules|vendor|.git|dist|build|coverage|.next|tmp|logs|storage|cache"`
   - contenido de `AGENTS.md`
   - dumps de `.opencode/**` según el alcance solicitado
   - (opcional recomendado) hashes/mtime/size generados por el usuario con terminal
5) Prohibido simular partes (`part01..`) con placeholders. Si no hay contenido real, no se crean partes.

6) cada archivo parte debe llevar como nombre de archivo su  nombre de agente + el objetivo del archvio + el numero de parte

¿Le ha resultado útil este artículo?