Edición #7

Los agentes ya no programan: producen vídeo, clonan voces, invierten en bolsa y Epic Games reinventa git

Publicado el 25 de June de 2026

La semana pasada hablamos de la industrialización del ecosistema: seguridad, orquestación, la filosofía de escribir menos. Esta semana el panorama ha cambiado de forma radical. Los agentes han dejado de ser herramientas de programación para convertirse en creadores de contenido, productores de vídeo, clonadores de voz e inversores financieros. Y entre medias, Epic Games ha decidido que git ya no es suficiente.

🎬 #1 — OpenMontage: tu agente ahora es un estudio de cine

OpenMontage (Python · 193 nuevas ⭐ esta semana · #1 diario con 54 ⭐ hoy)

"World's first open-source, agentic video production system. 12 pipelines, 52 tools, 500+ agent skills."

Lee eso otra vez: 500 skills de producción de vídeo. OpenMontage convierte tu agente de programación (Claude Code, Codex, lo que uses) en un estudio de producción completo. Edición, montaje, efectos, transiciones — todo orquestado por IA.

Esto es un salto cualitativo enorme. Hasta ahora, los agentes producían texto (código, documentación, emails). La semana pasada vimos indicios con Archify (diagramas) y Pixelle-Video. Pero OpenMontage va mucho más lejos: es un sistema de producción completo con 12 pipelines y 52 herramientas. No es un "vamos a ver si la IA puede hacer vídeo". Es un framework de producción profesional. 📊 OSSInsight

🎙️ La era del agente multimedia

OpenMontage no está solo. Esta semana hay un patrón clarísimo de agentes que producen contenido multimedia:

  • VoiceBox (TypeScript · 74 nuevas ⭐) — Un estudio de voz de IA open source. Clona voces, dicta, crea. La interfaz entre humanos y agentes está migrando del teclado al micrófono.
  • HyperFrames (TypeScript · 51 nuevas ⭐ · 209 pushes) — De HeyGen: "Write HTML. Render video." El agente escribe HTML y el resultado es un vídeo renderizado. 209 pushes en una semana — un equipo profesional construyendo a toda velocidad.
  • PPT-Master (Python · 49 nuevas ⭐) — Genera PowerPoints reales y editables con animaciones nativas y notas de orador narradas como audio.

En siete semanas hemos visto a los agentes pasar de escribir código → leer internet → producir vídeo, voz y presentaciones. La dirección es evidente: el agente quiere ser tu equipo creativo completo.

⚔️ Epic Games dice: "git no es suficiente"

Lore (Rust · 114 nuevas ⭐)

Los creadores de Fortnite y Unreal Engine han publicado un sistema de control de versiones de nueva generación, escrito en Rust y open source. Sí, un reemplazo de git.

¿Por qué? Porque git fue diseñado para código texto. Funciona muy bien para archivos de 100 KB. Pero cuando trabajas con assets de videojuegos (texturas de 500 MB, modelos 3D de 2 GB, escenas completas de Unreal), git se convierte en una tortura. Lore está diseñado desde cero para manejar repositorios masivos con archivos binarios enormes.

Y hay una conexión directa con el mundo de los agentes: si los agentes ahora producen vídeo (OpenMontage), voz (VoiceBox) y presentaciones (PPT-Master), los repositorios del futuro van a estar llenos de archivos binarios pesados. Lore no es solo para juegos — es infraestructura para la era de los agentes multimedia. 📊 OSSInsight

💰 Los agentes quieren gestionar tu dinero

Otra novedad notable: la aparición simultánea de dos proyectos de inversión con IA en el ranking:

  • Daily Stock Analysis (Python · 103 nuevas ⭐ · 52 forks · 61 pushes) — Un sistema completo de análisis de bolsa (mercados A/H/US) con datos multi-fuente, noticias en tiempo real, dashboard de decisiones y notificaciones automáticas. Se puede ejecutar con coste cero programado.
  • AI-Berkshire (Python · 12 nuevas ⭐) — Un framework de inversión basado en la metodología de Buffett, Munger, Duan Yongping y Li Lu. Múltiples agentes investigando en paralelo siguiendo principios de value investing.

52 forks en una semana para Daily Stock Analysis. Eso es gente que no solo lo mira — lo clona, lo adapta y lo pone a funcionar con su propio dinero. Los agentes han salido del IDE y ahora están mirando los mercados financieros.

👁️ PixelRAG: "El fin del parsing web"

PixelRAG (Python · 122 nuevas ⭐)

En la primera edición de Espía de GitHub hablamos de cómo la comunidad estaba abandonando RAG tradicional en favor de grafos de conocimiento. Siete semanas después, PixelRAG propone algo aún más radical: olvidar el parsing de HTML por completo.

En lugar de parsear el DOM de una página web (que se rompe constantemente con cada rediseño), PixelRAG hace búsqueda "pixel-native" — ve la página como la ve un humano, a nivel de píxeles. Es el mismo salto conceptual que hicieron los modelos multimodales: en lugar de entender la estructura del documento, miran la imagen del documento. Más robusto, más escalable, y conecta perfectamente con la tendencia de agentes con "ojos" que documentamos desde la edición 4.

🛡️ La seguridad se consolida

El ecosistema de seguridad para agentes que señalamos la semana pasada no era un destello — se está solidificando:

  • NVIDIA SkillSpector sigue en el top 20 con 54 nuevas ⭐ y 19 pushes. No es un proyecto abandonado: NVIDIA lo está desarrollando activamente.
  • Anthropic-Cybersecurity-Skills crece hasta 75 nuevas ⭐. Las 754 skills de ciberseguridad están siendo adoptadas.
  • Reverse-Skill (PowerShell · 12 nuevas ⭐) — Novedad: un router de skills para ingeniería inversa y pentesting con herramientas auto-evolutivas. El lado ofensivo de la seguridad también se está automatizando.

🧭 Siete semanas, una revolución silenciosa

  1. Ed. 1: Los agentes aprenden a entender.
  2. Ed. 2: Aprenden a especializarse.
  3. Ed. 3: Quieren emanciparse.
  4. Ed. 4: La emancipación funciona.
  5. Ed. 5: Conquistan internet.
  6. Ed. 6: Se industrializan.
  7. Ed. 7 (hoy): Se convierten en creadores — vídeo, voz, inversiones. Y las herramientas que usamos para trabajar (git) empiezan a ser reemplazadas.

Hace dos meses, un "agente de IA" era algo que escribía código por ti. Hoy es algo que produce vídeos, clona tu voz para narrar presentaciones, analiza mercados financieros y opera en un ecosistema con su propia seguridad, orquestación y filosofía de diseño.

La pregunta ya no es "¿pueden los agentes programar?". La pregunta es: ¿hay algún trabajo digital que NO puedan hacer?

Los datos de esta edición han sido analizados a partir de OSSInsight, que procesa más de 10.800 millones de eventos de GitHub en tiempo real.