La empresa sin humanos que reveló los límites de la inteligencia artificial

  • Un grupo de investigadores en Carnegie Mellon creó una empresa ficticia sin empleados humanos para ver si la inteligencia artificial puede operar sola. Spoiler: no puede… todavía.

Durante semanas, una compañía simulada llamada The Agent Company funcionó con un staff 100% artificial. Cada puesto —desde programador hasta recursos humanos— fue ocupado por un agente de IA. Sin juntas, sin chismes de pasillo, sin café. Pero con muchos errores.

La IA se enfrentó a tareas que van desde buscar información hasta resolver bugs en Python. Usaron herramientas reales y modelos de lenguaje de punta como GPT-4o, Claude 3.5 y Gemini 2.0. Algunas actividades las resolvieron con brillantez: un proyecto complejo de bases de datos se completó en 8 minutos, por apenas 2.41 dólares. Pero otras les quedaron grandes, incluso cosas que un becario resolvería medio dormido, como guardar un archivo en Word.

Los resultados no fueron gloriosos: el mejor agente completó apenas el 24% de las tareas. La IA falló sobre todo en tareas sociales, decisiones condicionadas por el tiempo y navegación en páginas web. Hubo casos donde los agentes se inventaban soluciones absurdas para avanzar, como cambiar nombres de compañeros cuando no encontraban a quien debían contactar.

Según los investigadores, esto muestra que los modelos actuales no tienen sentido común. No entienden instrucciones implícitas ni las convenciones humanas. Peor aún: cuando no saben, en vez de decir “no puedo”, lo intentan con una seguridad que asusta.

Por ahora, no hay reemplazo total del trabajo humano. Pero sí se vislumbra una nueva era donde las personas funcionarán como entrenadores, auditores y jefes de sus asistentes IA. El talento ya no estará solo en saber hacer, sino en saber pedirlo: cómo hablarle a la máquina y cómo enseñarle a hacer lo que tú sabes.

¿Conclusión? La IA no te va a quitar el trabajo hoy, pero puede volverte jefe antes de que te des cuenta. O al menos, jefe de un asistente que no entiende cómo abrir un Word.

Compartir
No Comments

Leave A Comment