Sesión 1 — AGYL
Historia, cómo funcionan los LLMs, pensamiento crítico y prompt engineering.
Instructor
Consultor de IA y automatización. Capacitación corporativa en inteligencia artificial, agentes y herramientas de productividad.
305 246 3800
Algunos clientes
Plan del curso — 4 sesiones
Historia, Test de Turing, LLMs, Hype Cycle, demos en vivo.
Chain of Thought, role prompting, few-shot, frameworks avanzados.
ChatGPT vs Claude, cuándo usar cada uno, automatizaciones.
Ética, sesgos, deepfakes, futuro del trabajo, criterio.
La brecha
Hoy no les voy a enseñar a usar ChatGPT. Hoy van a entender la tecnología que va a definir sus carreras.
¿Usaron IA esta semana? ¿Para qué?
Segunda pregunta: ¿pueden explicar cómo funciona?
Hoy
La IA no apareció en 2022. Lleva 70 años intentándolo.
011950
"Computing Machinery and Intelligence" — el paper que lo empezó todo.
No preguntó "¿pueden pensar las máquinas?" sino "¿pueden comportarse como si pensaran?"
Esa distinción sigue siendo relevante hoy. El Test de Turing no mide inteligencia — mide imitación convincente.
1950 — El experimento
Un juez humano habla con dos participantes ocultos: uno es humano, el otro es una máquina. Si el juez no puede distinguir cuál es cuál, la máquina "pasa" el test.
Humano
Barrera
JUEZ
¿Quién es humano?
Barrera
Máquina
La clave: Turing no preguntó si la máquina piensa. Preguntó si puede parecer que piensa. Esa distinción sigue siendo relevante hoy.
1956
El verano en que se inventó la Inteligencia Artificial — literalmente. McCarthy, Minsky y Shannon convencieron a la Fundación Rockefeller de financiar un taller de 2 meses en Dartmouth College.
1956 — El resultado
Pero le dieron nombre al campo: Inteligencia Artificial.
Un verano, las mentes más brillantes del mundo, fondos ilimitados... y ni un solo problema resuelto. Pero la ambición quedó plantada.
1958
Frank Rosenblatt construye el Mark I Perceptron en Cornell — una máquina física del tamaño de un armario que podía aprender a reconocer formas simples.
1969 — El golpe
Minsky y Papert publican "Perceptrons" — un libro que demuestra que estas redes neuronales simples tienen un problema fatal: solo pueden aprender cosas muy básicas.
Primera vez que el hype superó la realidad. No sería la última.
1970s — 1980s
Los fondos se secan. Las promesas no se cumplieron.
Los sistemas expertos colapsan. Pero silenciosamente, algo nuevo está naciendo.
MLConcepto
En vez de decirle a la computadora QUÉ hacer paso a paso, le das ejemplos y ella aprende las reglas sola.
Así funcionan las recomendaciones de Netflix, el filtro de spam, y el reconocimiento facial de tu celular.
El cambio clave
Los sistemas expertos colapsan. Pero silenciosamente, un cambio radical está ocurriendo.
Este cambio de "programar reglas" a "aprender de datos" es la revolución del Machine Learning.
1997
La computadora de IBM vence al campeón mundial de ajedrez. El mundo celebra. Pero hay un detalle importante.
Vencer en ajedrez no es pensar. Es calcular. La verdadera pregunta era: ¿puede una máquina aprender estrategia sin que se la programen?
2012
ImageNet 2012: AlexNet aplasta a la competencia. El error de clasificación cae del 25% al 16% — usando una red neuronal profunda.
El momento en que datos + cómputo + algoritmos convergieron.
Ejemplo
Imaginen que quieren enseñarle a una computadora a reconocer fotos de gatos. No le explican qué es un gato. Solo le muestran miles de fotos:
Miles de fotos
con etiqueta: gato / no gato
Intenta adivinar
y se equivoca mucho
Se corrige
ajusta sus conexiones internas
Aprende
después de millones de intentos
Las capas internas detectan cosas cada vez más complejas: bordes, formas, orejas, bigotes... hasta entender "gato". Por eso se llama deep learning: más capas = más profundidad = más comprensión.
2016 — Contexto
Go es un juego de mesa de 2,500 años de antigüedad, popular en Asia. Dos jugadores colocan piedras blancas y negras en un tablero intentando controlar territorio.
A diferencia de Deep Blue, AlphaGo no ganó por calcular más rápido. Ganó porque aprendió a jugar.
2016
DeepMind vence a Lee Sedol, campeón mundial de Go. Resultado: 4-1.
2017
8 investigadores de Google publican un paper de 15 páginas. No sabían que estaban creando la base de toda la IA moderna.
Un solo paper. Toda la IA que usas hoy nació aquí.
Antes del Transformer
Antes de 2017, las redes neuronales procesaban el texto de forma secuencial — como leer un libro palabra por palabra, sin poder volver atrás.
Imagina leer un libro de 500 páginas sin poder volver a revisar las primeras.
La innovación
En vez de leer palabra por palabra, el Transformer mira TODAS las palabras al mismo tiempo y decide cuáles son relevantes entre sí.
"El banco estaba lleno de peces"
La atención conecta "banco" con "peces" para entender que es un banco de peces — no un banco financiero.
Todas las palabras se procesan al mismo tiempo. Mucho más rápido.
Cada palabra "ve" a todas las demás. Nunca olvida el principio.
Esto es lo que hizo posible entrenar modelos con miles de millones de parámetros.
2020 — 2023
2024 — 2026
Texto, imagen, video, código, voz — todo en un modelo
IA que puede tomar acciones, no solo generar texto
LLaMA, Mistral, Gemma — modelos abiertos compiten con los propietarios
EU AI Act, órdenes ejecutivas, debate global sobre límites
Estamos aquí. Pero recuerden los inviernos. ¿Qué podría salir mal esta vez?
El patrón
Cada avance importante fue seguido por decepción cuando las expectativas superaron las capacidades.
¿Estamos en un ciclo de hype o en una revolución real? ¿Por qué?
Gartner
El modelo de Gartner describe cómo las tecnologías pasan por fases predecibles: entusiasmo excesivo, decepción, y finalmente adopción real.
La pregunta es: ¿dónde está la IA generativa en este ciclo hoy?
Detrás de la magia hay matemáticas. Y las matemáticas son elegantes.
02Definición
Large Language Model — Modelo Grande de Lenguaje. Es el motor detrás de ChatGPT, Claude, Gemini y todas las IAs conversacionales.
Piensen en un LLM como un loro extremadamente sofisticado: no entiende lo que dice, pero reproduce los patrones del lenguaje.
El concepto central
Un modelo de lenguaje predice la siguiente palabra (token) más probable, una a la vez.
No "entiende". Calcula distribuciones de probabilidad sobre todos los posibles siguientes tokens.
Por eso sin buen contexto las respuestas son genéricas: el modelo produce el promedio estadístico de todo lo que leyó. Darle contexto preciso cambia radicalmente el resultado.
Entrenamiento
Texto a escala de internet: libros, artículos, código, conversaciones. Billones de palabras.
Transformers: la estructura que permite procesar contexto en paralelo con atención.
Miles de GPUs entrenando durante semanas. El costo de entrenar GPT-4 se estima en $100M+.
Como aprender un idioma leyendo todos los libros del mundo, sin que nadie te explique la gramática.
Arquitectura
Es la "receta" que usan ChatGPT, Claude, Gemini y todos los modelos modernos. Funciona en 3 pasos:
01
Cada palabra se transforma en una lista de números que captura su significado. "Rey" y "Reina" tienen números parecidos porque significan cosas similares.
02
En vez de leer palabra por palabra, el Transformer ve TODA la oración a la vez y decide qué palabras se relacionan entre sí. Esto es la "atención".
03
Usando todo el contexto, calcula cuál es la palabra más probable que viene después. Y repite. Así genera texto completo, una palabra a la vez.
Piensen en el Transformer como un lector ultrarrápido que puede leer un libro entero al mismo tiempo, entender cómo se conecta cada palabra con todas las demás, y escribir la continuación más probable.
Atención
Cuando el modelo lee tu prompt, no trata cada palabra por igual. Aprende cuáles son más relevantes para cuáles otras.
"parque" le dice al modelo que "banco" es un asiento, no una institución financiera. Eso es atención.
Lo inesperado
Aquí viene lo más sorprendente: nadie les enseñó a hacer esto. Los LLMs fueron entrenados SOLO para predecir la siguiente palabra. Pero al hacerlo con suficientes datos, aparecieron habilidades que nadie programó:
Resuelve problemas lógicos paso a paso, sin haberle enseñado lógica
Traduce entre docenas de idiomas sin entrenamiento específico en traducción
Escribe y arregla código funcional, sin ser un compilador
Genera analogías, metáforas e ideas que parecen originales
Es como enseñarle a alguien a leer y que de pronto sepa matemáticas. ¿Cómo pasó?
La explicación
El modelo leyó TODO internet. Al predecir la siguiente palabra en textos tan diversos, inevitablemente aprendió los patrones detrás del lenguaje:
No le enseñaron a traducir, programar o razonar. Aprendió los patrones de cómo los humanos hacen esas cosas, y los replica.
Entonces...
Si es un sistema de predicción de texto — no una mente — las implicaciones son claras:
Distinción clave
Esta distinción es fundamental para entender las herramientas que usan hoy.
ChatGPT con búsqueda web activada es un agente. ChatGPT sin búsqueda es un LLM solo.
Pausa
Antes de seguir, asegurémonos de que la base está sólida.
¿Algo que no haya quedado claro? ¿Qué fue lo que más les sorprendió?
Ya entienden la teoría. Ahora vamos a verlo en acción con demos en vivo.
Vamos a ver las capacidades y los límites en tiempo real.
03Demo 1
El mismo prompt en dos modelos diferentes produce resultados sorprendentemente distintos.
Soy director de operaciones de una empresa de logística con 200 empleados. Estoy evaluando implementar IA en el servicio al cliente. Dame un análisis honesto de pros, contras y riesgos. Sé directo, no me vendas la idea.
No hay un modelo "mejor". Hay modelos diferentes para tareas diferentes.
Demo 2
ChatGPT SIN búsqueda web. Modelo base solamente.
Dame 5 artículos científicos sobre el impacto de la inteligencia artificial en la gestión de cadenas de suministro, publicados entre 2020 y 2024. Incluye: autor, título exacto, revista, año, y DOI.
El modelo no buscó esto. Lo inventó. Y suena perfecto. Predice texto probable, no verifica verdad.
Demo 3
Subir una gráfica financiera o foto de notas en whiteboard.
Analiza esta gráfica. ¿Qué tendencias identificas? ¿Qué decisiones de negocio sugerirías con base en estos datos?
Transcribe estas notas y organízalas en un formato estructurado.
Ejercicio
Haz una captura de pantalla de esta gráfica financiera y súbela a Claude o ChatGPT para el ejercicio de análisis.
Ejercicio
Toma screenshot de esta hoja de notas de biología y pídele a la IA que las transcriba y organice en formato estructurado.
Demo 4
La misma pregunta, dos maneras de formularla. Resultados radicalmente diferentes.
"Tengo un presupuesto de $50,000 USD para marketing digital de una empresa B2B de software. ¿Cómo lo distribuyo?"
"Tengo $50,000 USD para marketing digital B2B de software. Piensa paso a paso: primero analiza los canales más efectivos para B2B, luego evalúa el ROI típico de cada canal, después propone una distribución justificada, y finalmente identifica los riesgos."
La calidad del output es directamente proporcional a la calidad del input.
Demo 5
ChatGPT con Deep Research activado. La diferencia entre generar texto e investigar de verdad.
Investiga las 3 herramientas de IA más adoptadas en empresas latinoamericanas en 2025-2026. Para cada una: nombre, qué hace, cuántas empresas la usan, precio, y un caso de uso real documentado. Cita tus fuentes.
El modelo BUSCA en internet en tiempo real. Cita fuentes reales. Esto es un agente.
Demo 6
De notas desordenadas a email profesional en segundos.
Tengo estas notas de una reunión: "Cliente quiere reducir costos 15%, plazo Q3, preocupados por calidad, necesitan propuesta para el viernes, mencionaron que competencia ofrece mejor precio." Genera un email profesional de seguimiento al cliente que aborde cada punto. Tono formal pero cercano. Máximo 200 palabras.
Esto no reemplaza su criterio. Esto acelera su ejecución.
Usar IA sin criterio es más peligroso que no usarla.
04Riesgo 1
El modelo genera información que suena posible pero es completamente falsa. Ocurre porque optimiza coherencia, no verdad.
Cuanto más confiada suena la IA, más cuidado debes tener.
Veamos casos reales que demuestran el impacto de este problema.
Caso real 1
En junio de 2023, el abogado Steven Schwartz presentó un escrito legal ante un tribunal federal de Nueva York citando 6 casos judiciales que no existían. Todos fueron generados por ChatGPT.
Fuente: Mata v. Avianca, Inc. (1:22-cv-01461), S.D.N.Y., junio 2023
Caso real 2
En 2024, varias editoriales científicas retractaron papers que contenían texto claramente generado por IA, incluyendo frases como "As an AI language model..." olvidadas en el texto.
Fuentes: Nature (2024), Retraction Watch, Wiley Communications (2024)
Caso real 3
En 2023, el profesor Jonathan Turley de la Universidad George Washington descubrió que ChatGPT lo acusaba de acoso sexual citando un artículo de The Washington Post que nunca existió.
Fuentes: USA Today (2023), The Guardian (2023), BBC News (2023)
Riesgo 2
Los datos de entrenamiento reflejan sesgos humanos. El modelo los amplifica.
La IA no tiene opiniones. Pero reproduce los patrones de sus datos.
Riesgo 3
¿Qué pasa cuando escribes algo en ChatGPT?
Reflexión
Guía
La calidad de la respuesta depende de la calidad de la pregunta.
05Fundamento
La calidad del output es directamente proporcional a la calidad del input. No es un hack ni un truco: es la interfaz entre intención humana y capacidad de máquina.
"Hazme un reporte de ventas"
"Genera un reporte ejecutivo de ventas Q1 2026 para presentar al board. Incluye: tendencias vs Q4 2025, top 3 productos por revenue, y 2 riesgos identificados. Formato: bullet points. Máximo 300 palabras. Tono directo."
Framework
Quién quieres que sea la IA
Qué necesitas que haga
Cómo quieres la respuesta
Contexto y datos relevantes
Nivel de creatividad vs precisión
R Actúa como consultor de operaciones con 20 años de experiencia en logística. A Analiza los cuellos de botella más comunes en una cadena de suministro B2B. F Tabla con problema, impacto y acción recomendada. A Somos una empresa mediana de distribución con 150 empleados y operaciones en 3 países. T Sé directo y práctico, sin jerga innecesaria.
Técnica clave
Pedirle a la IA que "piense paso a paso" mejora dramáticamente la calidad de sus respuestas. No es un truco — es cómo funciona mejor la arquitectura.
Prompt: "Hazme una página web para venta de boletería"
Respuesta: genera un HTML genérico con un formulario básico, sin considerar pagos, asientos, ni validaciones
Prompt: "Piensa paso a paso: ¿qué necesita una página web de venta de boletería? Primero lista los requisitos, luego diseña la estructura, y finalmente genera el código."
Respuesta: analiza requisitos (catálogo de eventos, selección de asientos, pasarela de pago, confirmación por email), propone arquitectura, y genera código completo y funcional
Mecanismo
El modelo genera un token a la vez. Cuando le pides razonar paso a paso, cada paso intermedio se convierte en contexto para el siguiente — como si le dieras más "espacio para pensar".
Aplicación
Matemáticas, programación, análisis de datos, diagnósticos
"Evalúa los pros y contras paso a paso antes de recomendar"
"Lee este párrafo, identifica la tesis, luego evalúa la evidencia"
Traducciones, resúmenes cortos, preguntas de un solo dato
"Piensa paso a paso" / "Razona antes de responder" / "Muestra tu proceso de pensamiento" / "Primero analiza, luego concluye"
Más técnicas
"Mejora esto considerando X" — refinar en múltiples pasos hasta obtener lo que quieres
"No uses jerga técnica" / "Máximo 200 palabras" / "Formato de tabla"
"Ahora argumenta en contra de tu propia respuesta"
Decirle al modelo lo que NO debe hacer suele ser contraproducente. En vez de "no uses jerga técnica", dile "usa lenguaje simple y directo". Instrucciones positivas producen mejores resultados.
Visión
La IA no apareció de la nada. Es el resultado de décadas de trabajo, fracasos y descubrimientos. La mayoría de usuarios no sabe esto. Ustedes ahora sí.
Para recordar
¿Preguntas? Escríbanme.
Próxima sesión: de entender qué es la IA, a ver claramente cómo aplicarla mejor y con más estructura.