La brecha
Hoy no les voy a enseñar a usar ChatGPT. Hoy van a entender la tecnología que va a definir sus carreras.
Levanten la mano si usaron IA esta semana.
Ahora: levanten la mano si pueden explicar cómo funciona.
Hoy
La IA no apareció en 2022. Lleva 70 años intentándolo.
011950
"Computing Machinery and Intelligence" — el paper que lo empezó todo.
No preguntó "¿pueden pensar las máquinas?" sino "¿pueden comportarse como si pensaran?"
Esa distinción sigue siendo relevante hoy. El Test de Turing no mide inteligencia — mide imitación convincente.
1956
El verano en que se inventó la Inteligencia Artificial — literalmente. Cuatro investigadores convencieron a la Fundación Rockefeller de financiar un taller de 2 meses en Dartmouth College, New Hampshire.
1956 — Los fundadores
Inventó el término "Inteligencia Artificial". Creó el lenguaje LISP, que se usaría durante décadas en IA.
Cofundó el laboratorio de IA del MIT. Más tarde, irónicamente, sería quien frenaría el campo con su libro sobre perceptrones.
El padre de la teoría de la información. Sin su trabajo, ni internet ni la IA existirían.
Pensaron que la IA general estaba a 20 años. 70 años después, seguimos sin alcanzarla.
1958
Frank Rosenblatt construye el Mark I Perceptron en Cornell — una máquina física del tamaño de un armario que podía aprender a reconocer formas simples.
1969 — El golpe
Minsky y Papert publican "Perceptrons" — un libro que demuestra matemáticamente que los perceptrones simples no pueden resolver problemas básicos como la función XOR.
Primera vez que el hype superó la realidad. No sería la última.
1970s — 1980s
Los fondos se secan. Las promesas no se cumplieron.
1990s
Los sistemas expertos colapsan. Pero silenciosamente, los enfoques estadísticos comienzan a funcionar.
2012
ImageNet 2012: AlexNet aplasta a la competencia. El error de clasificación cae del 25% al 16% — usando una red neuronal profunda.
El momento en que datos + cómputo + algoritmos convergieron.
Ejemplo
Imaginen un cerebro artificial que quiere aprender a reconocer un gato en una foto. En vez de decirle "tiene orejas, bigotes y cola", le mostramos miles de imágenes:
"Esto ES un gato" 🐱
"Esto NO es un gato" 🚗
"Esto ES un gato" 🐱
Al principio adivina mal. Pero cada vez que se equivoca, se corrige un poco. Dentro del cerebro hay capas de "decisores" diminutos (neuronas):
Por eso se llama deep learning: entre más capas (profundidad), más complejo lo que puede reconocer.
2016
DeepMind vence a Lee Sedol, campeón mundial de Go. Resultado: 4-1.
2017
8 investigadores de Google publican un paper de 15 páginas. No sabían que estaban creando la base de toda la IA moderna.
Un solo paper. Toda la IA que usas hoy nació aquí.
Antes del Transformer
Antes de 2017, las redes neuronales procesaban el texto de forma secuencial — como leer un libro palabra por palabra, sin poder volver atrás.
Imagina leer un libro de 500 páginas sin poder volver a revisar las primeras.
La innovación
En vez de leer palabra por palabra, el Transformer mira TODAS las palabras al mismo tiempo y decide cuáles son relevantes entre sí.
"El banco estaba lleno de peces"
La atención conecta "banco" con "peces" para entender que es un banco de peces — no un banco financiero.
Todas las palabras se procesan al mismo tiempo. Mucho más rápido.
Cada palabra "ve" a todas las demás. Nunca olvida el principio.
Esto es lo que hizo posible entrenar modelos con miles de millones de parámetros.
2020 — 2023
2024 — 2026
Texto, imagen, video, código, voz — todo en un modelo
IA que puede tomar acciones, no solo generar texto
LLaMA, Mistral, Gemma — modelos abiertos compiten con los propietarios
EU AI Act, órdenes ejecutivas, debate global sobre límites
Estamos aquí. Pero recuerden los inviernos. ¿Qué podría salir mal esta vez?
El patrón
Cada avance importante fue seguido por decepción cuando las expectativas superaron las capacidades.
¿Estamos en un ciclo de hype o en una revolución real? ¿Por qué?
Gartner
El modelo de Gartner describe cómo las tecnologías pasan por fases predecibles: entusiasmo excesivo, decepción, y finalmente adopción real.
La pregunta es: ¿dónde está la IA generativa en este ciclo hoy?
Detrás de la magia hay matemáticas. Y las matemáticas son elegantes.
02El concepto central
Un modelo de lenguaje predice la siguiente palabra (token) más probable, una a la vez.
No "entiende". Calcula distribuciones de probabilidad sobre todos los posibles siguientes tokens.
Entrenamiento
Texto a escala de internet: libros, artículos, código, conversaciones. Billones de palabras.
Transformers: la estructura que permite procesar contexto en paralelo con atención.
Miles de GPUs entrenando durante semanas. El costo de entrenar GPT-4 se estima en $100M+.
Como aprender un idioma leyendo todos los libros del mundo, sin que nadie te explique la gramática.
Atención
Cuando el modelo lee tu prompt, no trata cada palabra por igual. Aprende cuáles son más relevantes para cuáles otras.
"parque" le dice al modelo que "banco" es un asiento, no una institución financiera. Eso es atención.
Lo inesperado
Estas habilidades no fueron programadas explícitamente. Emergieron de la escala.
Resuelve problemas lógicos paso a paso
Entre docenas de idiomas sin entrenamiento específico
Escribe, depura y explica programas
Genera textos, analogías, ideas originales
Nadie entiende completamente por qué aparecen. Es una pregunta de investigación abierta.
Entonces...
Si es un sistema de predicción de texto — no una mente — las implicaciones son claras:
Pausa
Antes de seguir, asegurémonos de que la base está sólida.
¿Algo que no haya quedado claro? ¿Algo que les sorprendió?
Ahora que saben cómo funciona, vamos a ponerla a prueba.
En parejas. Abran ChatGPT en su celular.
Spoiler: la mayoría van a encontrar citas completamente inventadas con autores, revistas y años falsos.
Debrief
Levanten la mano: ¿quién encontró al menos una cita completamente inventada?
Si no pueden verificar la respuesta, no la usen como hecho.
Usar IA sin criterio es más peligroso que no usarla.
03Riesgo 1
El modelo genera información que suena posible pero es completamente falsa. Ocurre porque optimiza coherencia, no verdad.
Cuanto más confiada suena la IA, más cuidado debes tener.
Veamos casos reales que demuestran el impacto de este problema.
Caso real 1
En junio de 2023, el abogado Steven Schwartz presentó un escrito legal ante un tribunal federal de Nueva York citando 6 casos judiciales que no existían. Todos fueron generados por ChatGPT.
Fuente: Mata v. Avianca, Inc. (1:22-cv-01461), S.D.N.Y., junio 2023
Caso real 2
En 2024, varias editoriales científicas retractaron papers que contenían texto claramente generado por IA, incluyendo frases como "As an AI language model..." olvidadas en el texto.
Fuentes: Nature (2024), Retraction Watch, Wiley Communications (2024)
Caso real 3
En 2023, el profesor Jonathan Turley de la Universidad George Washington descubrió que ChatGPT lo acusaba de acoso sexual citando un artículo de The Washington Post que nunca existió.
Fuentes: USA Today (2023), The Guardian (2023), BBC News (2023)
Riesgo 2
Los datos de entrenamiento reflejan sesgos humanos. El modelo los amplifica.
La IA no tiene opiniones. Pero reproduce los patrones de sus datos.
Riesgo 3
¿Qué pasa cuando escribes algo en ChatGPT?
Reflexión
Lo más fácil que la IA hace algo por ti, menos aprendes haciéndolo.
Guía
La calidad de la respuesta depende de la calidad de la pregunta.
04Fundamento
La calidad del output es directamente proporcional a la calidad del input. No es un hack ni un truco: es la interfaz entre intención humana y capacidad de máquina.
"Explica machine learning"
"Explica machine learning a un estudiante de ingeniería de 3er semestre. Usa una analogía con deportes. Máximo 150 palabras."
Framework
Quién quieres que sea la IA
Qué necesitas que haga
Cómo quieres la respuesta
Contexto y datos relevantes
Nivel de creatividad vs precisión
R Actúa como profesor de ingeniería industrial con 20 años de experiencia. A Explícame el concepto de cadena de suministro lean. F Primero una analogía cotidiana, luego la definición formal. A Soy estudiante de 3er semestre, sin experiencia laboral. T Sé preciso y técnico, no creativo.
Técnica clave
Pedirle a la IA que "piense paso a paso" mejora dramáticamente la calidad de sus respuestas. No es un truco — es cómo funciona mejor la arquitectura.
Prompt: "Hazme una pagina web para venta de boleteria"
Respuesta: genera un HTML generico con un formulario basico, sin considerar pagos, asientos, ni validaciones
Prompt: "Piensa paso a paso: ¿que necesita una pagina web de venta de boleteria? Primero lista los requisitos, luego diseña la estructura, y finalmente genera el codigo."
Respuesta: analiza requisitos (catalogo de eventos, seleccion de asientos, pasarela de pago, confirmacion por email), propone arquitectura, y genera codigo completo y funcional
Mecanismo
El modelo genera un token a la vez. Cuando le pides razonar paso a paso, cada paso intermedio se convierte en contexto para el siguiente — como si le dieras más "espacio para pensar".
Aplicación
Matemáticas, programación, análisis de datos, diagnósticos
"Evalúa los pros y contras paso a paso antes de recomendar"
"Lee este párrafo, identifica la tesis, luego evalúa la evidencia"
Traducciones, resúmenes cortos, preguntas de un solo dato
"Piensa paso a paso" / "Razona antes de responder" / "Muestra tu proceso de pensamiento" / "Primero analiza, luego concluye"
Más técnicas
"Mejora esto considerando X" — refinar en múltiples pasos hasta obtener lo que quieres
"No uses jerga técnica" / "Máximo 200 palabras" / "Formato de tabla"
"Ahora argumenta en contra de tu propia respuesta"
Visión
La IA no apareció de la nada. Es el resultado de décadas de trabajo, fracasos y descubrimientos. La mayoría de usuarios no sabe esto. Ustedes ahora sí.
Para recordar
¿Preguntas?
Próxima sesión: de entender qué es la IA, a ver claramente cómo aplicarla mejor y con más estructura.