Sesión 1 — AGYL

IA Básica:
De Turing
a GPT

Historia, cómo funcionan los LLMs, pensamiento crítico y prompt engineering.

Jerónimo Martínez Consultor de IA y automatización

Instructor

Jerónimo
Martínez

Consultor de IA y automatización. Capacitación corporativa en inteligencia artificial, agentes y herramientas de productividad.

305 246 3800

Algunos clientes

ESIC, CEIPA, La Casa del Tornillo, MultiEquipos, CREO, OMA

Plan del curso — 4 sesiones

Hoja de ruta

01

De Turing
a GPT

Historia, Test de Turing, LLMs, Hype Cycle, demos en vivo.

Hoy

02

Prompt
Engineering

Chain of Thought, role prompting, few-shot, frameworks avanzados.

03

Herramientas
y Workflow

ChatGPT vs Claude, cuándo usar cada uno, automatizaciones.

04

IA en el
Mundo Real

Ética, sesgos, deepfakes, futuro del trabajo, criterio.

La brecha

Todos usan IA.
Casi nadie
entiende cómo
funciona.

Hoy no les voy a enseñar a usar ChatGPT. Hoy van a entender la tecnología que va a definir sus carreras.

Escriban en el chat — 15 segundos

¿Usaron IA esta semana? ¿Para qué?

Segunda pregunta: ¿pueden explicar cómo funciona?

?

Hoy

Hoja de ruta

01

Historia 70 años de intentos: de Turing a ChatGPT

02

Cómo funciona Tokens, transformers y por qué la IA no "piensa"

03

Demos en vivo Capacidades y límites en tiempo real

04

Pensamiento crítico Alucinaciones, sesgo, límites y cómo evaluar

05

Uso estratégico Prompt engineering y aplicación profesional

Historia

70 años
de intentos

La IA no apareció en 2022. Lleva 70 años intentándolo.

01

1950

Alan Turing

"Computing Machinery and Intelligence" — el paper que lo empezó todo.

No preguntó "¿pueden pensar las máquinas?" sino "¿pueden comportarse como si pensaran?"

Esa distinción sigue siendo relevante hoy. El Test de Turing no mide inteligencia — mide imitación convincente.

50

1950 — El experimento

El Test de Turing

Un juez humano habla con dos participantes ocultos: uno es humano, el otro es una máquina. Si el juez no puede distinguir cuál es cuál, la máquina "pasa" el test.

Humano

Barrera

JUEZ

¿Quién es humano?

Barrera

Máquina

La clave: Turing no preguntó si la máquina piensa. Preguntó si puede parecer que piensa. Esa distinción sigue siendo relevante hoy.

1956

Conferencia de Dartmouth

El verano en que se inventó la Inteligencia Artificial — literalmente. McCarthy, Minsky y Shannon convencieron a la Fundación Rockefeller de financiar un taller de 2 meses en Dartmouth College.

La propuesta original

"Cada aspecto del aprendizaje puede describirse tan precisamente que una máquina puede simularlo"
Meta: resolver lenguaje, abstracción, creatividad y auto-mejora en un verano
Pensaron que la IA general estaba a 20 años. 70 años después, seguimos sin alcanzarla

1956 — El resultado

No resolvieron
nada.

Pero le dieron nombre al campo: Inteligencia Artificial.

Un verano, las mentes más brillantes del mundo, fondos ilimitados... y ni un solo problema resuelto. Pero la ambición quedó plantada.

1958

El Perceptrón

Frank Rosenblatt construye el Mark I Perceptron en Cornell — una máquina física del tamaño de un armario que podía aprender a reconocer formas simples.

El hype mediático

The New York Times, 1958: "La Marina revela un embrión de computadora que podrá caminar, hablar, ver y reproducirse"
Rosenblatt predijo: "percebirá, reconocerá e identificará su entorno sin entrenamiento humano"
La primera red neuronal. La primera promesa incumplida.

1969 — El golpe

Minsky destruye el sueño

Minsky y Papert publican "Perceptrons" — un libro que demuestra que estas redes neuronales simples tienen un problema fatal: solo pueden aprender cosas muy básicas.

Lo que demostraron

Un perceptrón puede separar cosas simples: "esto es rojo / esto es azul"
Pero no puede aprender combinaciones: "esto es rojo Y grande, O azul Y pequeño"
Es como un empleado que solo sabe decir sí o no a una sola pregunta

Lo que no vieron

Si conectas MUCHAS de estas neuronas en capas, SÍ pueden resolver cosas complejas
Pero en 1969 las computadoras no tenían la potencia para hacer funcionar eso

Primera vez que el hype superó la realidad. No sería la última.

1970s — 1980s

Primer
invierno

Los fondos se secan. Las promesas no se cumplieron.

Sistemas expertos

Basados en reglas escritas por humanos, no aprendizaje
Funcionaban en dominios estrechos, fallaban fuera de ellos
Lección: las reglas humanas no capturan la complejidad del mundo real

I

1990s

Machine Learning
emerge

Los sistemas expertos colapsan. Pero silenciosamente, algo nuevo está naciendo.

ML

Concepto

¿Qué es
Machine Learning?

En vez de decirle a la computadora QUÉ hacer paso a paso, le das ejemplos y ella aprende las reglas sola.

1

Le das datos Miles de ejemplos con la respuesta correcta

2

Busca patrones El algoritmo encuentra relaciones entre los datos

3

Hace predicciones Con datos nuevos, aplica lo que aprendió

Así funcionan las recomendaciones de Netflix, el filtro de spam, y el reconocimiento facial de tu celular.

ML

El cambio clave

De reglas a datos

Los sistemas expertos colapsan. Pero silenciosamente, un cambio radical está ocurriendo.

Antes: Reglas

Humanos escriben las reglas manualmente
"SI el email tiene 'gratis' Y 'urgente' ENTONCES es spam"
Frágil: cada excepción necesita una regla nueva

Ahora: Datos

La máquina descubre las reglas sola
Le das 10,000 emails marcados como spam/no-spam
Ella encuentra los patrones que los humanos no ven

Este cambio de "programar reglas" a "aprender de datos" es la revolución del Machine Learning.

1997

Deep Blue vs
Kasparov

La computadora de IBM vence al campeón mundial de ajedrez. El mundo celebra. Pero hay un detalle importante.

No era inteligencia

Deep Blue evaluaba 200 millones de posiciones por segundo
No "entendía" ajedrez. Calculaba todas las posibilidades por fuerza bruta
Era como ganar una carrera de autos contra un corredor: no corre mejor, simplemente tiene un motor

Vencer en ajedrez no es pensar. Es calcular. La verdadera pregunta era: ¿puede una máquina aprender estrategia sin que se la programen?

97

2012

La revolución
deep learning

ImageNet 2012: AlexNet aplasta a la competencia. El error de clasificación cae del 25% al 16% — usando una red neuronal profunda.

Datos Internet-scale

Cómputo GPUs

            Algoritmos
            Deep Neural Nets
          

El momento en que datos + cómputo + algoritmos convergieron.

12

Ejemplo

¿Cómo aprende una
red neuronal?

Imaginen que quieren enseñarle a una computadora a reconocer fotos de gatos. No le explican qué es un gato. Solo le muestran miles de fotos:

Miles de fotos

con etiqueta: gato / no gato

Intenta adivinar

y se equivoca mucho

Se corrige

ajusta sus conexiones internas

Aprende

después de millones de intentos

Las capas internas detectan cosas cada vez más complejas: bordes, formas, orejas, bigotes... hasta entender "gato". Por eso se llama deep learning: más capas = más profundidad = más comprensión.

2016 — Contexto

¿Qué es AlphaGo?

Go es un juego de mesa de 2,500 años de antigüedad, popular en Asia. Dos jugadores colocan piedras blancas y negras en un tablero intentando controlar territorio.

¿Por qué importa Go?

Tiene más posiciones posibles que átomos en el universo
No se puede resolver por fuerza bruta (como hicieron con el ajedrez)
Requiere intuición, estrategia a largo plazo y "lectura" del oponente
Los expertos decían que una máquina tardaría décadas en ganar

¿Cómo funciona AlphaGo?

Paso 1: Estudió millones de partidas humanas para aprender estrategias
Paso 2: Jugó millones de partidas contra sí misma para mejorar
Paso 3: Desarrolló estrategias que ningún humano había visto
No calculaba todas las posiciones. Aprendió intuición.

A diferencia de Deep Blue, AlphaGo no ganó por calcular más rápido. Ganó porque aprendió a jugar.

2016

AlphaGo

DeepMind vence a Lee Sedol, campeón mundial de Go. Resultado: 4-1.

Por qué importa

Go tiene más posiciones posibles que átomos en el universo
No se puede resolver por fuerza bruta como el ajedrez
La máquina aprendió estrategia e intuición
Movimiento 37: una jugada que ningún humano haría, pero que resultó brillante

2017

"Attention Is
All You Need"

8 investigadores de Google publican un paper de 15 páginas. No sabían que estaban creando la base de toda la IA moderna.

El paper

Vaswani et al., junio 2017
Propone una nueva arquitectura: el Transformer
Originalmente diseñado solo para traducción

Lo que generó

GPT (OpenAI)
BERT (Google)
Claude (Anthropic)
LLaMA (Meta)
Gemini (Google)

Un solo paper. Toda la IA que usas hoy nació aquí.

Antes del Transformer

El problema: leer una palabra a la vez

Antes de 2017, las redes neuronales procesaban el texto de forma secuencial — como leer un libro palabra por palabra, sin poder volver atrás.

El 1ro

gato 2do

se 3ro

sentó 4to

Dos problemas graves

Lento: no se puede paralelizar. Cada palabra espera a la anterior.
Olvida: al llegar al final de una oración larga, ya "olvidó" el principio.

Imagina leer un libro de 500 páginas sin poder volver a revisar las primeras.

La innovación

Mecanismo de atención

En vez de leer palabra por palabra, el Transformer mira TODAS las palabras al mismo tiempo y decide cuáles son relevantes entre sí.

"El banco estaba lleno de peces"

La atención conecta "banco" con "peces" para entender que es un banco de peces — no un banco financiero.

Paralelo

Todas las palabras se procesan al mismo tiempo. Mucho más rápido.

Contexto completo

Cada palabra "ve" a todas las demás. Nunca olvida el principio.

Esto es lo que hizo posible entrenar modelos con miles de millones de parámetros.

2020 — 2023

La era GPT

2020

GPT-3 175 mil millones de parámetros. La generación de lenguaje se vuelve asombrosamente buena.

2021

DALL-E Imágenes a partir de texto. La IA generativa se vuelve visual.

2022

ChatGPT 100 millones de usuarios en 2 meses. La adopción más rápida de una tecnología en la historia.

2023

GPT-4, Claude, Gemini Modelos multimodales: texto, imágenes, código, voz. La carrera se acelera.

2024 — 2026

Donde estamos hoy

Capacidad

Multimodal

Texto, imagen, video, código, voz — todo en un modelo

Autonomía

Agentes

IA que puede tomar acciones, no solo generar texto

Acceso

Open Source

LLaMA, Mistral, Gemma — modelos abiertos compiten con los propietarios

Gobierno

Regulación

EU AI Act, órdenes ejecutivas, debate global sobre límites

Estamos aquí. Pero recuerden los inviernos. ¿Qué podría salir mal esta vez?

El patrón

Ciclos de hype

Cada avance importante fue seguido por decepción cuando las expectativas superaron las capacidades.

60s

70s

80s

90s

2012

2023

???

Escriban en el chat — 30 segundos

¿Estamos en un ciclo de hype o en una revolución real? ¿Por qué?

HYPE

Gartner

El ciclo del hype

El modelo de Gartner describe cómo las tecnologías pasan por fases predecibles: entusiasmo excesivo, decepción, y finalmente adopción real.

La pregunta es: ¿dónde está la IA generativa en este ciclo hoy?

Sección 2

Cómo funciona
realmente

Detrás de la magia hay matemáticas. Y las matemáticas son elegantes.

02

Definición

¿Qué es un
LLM?

Large Language Model — Modelo Grande de Lenguaje. Es el motor detrás de ChatGPT, Claude, Gemini y todas las IAs conversacionales.

En palabras simples

Es un programa que leyó casi todo el texto disponible en internet
Aprendió los patrones del lenguaje humano: gramática, contexto, estilo, conocimiento
Ahora puede generar texto nuevo que suena como si lo escribiera un humano
Es "grande" porque tiene miles de millones de parámetros (conexiones internas ajustables)

Piensen en un LLM como un loro extremadamente sofisticado: no entiende lo que dice, pero reproduce los patrones del lenguaje.

LLM

El concepto central

Predicción del
siguiente token

Un modelo de lenguaje predice la siguiente palabra (token) más probable, una a la vez.

"El gato se" Input

            "sentó" (72%)
            "subió" (15%) "durmió" (8%)
          

No "entiende". Calcula distribuciones de probabilidad sobre todos los posibles siguientes tokens.

Por eso sin buen contexto las respuestas son genéricas: el modelo produce el promedio estadístico de todo lo que leyó. Darle contexto preciso cambia radicalmente el resultado.

T

Entrenamiento

Datos + Arquitectura + Cómputo

Ingrediente 1

Datos

Texto a escala de internet: libros, artículos, código, conversaciones. Billones de palabras.

Ingrediente 2

Arquitectura

Transformers: la estructura que permite procesar contexto en paralelo con atención.

Ingrediente 3

Cómputo

Miles de GPUs entrenando durante semanas. El costo de entrenar GPT-4 se estima en $100M+.

Como aprender un idioma leyendo todos los libros del mundo, sin que nadie te explique la gramática.

Arquitectura

¿Qué es un Transformer?

Es la "receta" que usan ChatGPT, Claude, Gemini y todos los modelos modernos. Funciona en 3 pasos:

01

Convierte palabras en números

Cada palabra se transforma en una lista de números que captura su significado. "Rey" y "Reina" tienen números parecidos porque significan cosas similares.

02

Mira todo al mismo tiempo

En vez de leer palabra por palabra, el Transformer ve TODA la oración a la vez y decide qué palabras se relacionan entre sí. Esto es la "atención".

03

Predice la siguiente palabra

Usando todo el contexto, calcula cuál es la palabra más probable que viene después. Y repite. Así genera texto completo, una palabra a la vez.

Piensen en el Transformer como un lector ultrarrápido que puede leer un libro entero al mismo tiempo, entender cómo se conecta cada palabra con todas las demás, y escribir la continuación más probable.

Atención

No todas las
palabras pesan igual

Cuando el modelo lee tu prompt, no trata cada palabra por igual. Aprende cuáles son más relevantes para cuáles otras.

El banco del parque está mojado

"parque" le dice al modelo que "banco" es un asiento, no una institución financiera. Eso es atención.

A

Lo inesperado

Capacidades
emergentes

Aquí viene lo más sorprendente: nadie les enseñó a hacer esto. Los LLMs fueron entrenados SOLO para predecir la siguiente palabra. Pero al hacerlo con suficientes datos, aparecieron habilidades que nadie programó:

No lo entrenaron para esto

Razonamiento

Resuelve problemas lógicos paso a paso, sin haberle enseñado lógica

No lo entrenaron para esto

Traducción

Traduce entre docenas de idiomas sin entrenamiento específico en traducción

No lo entrenaron para esto

Programación

Escribe y arregla código funcional, sin ser un compilador

No lo entrenaron para esto

Creatividad

Genera analogías, metáforas e ideas que parecen originales

Es como enseñarle a alguien a leer y que de pronto sepa matemáticas. ¿Cómo pasó?

La explicación

¿Cómo
emergieron?

El modelo leyó TODO internet. Al predecir la siguiente palabra en textos tan diversos, inevitablemente aprendió los patrones detrás del lenguaje:

Leyó textos bilingües Wikipedia en 100 idiomas, documentos de la ONU, subtítulos de películas. Aprendió que "cat" y "gato" aparecen en contextos idénticos. Resultado: sabe traducir.

Leyó código en GitHub Millones de repositorios con código y explicaciones. Aprendió que después de "def suma(a, b):" viene "return a + b". Resultado: sabe programar.

Leyó problemas resueltos paso a paso Libros de texto, foros de matemáticas, exámenes con soluciones. Aprendió los PATRONES del razonamiento. Resultado: puede razonar.

No le enseñaron a traducir, programar o razonar. Aprendió los patrones de cómo los humanos hacen esas cosas, y los replica.

E

Entonces...

¿Qué puede y qué no puede hacer?

Si es un sistema de predicción de texto — no una mente — las implicaciones son claras:

Puede

Generar texto coherente y útil a partir de instrucciones claras
Transformar, resumir y analizar información
Traducir, programar, explicar conceptos complejos
Ser sorprendentemente creativo con analogías e ideas

No puede

Garantizar que algo sea verdadero — predice, no verifica
Acceder a internet ni a información en tiempo real
Recordar conversaciones anteriores (sin memoria explícita)
Reemplazar el juicio humano, el contexto ni la experiencia

Distinción clave

LLM vs Agente

Esta distinción es fundamental para entender las herramientas que usan hoy.

LLM = Cerebro solo

Genera texto a partir de un prompt
No tiene memoria entre conversaciones
No puede buscar en internet ni ejecutar acciones
Le pides un email: te da el texto

Agente = Cerebro + Herramientas

LLM conectado a herramientas externas
Puede buscar en internet, acceder a archivos, ejecutar código
Puede recordar contexto y tomar acciones
Le pides un email: lo redacta Y lo envía

ChatGPT con búsqueda web activada es un agente. ChatGPT sin búsqueda es un LLM solo.

Pausa

¿Hasta aquí todo claro?

Antes de seguir, asegurémonos de que la base está sólida.

Escriban en el chat — 30 segundos

¿Algo que no haya quedado claro? ¿Qué fue lo que más les sorprendió?

Ya entienden la teoría. Ahora vamos a verlo en acción con demos en vivo.

Sección 3

Demos
en vivo

Vamos a ver las capacidades y los límites en tiempo real.

03

Demo 1

No todos los modelos
son iguales

El mismo prompt en dos modelos diferentes produce resultados sorprendentemente distintos.

Prompt (copiar en ambos)

Soy director de operaciones de una empresa de logística con 200 empleados. Estoy evaluando implementar IA en el servicio al cliente. Dame un análisis honesto de pros, contras y riesgos. Sé directo, no me vendas la idea.

Abrir ChatGPT

No hay un modelo "mejor". Hay modelos diferentes para tareas diferentes.

VS

Demo 2

Cuando la IA miente
con total confianza

ChatGPT SIN búsqueda web. Modelo base solamente.

Prompt

Dame 5 artículos científicos sobre el impacto de la inteligencia artificial en la gestión de cadenas de suministro, publicados entre 2020 y 2024. Incluye: autor, título exacto, revista, año, y DOI.

Abrir DeepSeek Chat

El modelo no buscó esto. Lo inventó. Y suena perfecto. Predice texto probable, no verifica verdad.

!

Demo 3

La IA ve,
no solo lee

Subir una gráfica financiera o foto de notas en whiteboard.

Prompt 1 — Gráfica financiera

Analiza esta gráfica. ¿Qué tendencias identificas? ¿Qué decisiones de negocio sugerirías con base en estos datos?

Prompt 2 — Notas de whiteboard

Transcribe estas notas y organízalas en un formato estructurado.

Abrir Claude

Ejercicio

Toma screenshot
de esta gráfica

Haz una captura de pantalla de esta gráfica financiera y súbela a Claude o ChatGPT para el ejercicio de análisis.

Abrir Claude

Ejercicio

Transcribe estas
notas y organízalas

Toma screenshot de esta hoja de notas de biología y pídele a la IA que las transcriba y organice en formato estructurado.

Abrir Claude

Demo 4

Prompt básico vs
prompt estratégico

La misma pregunta, dos maneras de formularla. Resultados radicalmente diferentes.

Sin Chain of Thought

"Tengo un presupuesto de $50,000 USD para marketing digital de una empresa B2B de software. ¿Cómo lo distribuyo?"

Con Chain of Thought

"Tengo $50,000 USD para marketing digital B2B de software. Piensa paso a paso: primero analiza los canales más efectivos para B2B, luego evalúa el ROI típico de cada canal, después propone una distribución justificada, y finalmente identifica los riesgos."

La calidad del output es directamente proporcional a la calidad del input.

Abrir Gemini

Demo 5

LLM vs Agente
en acción

ChatGPT con Deep Research activado. La diferencia entre generar texto e investigar de verdad.

Prompt

Investiga las 3 herramientas de IA más adoptadas en empresas latinoamericanas en 2025-2026. Para cada una: nombre, qué hace, cuántas empresas la usan, precio, y un caso de uso real documentado. Cita tus fuentes.

Abrir ChatGPT (Deep Research)

El modelo BUSCA en internet en tiempo real. Cita fuentes reales. Esto es un agente.

Demo 6

Algo que pueden
usar mañana

De notas desordenadas a email profesional en segundos.

Prompt

Tengo estas notas de una reunión: "Cliente quiere reducir costos 15%, plazo Q3, preocupados por calidad, necesitan propuesta para el viernes, mencionaron que competencia ofrece mejor precio." Genera un email profesional de seguimiento al cliente que aborde cada punto. Tono formal pero cercano. Máximo 200 palabras.

Esto no reemplaza su criterio. Esto acelera su ejecución.

Sección 4

Pensamiento
crítico

Usar IA sin criterio es más peligroso que no usarla.

04

Riesgo 1

Alucinaciones

El modelo genera información que suena posible pero es completamente falsa. Ocurre porque optimiza coherencia, no verdad.

Cuanto más confiada suena la IA, más cuidado debes tener.

Veamos casos reales que demuestran el impacto de este problema.

Caso real 1

Abogados sancionados

En junio de 2023, el abogado Steven Schwartz presentó un escrito legal ante un tribunal federal de Nueva York citando 6 casos judiciales que no existían. Todos fueron generados por ChatGPT.

Consecuencias

El juez P. Kevin Castel impuso una multa de $5,000 USD al abogado y su firma
Los casos citados tenían nombres de jueces reales, pero combinados con hechos inventados
ChatGPT incluso "confirmó" que los casos eran reales cuando se le preguntó

Fuente: Mata v. Avianca, Inc. (1:22-cv-01461), S.D.N.Y., junio 2023

!

Caso real 2

Papers fabricados

En 2024, varias editoriales científicas retractaron papers que contenían texto claramente generado por IA, incluyendo frases como "As an AI language model..." olvidadas en el texto.

El problema

Springer Nature retractó más de 50 papers sospechosos de ser generados por IA en 2024
Wiley cerró 19 revistas por artículos fabricados con IA
Papers con autores, datos experimentales y resultados completamente inventados pasaron revisión por pares

Fuentes: Nature (2024), Retraction Watch, Wiley Communications (2024)

F

Caso real 3

Biografías inventadas

En 2023, el profesor Jonathan Turley de la Universidad George Washington descubrió que ChatGPT lo acusaba de acoso sexual citando un artículo de The Washington Post que nunca existió.

Patrón repetido

El alcalde de Hepburn Shire (Australia) amenazó con demandar a OpenAI por una biografía falsa que lo vinculaba a un escándalo de sobornos
ChatGPT genera datos biográficos con fechas, lugares y eventos precisos pero falsos
La confianza con la que escribe hace casi imposible distinguir lo real de lo inventado

Fuentes: USA Today (2023), The Guardian (2023), BBC News (2023)

?

Riesgo 2

Sesgo

Los datos de entrenamiento reflejan sesgos humanos. El modelo los amplifica.

Estereotipos de género en descripciones de trabajo
Sesgo racial en generación y clasificación de imágenes
Subrepresentación de idiomas y culturas minoritarias

La IA no tiene opiniones. Pero reproduce los patrones de sus datos.

!

Riesgo 3

Privacidad y datos

¿Qué pasa cuando escribes algo en ChatGPT?

!

Tus datos pueden usarse para entrenamiento A menos que lo desactives explícitamente en configuración

!

No pegues información sensible Datos de clientes, contratos, propiedad intelectual, información financiera, datos médicos

!

Las conversaciones se almacenan Pueden ser revisadas por el proveedor para mejorar el servicio

Reflexión

La paradoja

Delegación

"Escribe mi ensayo sobre X"
"Resuelve este problema por mí"
Resultado: entregaste algo, no aprendiste nada

Aumentación

"Revisa la lógica de mi argumento"
"Explícame este concepto de otra forma"
Resultado: mejoraste tu trabajo Y tu comprensión

Guía

5 reglas para uso crítico

01

Nunca confíes sin verificar Si no puedes comprobar la respuesta, no la uses como hecho

02

Entiende lo que no puede hacer No accede a internet en tiempo real, no "sabe" cosas, no razona como humano

03

Protege información sensible Lo que escribes puede almacenarse y usarse para entrenamiento

04

Aumenta, no reemplaces, tu pensamiento Úsala como herramienta, no como sustituto de aprender

05

Mantente curioso sobre cómo funciona Entender la tecnología te da ventaja sobre quien solo la usa

Sección 5

El arte de
la instrucción

La calidad de la respuesta depende de la calidad de la pregunta.

05

Fundamento

Programar en
lenguaje natural

La calidad del output es directamente proporcional a la calidad del input. No es un hack ni un truco: es la interfaz entre intención humana y capacidad de máquina.

Instrucción vaga

"Hazme un reporte de ventas"

Instrucción precisa

"Genera un reporte ejecutivo de ventas Q1 2026 para presentar al board. Incluye: tendencias vs Q4 2025, top 3 productos por revenue, y 2 riesgos identificados. Formato: bullet points. Máximo 300 palabras. Tono directo."

P

Framework

La fórmula: RAFAT

Rol

Quién quieres que sea la IA

Acción

Qué necesitas que haga

Formato

Cómo quieres la respuesta

Antecedentes

Contexto y datos relevantes

Temperatura

Nivel de creatividad vs precisión

Ejemplo profesional

R Actúa como consultor de operaciones con 20 años de experiencia en logística. A Analiza los cuellos de botella más comunes en una cadena de suministro B2B. F Tabla con problema, impacto y acción recomendada. A Somos una empresa mediana de distribución con 150 empleados y operaciones en 3 países. T Sé directo y práctico, sin jerga innecesaria.

Técnica clave

Chain of Thought

Pedirle a la IA que "piense paso a paso" mejora dramáticamente la calidad de sus respuestas. No es un truco — es cómo funciona mejor la arquitectura.

Sin Chain of Thought

Prompt: "Hazme una página web para venta de boletería"

Respuesta: genera un HTML genérico con un formulario básico, sin considerar pagos, asientos, ni validaciones

Con Chain of Thought

Prompt: "Piensa paso a paso: ¿qué necesita una página web de venta de boletería? Primero lista los requisitos, luego diseña la estructura, y finalmente genera el código."

Respuesta: analiza requisitos (catálogo de eventos, selección de asientos, pasarela de pago, confirmación por email), propone arquitectura, y genera código completo y funcional

Mecanismo

¿Por qué funciona?

El modelo genera un token a la vez. Cuando le pides razonar paso a paso, cada paso intermedio se convierte en contexto para el siguiente — como si le dieras más "espacio para pensar".

01

Descompone el problema En vez de saltar a la respuesta, identifica sub-problemas

02

Genera contexto intermedio Cada paso que escribe se vuelve parte del input para el siguiente

03

Reduce errores acumulados Los pasos visibles permiten "corregir el rumbo" antes de la conclusión

1+1

Aplicación

Cuándo usar Chain of Thought

Ideal para

Problemas lógicos

Matemáticas, programación, análisis de datos, diagnósticos

Ideal para

Decisiones complejas

"Evalúa los pros y contras paso a paso antes de recomendar"

Ideal para

Análisis de textos

"Lee este párrafo, identifica la tesis, luego evalúa la evidencia"

No necesario para

Tareas simples

Traducciones, resúmenes cortos, preguntas de un solo dato

Frases que activan CoT

"Piensa paso a paso" / "Razona antes de responder" / "Muestra tu proceso de pensamiento" / "Primero analiza, luego concluye"

Más técnicas

Otras técnicas avanzadas

Técnica

Iteración

"Mejora esto considerando X" — refinar en múltiples pasos hasta obtener lo que quieres

Técnica

Restricciones

"No uses jerga técnica" / "Máximo 200 palabras" / "Formato de tabla"

Técnica

Contradicción

"Ahora argumenta en contra de tu propia respuesta"

Decirle al modelo lo que NO debe hacer suele ser contraproducente. En vez de "no uses jerga técnica", dile "usa lenguaje simple y directo". Instrucciones positivas producen mejores resultados.

Visión

70 años de
investigación.
Entender la historia =
tener perspectiva.

La IA no apareció de la nada. Es el resultado de décadas de trabajo, fracasos y descubrimientos. La mayoría de usuarios no sabe esto. Ustedes ahora sí.

Para recordar

3 ideas clave

01

La IA predice, no piensa Verificar siempre. Nunca asumir que es correcto porque suena bien.

02

Tu capacidad de hacer buenas preguntas es tu mayor ventaja Prompt engineering no es un truco — es comunicación efectiva con la máquina.

03

Usarla bien es una habilidad Empiecen a practicar hoy. Experimenten, fallen, mejoren.

Gracias

¿Preguntas? Escríbanme.

305 246 3800 @jeromartinezj

Próxima sesión: de entender qué es la IA, a ver claramente cómo aplicarla mejor y con más estructura.

IA Básica:De Turinga GPT

JerónimoMartínez

Hoja de ruta

De Turinga GPT

PromptEngineering

Herramientasy Workflow

IA en elMundo Real

Todos usan IA.Casi nadieentiende cómofunciona.

Hoja de ruta

70 añosde intentos

Alan Turing

El Test de Turing

Conferencia de Dartmouth

La propuesta original

No resolvieronnada.

El Perceptrón

El hype mediático

Minsky destruye el sueño

Lo que demostraron

Lo que no vieron

Primerinvierno

Sistemas expertos

Machine Learningemerge

¿Qué esMachine Learning?

De reglas a datos

Antes: Reglas

Ahora: Datos

Deep Blue vsKasparov

No era inteligencia

La revolucióndeep learning

¿Cómo aprende unared neuronal?

¿Qué es AlphaGo?

¿Por qué importa Go?

¿Cómo funciona AlphaGo?

AlphaGo

Por qué importa

"Attention IsAll You Need"

El paper

Lo que generó

El problema: leer una palabra a la vez

Dos problemas graves

Mecanismo de atención

Paralelo

Contexto completo

La era GPT

Donde estamos hoy

Multimodal

Agentes

Open Source

Regulación

Ciclos de hype

El ciclo del hype

Cómo funcionarealmente

¿Qué es unLLM?

En palabras simples

Predicción delsiguiente token

Datos + Arquitectura + Cómputo

Datos

Arquitectura

Cómputo

¿Qué es un Transformer?

Convierte palabras en números

Mira todo al mismo tiempo

Predice la siguiente palabra

No todas laspalabras pesan igual

Capacidadesemergentes

Razonamiento

Traducción

Programación

Creatividad

¿Cómoemergieron?

¿Qué puede y qué no puede hacer?

Puede

No puede

LLM vs Agente

LLM = Cerebro solo

Agente = Cerebro + Herramientas

¿Hasta aquí todo claro?

Demosen vivo

No todos los modelosson iguales

IA Básica:
De Turing
a GPT

Jerónimo
Martínez

De Turing
a GPT

Prompt
Engineering

Herramientas
y Workflow

IA en el
Mundo Real

Todos usan IA.
Casi nadie
entiende cómo
funciona.

70 años
de intentos

No resolvieron
nada.

Primer
invierno

Machine Learning
emerge

¿Qué es
Machine Learning?

Deep Blue vs
Kasparov

La revolución
deep learning

¿Cómo aprende una
red neuronal?

"Attention Is
All You Need"

Cómo funciona
realmente

¿Qué es un
LLM?

Predicción del
siguiente token

No todas las
palabras pesan igual

Capacidades
emergentes

¿Cómo
emergieron?

Demos
en vivo

No todos los modelos
son iguales

Cuando la IA miente
con total confianza

La IA ve,
no solo lee

Toma screenshot
de esta gráfica

Transcribe estas
notas y organízalas

Prompt básico vs
prompt estratégico

LLM vs Agente
en acción

Algo que pueden
usar mañana

Pensamiento
crítico

El arte de
la instrucción

Programar en
lenguaje natural

70 años de
investigación.
Entender la historia =
tener perspectiva.