CIENCIA DE DATOS Y BIG DATA
PROGRAMA INTEGRAL EN IA GENERATIVA
Fecha de Inicio: 4 de julio de 2026
Duración: 120 Horas
Modalidades: Live Stream / C. de México
Inversión: $24,000.00 + I.V.A. / $29.999.00 + I.V.A.
Descuento exalumnos RHCECAM: 20% de Descuento
Descuento inscripción dos o más personas: 20% de Descuento
Descuento público general: 10% de Descuento
MÓDULO 1: FUNDAMENTOS DE IA y LLMs
- Fundamentos de LLMs y la Arquitectura Transformer
- Positional Encodings
- Tokenización
- Embeddings
- Mecanismo de Auto-Atención
- Diferencia entre Modelos Base y Modelos Alineados por Instrucciones
- Parámetros de Inferencia de los LLMs
- Control de aleatoriedad y creatividad (Temperatura, Top-p y Top-k)
- Entendimiento de la ventana de contexto y penalización de frecuencia y presencia.
- Prompt Engineering Avanzado
- Técnicas Zero-shot y Few-shot
- Razonamiento guiado con Chain of Thought (CoT) y Tree of Thoughts (ToT)
- Estrategias para forzar salidas estructuradas
- Estrategias de Delimitación XML y Markdown
- Consumo de APIs vs. Ejecución Local (Ollama / LM Studio)
- Latencia y privacidad
- Descarga y ejecución de modelos de Ollama
- Creación de GPTs Personalizados
- Creación de instrucciones de sistema
- Configuración de base de conocimiento y tono del asistente
- GPT Actions (Function Calling Teórico)
- Esquemas OpenAPI
- APIs externas
- Sistemas de Agentes y Flujos de Trabajo
- Taxonomía de Agentes
- Planificación y Memoria
- Casos de negocio aplicados a seguros/banca y otras áreas
- Introducción y Fundamentos de LangChain
- Modelos de chat vs. LLMs
- Prompts Templates y Output Parsers (para limpiar y estructurar salidas de texto)
- LangChain Expression Language (LCEL)
- Sintaxis de “pipes” (|)
- Runnables
- Paso de variables y ejecución en paralelo
- Memoria en LangChain
- Buffer Memory (historial completo)
- Summary Memory (resúmenes impulsados por LLM)
- Manejo de sesiones de chat
- Embeddings y Bases de Datos Vectoriales
- Modelos Embeddings
- Distancia coseno y búsqueda semántica
- Base de Datos Vectoriales (FAISS)
- RAG (Retrieval-Augmented Generation)
- Document Loaders (PDFs, CSVs, Web)
- Text Splitters (estrategias de chunking y solapamiento)
- Retrievers
- Uso y Creación de Tools
- El decorador “@tool” en Python
- Definición estricta de argumentos (Pydantic)
- Text To SQL Avanzado
- Cadenas de creación de consultas
- Ejecución segura y validación de errores
- Prevención de inyecciones SQL
- Agentes de IA con LangGraph
- Transición de cadenas lineales a grafos cíclicos
- Estado del grafo
- Nodos (funciones)
- Nodos Condicionales
- Servidores MCP (Model Context Protocol)
- Arquitectura Cliente-Servidor de MCP
- Uso con Python
- Fine-Tuning de LLMs en Colab con Unsloth
- Diferencia entre RAG y Fine-Tuning
- Preparación de datasets
- Conceptos de PEFT y optimización con QLoRA
- Unsloth
- Casos de negocio aplicados a seguros/banca y otras áreas
- Instalación y Explicación de la Arquitectura n8n
- Entornos self-hosted (Docker) vs. Cloud
- Gestión de variables de entorno
- Fundamentos: Nodos, Conexiones y Triggers
- Lógica Booleana en Flujos
- Diferencia entre nodos desencadenadores y nodos de acción
- Manejo y Transformación de Datos
- Entender la estructura JSON y las matrices en n8n
- Uso de los nodos Set, Filter, Switch
- Integraciones Básicas y APIs
- Uso del nodo HTTP Request
- Autenticación (API Keys, Bearer Tokens)
- Nodos de Inteligencia Artificial (Advanced AI)
- Configuración del nodo Language Model
- Proveedores de nube
- Modelos locales
- Generación de Texto y Estructuración
- Structured Output Parsers
- Paso de texto entre nodos
- Preparación para RAG (Carga de Documentos)
- Nodos extractores
- Text Splitters visuales
- Vectorización y Retrieval Conversacional
- Modelo de Embeddings
- Base vectorial
- Búsqueda de contexto
- El Nodo ‘Agent’
- Asignación de Herramientas (Tools)
- Memoria Conversacional
- Nodos Buffer Memory
- Persistir historial de la conversación en una base de datos
- Casos de negocio aplicados a seguros/banca y otras áreas
Andrés Octavio
Actuario, científico de datos en BBVA: forma parte de un grupo de Científicos de Datos en el área de ingeniería con tareas de desarrollar modelos predictivos para las diferentes Subdirecciones. Trabaja y explota la volumetría de las bases con Spark y modelos en Pyspark, Python y R (Árboles y Bosques de decisión, regresión logística, Perceptrón Multicapa, Cluster y Análisis de componentes principales, entre otros). Cuenta con amplia experiencia docente, dirigiendo cursos exitosamente en RHCECAM División Capacitación.

