2025 - Curso-taller: Introducción al Machine Learning para el Análisis de Datos

| Curso: | Introducción al Machine Learning para el Análisis de Datos |
| Modalidad | Virtual |
| Total de horas | 8 |
| Instructor | Manuel Spínola Parallada, Ph.D. (mspinola10@gmail.com, mspinola@una.cr) Sitio web: Manuel Spínola Blog Ciencia de Datos: Ciencia de Datos |
| Contacto e inscripción | asistentecontableicomvis@una.ac.cr |
| Fechas | martes 12, jueves 14, martes 19 y jueves 21 de agosto 2025 |
| Horario | 18.00 a 20.00 |
| Inversión | 102 dólares (ivai) |
I. Descripción
Aprende los fundamentos del machine learning (aprendizaje automático) con R aplicados al análisis de datos. Este curso te enseñará a transformar datos en conocimiento útil mediante visualización, modelado predictivo e interpretación de resultados, todo con un enfoque práctico y accesible para quienes se inician en este campo.
II. Contenido y Cronograma
Día 1 — Introducción y preparación de datos
Temas:
- ¿Qué es el machine learning?
- Tipos de aprendizaje y modelos
- Rgresión vs. Clasificación
- Flujo de trabajo típico en machine learning
- Exploración y carga de datos
- Preprocesamiento automatizado:
- Tratamiento de valores perdidos
- Estandarización y escalamiento
Día 2 — Entrenamiento y evaluación de modelos
Temas:
- Aplicación de múltiples algoritmos de forma sencilla:
- Árboles de decisión (decision trees)
- Bosques aleatorios (random forest)
- Modelos lineales generales
- Regresión logística
- SVM, boosting, KNN, Neural Networks, etc.
- Comparación automática de modelos
- Evaluación del rendimiento:
- RMSE, MAE, R2
- Accuracy, Sensibilidad, Especificidad
- F1 Score, ROC AUC, Kappa
Día 3 — Optimización de modelos y selección de variables
Temas:
- Interpretación de importancia de variables
- Reducción de variables y mejora del modelo
- Ajuste de hiperparámetros (hyperparameter tuning)
- Validación cruzada
- Detección y manejo de sobreajuste
Día 4 — Visualización, interpretación y aplicación práctica
Temas:
- Visualización automática de resultados:
- Curva ROC
- Matriz de confusión
- Comparación de modelos
- Aplicación del modelo a nuevos datos
- Comunicación de resultados
- Exportación y documentación de predicciones
Habilidades que desarrollará el participante
- Transformar y preparar datos para modelos de machine learning
- Entrenar y comparar modelos predictivos en R sin programación avanzada
- Evaluar el rendimiento de modelos de forma clara y reproducible
- Visualizar, interpretar y comunicar resultados de forma efectiva
III. Método
Las clases se desarrollaran interactivamente mostrando los conceptos y ejecución en R.
IV. Recursos
Software
Se utilizará el entorno y lenguaje de programación R.


