2025 - Curso-taller: Introducción al Machine Learning para el Análisis de Datos

Curso: Introducción al Machine Learning para el Análisis de Datos
Modalidad Virtual
Total de horas 8
Instructor

Manuel Spínola Parallada, Ph.D. (mspinola10@gmail.com, )

Sitio web: Manuel Spínola

Blog Ciencia de Datos: Ciencia de Datos

Contacto e inscripción asistentecontableicomvis@una.ac.cr
Fechas martes 12, jueves 14, martes 19 y jueves 21 de agosto 2025
Horario 18.00 a 20.00
Inversión 102 dólares (ivai)

I. Descripción

Aprende los fundamentos del machine learning (aprendizaje automático) con R aplicados al análisis de datos. Este curso te enseñará a transformar datos en conocimiento útil mediante visualización, modelado predictivo e interpretación de resultados, todo con un enfoque práctico y accesible para quienes se inician en este campo.

II. Contenido y Cronograma

Día 1 — Introducción y preparación de datos

Temas:

  • ¿Qué es el machine learning?
  • Tipos de aprendizaje y modelos
  • Rgresión vs. Clasificación
  • Flujo de trabajo típico en machine learning
  • Exploración y carga de datos
  • Preprocesamiento automatizado:
    • Tratamiento de valores perdidos
    • Estandarización y escalamiento

Día 2 — Entrenamiento y evaluación de modelos

Temas:

  • Aplicación de múltiples algoritmos de forma sencilla:
    • Árboles de decisión (decision trees)
    • Bosques aleatorios (random forest)
    • Modelos lineales generales
    • Regresión logística
    • SVM, boosting, KNN, Neural Networks, etc.
  • Comparación automática de modelos
  • Evaluación del rendimiento:
    • RMSE, MAE, R2
    • Accuracy, Sensibilidad, Especificidad
    • F1 Score, ROC AUC, Kappa

Día 3 — Optimización de modelos y selección de variables

Temas:

  • Interpretación de importancia de variables
  • Reducción de variables y mejora del modelo
  • Ajuste de hiperparámetros (hyperparameter tuning)
  • Validación cruzada
  • Detección y manejo de sobreajuste

Día 4 — Visualización, interpretación y aplicación práctica

Temas:

  • Visualización automática de resultados:
    • Curva ROC
    • Matriz de confusión
    • Comparación de modelos
  • Aplicación del modelo a nuevos datos
  • Comunicación de resultados
  • Exportación y documentación de predicciones

Habilidades que desarrollará el participante

  • Transformar y preparar datos para modelos de machine learning
  • Entrenar y comparar modelos predictivos en R sin programación avanzada
  • Evaluar el rendimiento de modelos de forma clara y reproducible
  • Visualizar, interpretar y comunicar resultados de forma efectiva

III. Método

Las clases se desarrollaran interactivamente mostrando los conceptos y ejecución en R.

IV. Recursos

  1. Software

    Se utilizará el entorno y lenguaje de programación R.