EcoCampus de los Cerros

Sede Norte

Atención para aspirantes

logo uamerica blanco

Curso Tratamiento de Datos e Introducción a Machine Learning

Este Curso Tratamiento de Datos e Introducción a Machine Learning tiene como objetivo proporcionar herramientas avanzadas para el trata-miento de datos, facilitando su posterior análisis mediante técnicas básicas de Ma-chine Learning.

Modalidad:

Sincrónica

Duración:

40 horas

Costo:

$ 1.400.000

Recibe más información

Llena los datos en el formulario para recibir mas información del programa

Este campo está oculto cuando se visualiza el formulario
Este campo es un campo de validación y debe quedar sin cambios.
Justificación

Su enfoque será práctico, con ejercicios de programación en Python utilizando los frameworks pandas y sklearn, donde en cada clase se combinará una explicación teórica con la solución de un ejercicio aplicado. La preparación de datos es una de las principales actividades de los científicos de datos e ingenieros, representando más del 70% del tiempo en proyectos de Machine Learning, ya que los errores en el código suelen derivarse de un tratamiento inadecuado de los datos. Además, durante el análisis exploratorio, se pueden identificar patrones y características inherentes antes de aplicar técnicas más avanzadas. Este curso está diseñado para dotar a los participantes de herramientas que les permitan preparar conjuntos de datos estructurados para su exploración y posterior análisis con técnicas básicas de Machine Learning, abordando algoritmos clásicos con un enfoque práctico, lo que permitirá obtener resultados de manera rápida y optimizar modelos para seleccionar el que mejor describa el comportamiento del fenómeno analizado.

Objetivo general:

Mostrar la preparación de datos como la etapa más importante antes de realizar cualquier análisis o plantear modelos de machine learning.

Objetivos Específicos:  

  • Hacer una introducción a los algoritmos de machine learning mediante el uso de la librería sklearn.
  • Enseñar a los estudiantes a realizar un análisis exploratorio EDA y poder preparar los datos para algoritmos de machine learning mediante el framework pandas de Python.

 

Este curso está dirigido a profesionales, estudiantes y entusiastas del análisis de datos e inteligencia artificial que deseen fortalecer sus habilidades en el tratamiento de datos y en la implementación de técnicas básicas de Machine Learning utilizando Python. Se recomienda que los participantes tengan conocimientos fundamentales sobre el lenguaje Python, así como experiencia en la gestión de entornos virtuales con herramientas como Anaconda, Virtualenv o Poetry. También es conveniente contar con una comprensión básica de estadística descriptiva para interpretar adecuadamente las métricas de evaluación de modelos.

  1. Conocimientos basicos del lenguaje de programación python
  2. Conocimientos basicos en estadistica descriptiva

La metodología será muy práctica y enfocada en el desarrollo de software donde cada clase se verá una explicación teórica del tema a tratar con un ejemplo y su solución en Python.

De igual manera, se propondrá un ejercicio corto para aplicar lo aprendido en la parte teórica: el ejercicio se resolverá de manera participativa por los estudiantes y se resolverán todas las dudas en el mismo espacio.

MÓDULO I. Repaso de conceptos básicos de Python
  • Instalación de entorno Anaconda
  • Creación de entornos virtuales y el uso de los mismos
  • Programación en notebooks
  • Programación de scripts clases y métodos (conceptos básicos de programación orientada a objetos)
  • Tipos de datos en Python
  • Pandas como librería para manipulación de datos
  • Lectura de archivos desde diferentes fuentes, csv, xls, SQL, txt, json y lectura desde url
  • Manipulación básica para poder entender los datos que se leyeron en el apartado anterior
  • Visualizaciones básicas para entender el comportamiento estadístico básico de los datos
  • Reemplazo de valores faltantes o fuera de rango: entender el concepto de outlier
  • Creación de conjuntos y subconjuntos condicionados
  • Agrupaciones de datos y operaciones con datos agrupados
  • Agrupaciones de varias fuentes de datos para creación de una única fuente consolidada (en esta parte se verán las operaciones de conjuntos aplicadas a la manipulación de datos)
  • Correlación estadística
  • Regresión lineal
  • Regresión lineal múltiple
  • Regresión logística
  • Árboles de decisión
  • Clustering
  • Análisis de componentes principales
  • Kmeans

La Universidad de América se reserva el derecho de ajustar, cambiar o modificar el contenido del programa.

Nos transformamos de manera integral para responder a los retos del mundo

Profesionales especialistas con conocimientos para la gestión estratégica administrativa, financiera, de proyectos y de mercado.

EcoCampus de los Cerros

EcoCampus de los Cerros

Sede Norte

Atención para aspirantes