EcoCampus de los Cerros

Sede Norte

Atención para aspirantes

logo uamerica blanco

Curso Análisis de Datos para Big Data

El Curso Análisis de Datos para Big Data proporciona a los estudiantes herramientas clave para el análisis de grandes volúmenes de datos, superando las limitaciones de las hojas de cálculo tra-dicionales.

Modalidad:

Sincrónica

Duración:

36 horas

Costo:

$1.260.000

Recibe más información

Llena los datos en el formulario para recibir mas información del programa

Este campo está oculto cuando se visualiza el formulario
Este campo es un campo de validación y debe quedar sin cambios.
Justificación

Con un enfoque 75% práctico y 25% teórico, se trabajará con Python, Pandas y Plotly en un entorno 100% en la nube mediante Google Colaboratory, lo que facilita el acceso desde cualquier dispositivo. A lo largo del programa, los participantes aprenderán a automatizar tareas, manipular grandes conjuntos de datos y generar visualizaciones interactivas, optimizando el análisis y la toma de decisiones en proyectos de Big Data. Además, se explorará la evolución del Big Data y su impacto global, brindando fundamentos sólidos para su aplicación en investigación y desarrollo profesional.

Objetivo general:

Brindar herramientas a los estudiantes para el manejo, análisis y visualización de estructuras de datos con herramientas del lenguaje de programación Python.

Objetivos Específicos:  

  • Hacer una introducción a los criterios del panorama del Big Data y cómo estas herramientas están al alcance de cualquier persona dado su contexto open source.
  • Hacer un repaso general del lenguaje de programación Python en el entorno de trabajo de oogle Colaboratory.
  • Enseñar el uso de la librería pandas, para cargar datos de diferentes orígenes, filtrar, transformar y guardar la información
  • Enseñar el uso de la librería plotly para la presentación interactiva de resultados.

 

Este curso está dirigido a todas aquellas personas con conocimientos básicos de programación que deseen manejar grandes volúmenes de datos de manera eficiente, superando las limitaciones de herramientas tradicionales como las hojas de cálculo. Es ideal para profesionales y estudiantes de áreas como ingeniería, economía, administración, ciencias sociales y cualquier disciplina en la que el análisis de datos sea clave para la toma de decisiones. También es una excelente oportunidad para quienes buscan adentrarse en el mundo del Big Data y la ciencia de datos, fortaleciendo sus habilidades en el procesamiento y visualización de información.

Conocimientos basicos en programacion en cualquier lenguaje, tener experiencia en bases de datos en Excel u otras herramientas, tener una cuenta de Google.

Se propone una metodología virtual de seis horas a la semana, dividida en tres clases de dos horas donde los primeros 30 minutos son teóricos y se explica el tema a tratar, una hora donde se desarrollará de manera simultánea con los estudiantes el ejercicio de la aplicación con la herramienta Colaboratory, para que de esta manera realicen las preguntas y expresen las dificultades que pudieran tener en la resolución del problema; en los últimos 30 minutos se hace una introducción al tema de la siguiente clase y se propone un ejercicio para reforzar los conocimientos adquiridos.

Los set de datos y los notebooks con los que se trabajará en la clase estarán preparados con los enunciados para que el estudiante solo proponga la solución y los tenga como referencia para resolver problemas con las herramientas adquiridas en el curso.

MÓDULO I. Big Data
  • ¿Qué es Big Data y por qué ha influido tanto en la última década?
  • 5 V del Big Data.
  • Herramientas para el procesamiento de grandes volúmenes de datos
  • Importancia de las visualizaciones en la presentación de conclusiones y hallazgos de análisis de datos
  • Computación en la nube como factor de éxito en el Big Data
  • Uso de Colaboratory de Google con Python
  • Tipos de datos
  • Entrada y salida de información por medio de consola
  • Bloques condicionales
  • Bloques de iteración
  • Instalación de librerías externas
  • Generalidades, origen de la librería y principales usos
  • Tipos de datos soportados por Pandas
  • Transformación de tipos de datos
  • Carga de datos de diferentes orígenes
  • Selección de filas y columnas
  • Filtrado de datos
  • Filtrado condicional de datos
  • Tratamiento de datos faltantes
  • Agrupaciones condicionales de datos
  • Herramientas básicas de visualización de Pandas
  • Combinación lógica de diferentes fuentes de datos en una sola fuente
  • Manejo de campos de tipo fecha
  • Manejo básico de series temporales
  • Repaso estadística básica con Pandas
  • Generalidades, origen de la librería y principales usos
  • Visualizaciones de puntos
  • Visualizaciones de líneas
  • Visualizaciones de barras e histogramas
  • Visualizaciones circulares
  • Visualizaciones especiales en 3D y mapas de calor
  • Análisis exploratorio de datos
  • Preparación de datos para algoritmos de machine learning
  • Detección de anomalías

La Universidad de América se reserva el derecho de ajustar, cambiar o modificar el contenido del programa.

Nos transformamos de manera integral para responder a los retos del mundo

Profesionales especialistas con conocimientos para la gestión estratégica administrativa, financiera, de proyectos y de mercado.

EcoCampus de los Cerros

EcoCampus de los Cerros

Sede Norte

Atención para aspirantes