PROGRAMA

MÁSTER EN BIG DATA E INTELIGENCIA ARTIFICIAL

Enfoque empresarial y enseñanza de excelencia

Nuestro programa abarca una amplia gama de tecnologías y técnicas de Big Data, desde el uso de sistemas NoSQL, el aprendizaje automático, IA Generativa  y la visualización de datos.

Te convertirás en un experto en la implementación de proyectos de Big Data con Inteligencia Artificial, utilizando herramientas y tecnologías líderes en la industria.

Además, contarás con el respaldo de profesionales que te guiarán a través de los desafíos y las mejores prácticas de las aplicaciones reales.

ASIGNATURAS PRESENCIALES

CONTENIDOS (3 ECTS)

Apache Spark es un entorno de ejecución especialmente orientado al entorno de Big Data por sus capacidades de paralelización y sus librerías específicas (SQL, Streaming, Machine Learning y grafos) para escenarios muy comunes en el universo de Big Data.

En esta asignatura se aprende a resolver problemas utilizando el paradigma de computación en paralelo de Apache Spark y manejar las APIs de Spark disponibles en distintos lenguajes de programación.

Fundamentos de Spark y Tuning en Spark

  • Arquitectura y organización
  • Datos en Spark: Resilient Distributed Datasets (RDDs). Transformaciones y acciones. Persistencia. Flujo de un programa spark. Entrada y salida de datos
  • Vista general de las APIs ofrecidas por Spark: Scala, Java, Python, R
  • SparkR: paralelización de DataFrames de R

Spark SQL

  • Introducción a DataFrames. Fuentes de datos: Hive, JDBC/ODBC y API de DataFrames

Procesamiento de grafos vía Spark

  • Introducción general a los operadores sobre grafos. Grafos en Spark: GraphX
  • Paquetes adicionales para Spark: GraphFrames. Algoritmos de grafos sobre GraphFrames

Procesado en tiempo real: Spark Streaming

  • Spark Streaming clásico: Discretized Streams (DStreams). Operaciones con DStreams: estado, robustez, ventanas
  • Operaciones sobre streaming estructurado: flujos, ventanas, entregas. Fuentes de datos para streaming: Kafka
  • Machine Learning sobre datos en streaming

Machine Learning: Spark ML

  • Aprendizaje supervisado: clasificación y regresión
  • Aprendizaje no supervisado
  • Creación de pipelines de aprendizaje automático

Coordinador

Paulo Villegas: Experto en Tecnología y Científico de Datos en Telefónica

Profesores

  • Carlos Alaíz Gudín: Escuela Politécnica Superior
  • Gonzalo Martínez Muñoz: Escuela Politécnica Superior
  • Estrella Pulido Cañabate:  Escuela Politécnica Superior
  • Paulo Villegas: Experto en Tecnología y Científico de Datos en Telefónica

CONTENIDOS (4 ECTS)

En esta asignatura se revisan las tecnologías de Inteligencia Artificial para el análisis y modelado de datos, centrándose en redes neuronales, Deep Learning y aprendizaje automático con TensorFlow y Keras.

Adicionalmente se estudian los métodos de predicción con series temporales, desde modelos estadísticos tradicionales, hasta enfoques basados en aprendizaje profundo, con aplicaciones en energías renovables.

Aprendizaje con redes neuronales clásicas

  • Perceptrones de Rosenblatt y perceptrones multicapa
  • Estrategias para aprendizaje de perceptrones

Aprendizaje con redes neuronales profundas (Deep Learning)

  • Innovaciones, función de activación, función de coste
  • Autocodificadores. Convolución. Técnicas para evitar sobreajuste

Marcos de desarrollo para Inteligencia Artificial: TensorFlow y Keras

  • Introducción a Keras: Fundamentos y estructura
  • Arquitectura de TensorFlow: Tensores, grafos, diagrama de flujo de datos
  • Aplicaciones prácticas utilizando TensorFlow – Keras: autoencoders, redes neuronales convolucionales (CNN), redes neuronales recurrentes, GAN, aprendizaje por refuerzo.

 Predicción con series temporales

  • Definición y análisis de series temporales: visualización, tendencia, estacionalidad y estacionaridad.
  • Predicción usando modelos clásicos autorregresivos: AR, MA, ARMA, ARIMA, SARIMA.
  • Modelos de aprendizaje profundo para series temporales

Computación cognitiva

  • Bases de la Computación Cognitiva. IBM Watson.
  • Infraestructura para Soluciones Cognitivas. Estrategia de Soluciones Cognitivas de IBM.
  • Impacto social: servicios cognitivos a través de IBM Cloud.

Coordinador

Estrella Pulido Cañabate: Escuela Politécnica Superior

Profesores

  • Carlos Alaíz Gudín: Escuela Politécnica Superior
  • Ángela Fernández Pascual: Escuela Politécnica Superior
  • Ana González Marcos: Escuela Politécnica Superior
  • Sara Martínez Martínez, Ingeniera especialista en IA y Datos, IBM

CONTENIDOS (5 ECTS)

En esta asignatura se aborda las principales aplicaciones de la Inteligencia Artificial en el procesamiento de información multimedia. Se estudian técnicas avanzadas para el análisis de imagen, audio y lenguaje natural, incluyendo modelos neuronales y grandes modelos de lenguaje.

También se introduce la utilización de IA en sistemas de reconocimiento biométrico y sus posibilidades en el reconocimiento biométrico conductual

Aplicaciones de IA en el tratamiento de Imagen. Multimedia (imagen, video).

  • Introducción al tratamiento de imagen y vídeo. Extracción de características en señales visuales: descriptores en imagen y vídeo. Descriptores globales, a nivel de región segmentada y de movimiento
  • Estrategias de indexación y búsqueda de contenido visual
  • Descripción y análisis de imágenes basada en redes neuronales convolucionales: fundamentos, entrenamiento, arquitecturas y transferencia de conocimiento adquirido

Aplicaciones de IA en el tratamiento de sonido. Multimedia (audio).

  • Extracción de características en la señal de voz y en la señal musical
  • Aplicaciones de reconocimiento de voz y detección de palabras clave
  • Aplicaciones para detección de hablante, detección de idioma, reconocimiento de emociones. Segmentación y separación de hablantes

Procesamiento de Lenguaje Natural

  • Introducción al PLN y lingüística computacional. Modelos grandes de Lenguaje-LLM
  • IA centrada en corpus. Anotación de un corpus. Metodología de anotación
  • Evaluación de un LLM. Fases de creación de un LLM. Fiabilidad de un LLM
  • De vectorización a modelos del lenguaje. Word2vec. BERT

 Aplicaciones de IA en análisis de textos

  • Introducción al procesado de texto lingüística computacional
  • Análisis de caracteres y de tokens: n-gramas, tokenización, bag of words
  • Análisis morfosintáctico y análisis semántico: ontologías, NER, topic modelling
  • Modelos estadísticos avanzados: redes neuronales para texto, embeddings de tokens, modelos neuronales convolucionales y recurrentes.
  • Modelos grandes de lenguaje LLMs

 Reconocimiento Biométrico

  • Introducción al reconocimiento biométrico de personas. Métricas de rendimiento. Fusión de sistemas biométricos
  • Reconocimiento facial y firma manuscrita. Particularidades del reconocimiento biométrico conductual

Coordinador

Francisco Gómez Arribas: Escuela Politécnica Superior

Profesores

  • Marta Guerrero Nieto: Lingüista Computacional, Coordinadora en Business and Language Analytics en el Instituto de Ingeniería del Conocimiento (IIC)
  • Daniel Ramos Castro: Escuela Politécnica Superior
  • Juan C. Sanmiguel:  Escuela Politécnica Superior
  • Julián Fierrez Aguilar: Escuela Politécnica Superior
  • Rubén Vera Rodríguez: Escuela Politécnica Superior
  • Gonzalo Mancera: Escuela Politécnica Superior
  • Sergio Gil: Data scientist del departamento de Ingeniería algorítmica en el Instituto de Ingeniería del Conocimiento (IIC)

CONTENIDOS (3 ECTS)

La Inteligencia Artificial generativa y explicable es clave en el procesamiento avanzado de información.

Se estudiarán técnicas de prompt engineering y su aplicación en la generación y edición de contenidos visuales y en el acceso inteligente a la información.

Asimismo, se introducirán métodos de Inteligencia Artificial Explicable (XAI) para la interpretación y evaluación de modelos complejos.

Aplicación de IA generativa al procesamiento de Imagen

  • Introducción a modelos generativos y prompt engineering
  • Edición inteligente de imágenes
  • Generación de datos sintéticos para entrenamiento de modelos

Aplicación de IA generativa para acceso Inteligente a la Información

  • Búsqueda avanzada de información
  • Recomendación personalizada de información
  • Síntesis y explicación de información recuperada

Inteligencia Artificial Explicable (XAI)

  • Introducción a la XAI. Motivación, definiciones
  • Algoritmos genéricos de explicabilidad (SHAP y LIME)
  • Algoritmos específicos de explicabilidad para Deep Learning DL, basados en gradientes y LRP
  • Comparación de algoritmos de explicabilidad: Coeficiente de Explicabilidad-Rendimiento EPC
  • Introducción a la Interpretabilidad global de los modelos de DL y RNNs

Aplicación de IA Generativa en la actualidad

  • Casos de uso en investigación
  • Casos de uso en la empresa

Coordinador

José Luís García Dorado: Escuela Politécnica Superior

Profesores

  • Juan C. Sanmiguel: Escuela Politécnica Superior
  • Ivan Cantador: Escuela Politécnica Superior
  • Alejandro Bellogin: Escuela Politécnica Superior
  • José Luis Jorro: Escuela Politécnica Superior
  • Christian Oliva Moya: Escuela Politécnica Superior
  • Daniel Perdices BurreroEscuela Politécnica Superior
  • Rafael Leira Osuna: Senior Observability Engineer, Naudit HPCN

CONTENIDOS (3 ECTS)

La Estadística constituye una disciplina fundamental para el análisis riguroso de datos en entornos de Big Data e Inteligencia Artificial. Proporciona las bases teóricas necesarias para la inferencia, la modelización y la validación de resultados en contextos complejos e inciertos.
Asimismo, permite comprender y evaluar el comportamiento de algoritmos de aprendizaje automático desde una perspectiva cuantitativa.
Su dominio es esencial para garantizar la fiabilidad, interpretabilidad y toma de decisiones basada en datos en aplicaciones reales.

Introducción

  • ¿Qué es la estadística?, modelo estadístico y método estadístico.
  • Algunas herramientas de análisis de datos mediante estadística.

Descripción de los datos

  • Descripción de una variable.
  • Descripción multivariante.

Modelos en estadística

  • Probabilidad y variables aleatorias.
  • Modelos univariantes de distribución de probabilidad.
  • Modelos multivariantes de distribución de probabilidad.

Inferencia Estadística

  • Estimación puntual y estimación por intervalos.
  • Estimación bayesiana.
  • Contraste de hipótesis

Coordinador

Francisco de Borja Rodríguez Ortiz: Escuela Politécnica Superior

Profesores

  • Luis Lago Fernández:  Escuela Politécnica Superior
  • Francisco de Borja Rodríguez Ortiz: Escuela Politécnica Superior

CONTENIDOS (5 ECTS)

La asignatura introduce las principales técnicas de aprendizaje automático supervisado y no supervisado para el análisis de datos, utilizando herramientas de R y Python.

Se profundiza en el preprocesamiento de datos, incluyendo limpieza, tratamiento de valores atípicos y faltantes, reducción de dimensionalidad y análisis de datos no estructurados.

Se abordan modelos de clasificación y regresión. Además, se estudian técnicas de clustering y validación de modelos, identificando sus fortalezas y debilidades en el contexto de procesamiento de grandes volúmenes de datos para obtener información.

Introducción al aprendizaje automático

  • Conceptos básicos, tipos de aprendizaje y flujo de trabajo en proyectos de ML
  • Validación de modelos mediante tasas de error, matriz de confusión y curvas ROC
  • Implementación de regresión lineal, logística y algoritmos de vecinos próximos
  • Análisis de sesgo, varianza y el impacto de la maldición de la dimensionalidad

Preprocesado de datos

  • Construcción, preparación y auditoría de bases de datos de múltiples fuentes
  • Análisis de distribución de variables y técnicas de reducción de dimensionalidad
  • Tratamiento de información no estructurada y resolución de casos prácticos

Aprendizaje automático

  • Algoritmos de Clustering: K-means, jerárquico, modelos EM y DBSCAN
  • Construcción y poda de árboles de decisión mediante algoritmos CART y C4.5
  • Métodos de aleatorización: técnicas de Bagging, Random Forests y variantes
  • Métodos de optimización: algoritmos de Boosting y Gradient Boosting
  • Clasificación y regresión de margen máximo con máquinas de vectores soporte (SVM)

Coordinador

Gonzalo Martínez Muñoz: Escuela Politécnica Superior

Profesores

  • Carlos Alaíz Gudín:  Escuela Politécnica Superior
  • Ana González Marcos: Escuela Politécnica Superior
  • Luis Lago Fernández: Escuela Politécnica Superior
  • Gonzalo Martínez Muñoz: Escuela Politécnica Superior
  • Christian Oliva Moya: Escuela Politécnica Superior
  • Manuel Sánchez Montañés: Escuela Politécnica Superior

CONTENIDOS (3 ECTS)

La asignatura se centra en la visualización de datos como herramienta clave para analizar información y extraer conocimiento, aprendiendo a seleccionar las representaciones gráficas más adecuadas según el tipo de datos.

Se estudian técnicas de visualización de distribuciones, proporciones, tendencias y relaciones entre variables, aplicando principios de diseño gráfico y percepción visual.

Introducción, importancia de la visualización

  • Fundamentos de visualización gráfica eficiente, sistemas de coordenadas y uso del color
  • Definición de la finalidad y el alcance estratégico de la visualización de datos

Tipos de Visualizaciones

  • Técnicas para representar cantidades, distribuciones y proporciones
  • Visualización de asociaciones entre variables cuantitativas, series temporales y tendencias

IBM Cognos Analytics

  • Acceso a datos, creación de consolas gráficas y análisis de datos integrado
  • Implementación de funciones de Inteligencia Artificial en el entorno de Cognos

Tableau

  • Conexión a datos, diseño de hojas, dashboards y análisis de patrones temporales
  • Visualización de información espacial y creación de gráficos interactivos con filtros

Grafana

  • Gestión de roles, orígenes de datos, cuadros de mando y automatización mediante templating
  • Configuración de sistemas de alertas (alerting) y uso de plugins.

Explotación de datos

  • Indexación y almacenamiento de información no estructurada con Elasticsearch
  • Aplicación de casos de uso prácticos integrando Elasticsearch y Grafana

Coordinadora

Rafael Leira Osuna: Especialista en sistemas de monitorización Big Data, Naudit

Profesores

  • Rafael Leira Osuna: Especialista en sistemas de monitorización Big Data, Naudit
  • Sara Martínez Martínez, Ingeniera especialista en IA y Datos, IBM
  • Alberto Torres Barrán: CTO y co-fundador, Komorebi

CONTENIDOS (5 ECTS)

La volumetría y necesidades de explotación de los datos en soluciones Big Data con Inteligencia Artificial implican un análisis detallado de los requisitos para una implementación eficaz, con tecnologías de alto rendimiento que permitan procesamiento con Spark en sistemas multicore, con coprocesamiento GPUs y computación distribuida.

También se trabaja con soluciones basadas en virtualización, con ejecución en contenedores y se describen los fundamentos de clouds públicos y privados.  Además, se hace una introducción a nuevas tendencias en computación de altas prestaciones como la prometedora computación cuántica.

Arquitecturas para tratar grandes volúmenes de información

  • Evolución tecnológica: Multicore, GPUs y FPGA
  • Arquitecturas de referencia para Big Data e Inteligencia Artificial

Supervisión y mantenimiento de un clúster para grandes cantidades de datos

  • Configuración inicial, administración, mantenimiento y seguridad del clúster
  • Gestión de logs, diagnóstico, planificación de trabajos y monitorización

Principios de programación paralela y distribuida en Python

  • Paralelismo en CPU y aceleración explotando el paralelismo de GPU
  • Computación distribuida en clúster

Evaluación de prestaciones y optimización

  • Benchmarking, tuneado de parámetros y medidas de rendimiento en casos reales

Infraestructura para el procesamiento de datos con Spark

  • Arquitectura del sistema, flujos de datos, gestión de memoria y modos de ejecución
  • Ciclo de vida del programa e interfaces de monitorización (Spark UI y History Server)

Virtualización de infraestructura

  • Infraestructura local vs Cloud
  • Infraestructura como Servicio (IaaS)
  • Soluciones de Cloud privado (Openstack) y Cloud público/hiperescalar (AWS, Google Cloud, Azure)

Virtualización basada en contenedores

  • Diseño, gestión de imágenes, orquestación y seguridad de aplicaciones en contenedores

Nuevas plataformas: computación cuántica

  • Principios, Qubits, puertas y circuitos cuánticos
  • Paralelismo, entrelazamiento, optimizadores y algoritmos cuánticos

Coordinador

Francisco Gómez Arribas: Escuela Politécnica Superior

Profesores

  • José Luís García Dorado: Escuela Politécnica Superior
  • Francisco Gómez Arribas: Escuela Politécnica Superior
  • Iván González Martínez: Escuela Politécnica Superior
  • Miguel Ángel Mora: Escuela Politécnica Superior
  • Javier Ramos de Santiago: Escuela Politécnica Superior

CONTENIDOS (4 ECTS)

Los proyectos de Big Data suponen considerar todos los pasos del ciclo de vida analítico del dato: Aprovisionar, Persistir, Analizar y Consumir o explotar el resultado. En esta asignatura se revisarán cada uno de los pasos tomando como ejemplos algunos de los componentes más representativos de la industria alrededor del entorno Hadoop o que sean compatibles con ese ecosistema. La implementación de todas esas fases adquiere una personalidad propia y diferente si se están considerando datos estáticos o en movimiento, dado que estas últimas aportan su propia interpretación que, además, esté alineada con los requerimientos especiales de los datos en movimiento (volatilidad del dato, tiempo real, etc. ).

Los componentes que se pueden involucrar en la solución final pueden ser de muy distinta naturaleza y a lo largo de las distintas asignaturas que se han visto en el Máster se han visto distintas alternativas para poder acometer un mismo resultado final. Es el momento de entender cómo se debe acometer un proyecto con el objetivo de determinar cuáles son los requerimientos que van a permitir discernir qué solución se ajusta mejor a los requerimientos iniciales.

El objetivo de esta asignatura es conocer y entender la problemática de la manipulación del dato desde el origen donde se encuentra, su acceso, control y mejora de su calidad. En ese sentido se estudian y analizan distintas tecnologías involucradas (Apache Nifi, Apache Kafka) así como las problemáticas que aportan distintas fuentes de datos como Internet de las Cosas, Industria 4.0.

Proyecto Apache Hadoop

  • Sistemas de ficheros distribuido HDFS y modelo MapReduce
  • Desarrollo de flujos con lenguaje Pig

Persistencia de datos

  • Hive (Data Warehouse) y componentes de consulta en HBase
  • ormatos de persistencia optimizados: Parquet y ORC

Análisis de datos en movimiento

  • Arquitecturas y topologías con Apache Storm
  • Procesamiento de flujos de datos con Apache Flink

Gobierno del Dato

  • Metadatos, linaje del dato y terminología de gobernanza
  • Calidad del dato con Apache Atlas y Apache Griffin

Fuentes de datos y descubrimiento

  • Escenarios y plataformas de Internet de las cosas (IoT)
  • Aplicación y casos de éxito en Industria 4.0

Aprovisionamiento y captura de datos

  • Componentes y desarrollo con Apache NiFi
  • Configuración y despliegue de Apache Kafka

Coordinador

Juan José Sánchez Peña: Departamento de Ciberseguridad de Movistar+

Profesores

  • Juan José Sánchez Peña: Departamento de Ciberseguridad de Movistar+
  • Francisco Javier Cano Bailén: Especialista en Ciencia de Datos y Gobierno del Dato. IBM
  • Pedro Luis Pérez Latorre:Smart Metering Technology Expert. Telefónica TechDa
  • Daniel Perdices BurreroEscuela Politécnica Superior
  • Iván González Martínez:Escuela Politécnica Superior

CONTENIDOS (3 ECTS)

La búsqueda de la información que necesitamos y la generación de conclusiones y análisis impone una criticidad al hecho de asegurar la confidencialidad, integridad, disponibilidad y autenticidad de los datos. Es fundamental no solo manejar los procedimientos estándar para el cifrado de información sino conocer las principales técnicas para el establecimiento de procedimientos de control de acceso a la información y, también, conocer los principales mecanismos para la anonimización de datos. Además, se analizan los aspectos legales, epistémicos, éticos y de gestión organizativa en el área del Big Data y de los algoritmos de aprendizaje automático.

Introducción y conceptos base 

  • Introducción al concepto de privacidad en Big Data
  • Sesgos en Inteligencia Artificial

Tecnologías criptográficas para la protección de la privacidad

  • Fundamentos criptográficos de la protección de la información
  • Gestión de la identidad digital y certificados digitales: estándar X.509
  • Conceptos de trazabilidad, enlazado, anonimato y firmas grupales
  • Navegación anónima: redes de mezcla, onion routing y ofuscación de tráfico

Privacidad como control estadístico del acceso a datos

  • Análisis de datos y metadatos que permiten la re-identificación de individuos
  • Valor y riesgo asociado a los datos y metadatos en abierto (Open Data)

Marco jurídico de protección de datos y transferencia internacional

  • Introducción al Reglamento General de Protección de Datos (RGPD)
  • Privacy Shield Framework para la transferencia entre EE.UU. y la UE
  • Privacy Directive (‘cookie law’)

Implicaciones ético-legales y gobernanza 

  • Gobernanza de algoritmos como problema epistémico, moral, técnico y legal
  • Debate sobre Algorithmic Fairness, Accountability and Transparency (FAT*)
  • Riesgos de manipulación, problemas de predicción y path dependency
  • Análisis del actual marco legal europeo en toma de decisiones

Coordinador

Estrella Pulido Cañabate: Escuela Politécnica Superior

Profesores

  • Sergio Galán Martín, Analista de Ciberseguridad, Cellnex Telecom
  • Francisco de Borja Rodríguez Ortiz:  Escuela Politécnica Superior.
  • Gonzalo Mancera: Escuela Politécnica Superior

ASIGNATURAS NO PRESENCIALES (ONLINE)

Con tres asignaturas online accesibles a través de la plataforma UAMx

CONTENIDOS (3 ECTS)

El objetivo es conocer el sistema operativo Linux, organizar y configurar una red de ordenadores, instalar, configurar y administrar un clúster de ordenadores y conocer y gestionar máquinas virtuales

Sistema Operativo Linux

  • Conceptos generales, manejo de comandos, variables de entorno y desarrollo de scripts.
  • Control y planificación de procesos junto con la administración básica del sistema.
  • Gestión de sistemas de almacenamiento y sistemas de ficheros.

Redes de comunicación

  • Tipos de redes y conceptos de direccionamiento IP, máscara, DNS y DHCP.
  • Configuración de redes TCP/IP en Linux y protocolos de acceso remoto (ssh, ftp).
  • Fundamentos de seguridad mediante el uso de claves pública/privada y VPN.

Máquinas Virtuales

  • Conceptos de virtualización de plataforma e instalación y gestión de máquinas virtuales.
  • Creación y automatización de entornos virtuales con Vagrant.
  • Infraestructura como Servicio (IaaS): provisión de máquinas bajo demanda con capacidades actualizables.

Cluster de ordenadores

  • Arquitecturas de multicomputador y diseño de clusters de ordenadores.
  • Construcción, despliegue y gestión operativa de un clúster.
  • Planificación de tareas, balanceo de carga y aplicaciones específicas de un clúster.

Coordinador

Francisco Gómez Arribas: Escuela Politécnica Superior

Profesores

  • José Luis García Dorado: Escuela Politécnica Superior
  • Francisco Gómez Arribas: Escuela Politécnica Superior
  • Víctor Moreno Martínez: Principal Data Scientist, TomTom
  • Javier Ramos de Santiago:  Escuela Politécnica Superior

CONTENIDOS (3 ECTS)

El objetivo es conocer las técnicas de programación utilizando R y Python, diseñar y utilizar de forma eficiente los tipos y estructuras de datos más adecuados en cada entorno y utilizar las librerías de datos más extendidas en ambos lenguajes

Python

  • Introducción, instalación e intérpretes (notebooks)
  • Tipos básicos, funciones lambda, imports y programación orientada a objetos
  • Sentencias de control, iteración y programación funcional (map, reduce)
  • Gestión de entrada y salida de ficheros

Librerías

  • Manipulación de datos y cálculo numérico con numpy y pandas
  • Visualización de datos con matplotlib

Lenguaje R

  • Introducción, objetos y atributos en R
  • Estructuras de datos: vectores, arrays, listas y data frames
  • Lectura de ficheros, funciones y sentencias de control
  • Generación de gráficas y depuración de código
  • Uso de Notebooks y medición de tiempos

Coordinador

Carlos Alaíz Gudín: Escuela Politécnica Superior

Profesores

  • Carlos Alaíz Gudín: Escuela Politécnica Superior
  • Ángela Fernández Pascual: Escuela Politécnica Superior
  • Gonzalo Martínez Muñoz: Escuela Politécnica Superior
  • Alberto Torres Barrán: CTO y co-fundador, Komorebi

CONTENIDOS (3 ECTS)

Es innegable que el entorno tecnológico de Big Data está soportado por repositorios de muy distinta naturaleza y especialmente adaptados a los tipos de datos y a su uso. En esta asignatura se estudian y aplican las características, funcionalidades y estructura de las bases de datos NoSQL para permitir su diseño y uso adecuados, así como la implementación de aplicaciones basadas en ellas.

Introducción a las bases de datos NoSQL

  • ¿Qué son?, tipos de BBDD NoSQL, ventajas y desventajas

Base de Datos MongoDB

  • Organización y manejo básico de los datos
  • Métodos básicos de agregación, MapReduce y Aggregation Framework
  • Uso de índices

Base de Datos Redis

  • Estructuras de datos y programación en Lua
  • Bibliotecas de Lua y depuración de scripts Lua

Base de Datos Cassandra

  • Introducción y Cassandra Query Language

Base de datos Neo4j

  • Introducción y lenguaje de consulta Cypher

Coordinador

Juan José Sánchez Peña: Departamento de Ciberseguridad de M+

Profesores

  • Carlos Delgado Calle: Analista de Software en el Instituto de Ingeniería del Conocimiento (IIC)
  • Estrella Pulido Cañabate:  Escuela Politécnica Superior
  • Juan José Sánchez Peña: Departamento de Ciberseguridad de M+

DOCUMENTACIÓN ADICIONAL

Programa del Máster

Calendario del Máster