Ciencia de los Datos Aplicada

Grado y Doble Grado. Curso 2026/2027.

APRENDIZAJE SUPERVISADO III - 806319

Curso Académico 2026-27

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CG1 - Comunicar y transmitir la información a un público tanto especializado como no especializado.
CG2 - Adquirir la habilidad para expresarse claramente y de presentar los resultados de sus análisis, oralmente o por escrito, mediante un informe de carácter profesional.
CG5 - Desarrollar la capacidad de trabajar de forma autónoma.
CG6 - Realizar lecturas críticas de informes y publicaciones científicas.
CG11 - Poner en práctica las técnicas, herramientas y metodologías propias de la Ciencia de los Datos en distintos ámbitos de aplicación.
Específicas
CE3 - Describir situaciones con comportamiento aleatorio y aplicar la Ciencia de los Datos para resolver un problema real mediante los distintos pasos: identificar la información, diseñar el estudio, analizar los datos, construir un modelo adecuado, interpretar los resultados y emitir informes técnicos.
CE4 - Identificar la utilidad y el potencial de las técnicas estadísticas y de análisis de datos adquiridas en las distintas áreas de aplicación (como la documental, geográfica, actuarial, económica, financiera, biosanitaria, etc.) y utilizarlas adecuadamente para descubrir patrones de comportamiento en datos de cualquier volumen y tipología y extraer conclusiones relevantes.
CE5 - Aplicar la estimación, diagnosis, comparación y validación de modelos en diferentes problemas de inferencia y predicción sobre poblaciones de estudio.
CE6 - Aplicar técnicas estadísticas y de aprendizaje automático en el análisis de datos cualitativos y cuantitativos de cualquier volumen y tipo, tales como espaciales, de texto, imágenes, etc.
CE9 - Aplicar técnicas de análisis de datos para elaborar previsiones y escenarios y establecer relaciones entre variables de diferente tipo, como datos espaciales, textuales, imágenes, sonido, etc.
CE10 - Diseñar, programar e implantar aplicaciones de análisis y Ciencia de los Datos.
CE12 - Identificar y aplicar las técnicas adecuadas de exploración, gestión, procesamiento, explotación y visualización de datos en función de su volumen y complejidad.
CE16 - Identificar y aplicar las técnicas algorítmicas básicas y avanzadas para encontrar soluciones secuenciales y paralelas a problemas, analizando la complejidad y la adecuación de los algoritmos propuestos según el tipo, la organización y el volumen de los datos.

ACTIVIDADES DOCENTES

Clases teóricas
50%
Clases prácticas
50%

Presenciales

2,4

No presenciales

3,6

Semestre

6

Objetivos

Este curso se centra en técnicas avanzadas de aprendizaje supervisado, proporcionando conocimientos teóricos y prácticos sobre varios algoritmos y procesos utilizados en la definición y aplicación de modelos. A lo largo del curso, se profundizará en los siguientes temas, todos ellos desarrollados para problemas de clasificación y de regresión: Support Vector Machines, Algoritmo del Vecino Más Próximo (k-NN), ensamblado de modelos y la puesta en producción de modelos, incluyendo la creación de aplicaciones.

Contenido

1. Algoritmo del Vecino Más Próximo (k-NN)

- Introducción al algoritmo k-NN: concepto y principios fundamentales del k-NN; elección del valor de k y su impacto en el modelo.

- Distancias y métricas: diferentes métricas de distancia; impacto de la normalización de datos en k-NN.

- Aplicaciones de k-NN: ejemplos prácticos en clasificación y regresión; ventajas y limitaciones del algoritmo k-NN.

- Implementación y optimización: parámetros de ajuste y validación cruzada; implementación práctica en Python.

2. Support Vector Machines (SVM)

- Introducción a SVM: conceptos básicos y geometría del SVM; SVM para clasificación y regresión.

- Teoría del margen máximo: Hiperplanos y márgenes en un espacio de características, maximización del margen para mejorar la generalización.

- Kernels en SVM: funciones kernel y su importancia en la transformación de datos; tipos de kernels.

- Implementación y optimización: parámetros de ajuste y validación cruzada; implementación práctica en Python.

3. Ensamblado de Modelos

- Conceptos básicos: ventajas del ensamblado de modelos; métodos de ensamblado con distintos modelos base.

- Implementación y optimización: parámetros de ajuste y validación cruzada; implementación práctica en Python.

4. Puesta en Producción de Modelos

- Ciclo de vida de Machine Learning

- Infraestructura y Herramientas

- Monitorización y Mantenimiento

- Creación de Aplicaciones


Evaluación

A lo largo del curso, los estudiantes realizarán diversas pruebas de evaluación continua, tanto teóricas como prácticas, en las que se evaluará la adquisición de los conceptos de la asignatura y la aplicación de Python.

La nota final tendrá en cuenta tanto la evaluación continua como el examen final, y se calculará como el máximo entre:
a) Calificación del examen final
b) La media ponderada de la evaluación continua y el examen final, siendo el peso de la evaluación continua de al menos el 35% y como máximo del 50%.

En todo caso, el/la alumno/a no tiene la opción de superar la asignatura por evaluación continua.

Bibliografía

Alonso, J.M. & Calviño, A. (2025). Introducción a la Ciencia de Datos con R: Análisis Supervisado. García Maroto Editores.
Breiman, L., Friedman, J.H., Olshen, R.A. & Stone, C.J. (1984). Classification and Regression Trees. Chapman & Hall/CRC.
Hastie, T., Tibshirani, R. & Friedman, J. (2001). The Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer.
James, G., Witten, D., Hastie, T., Tibshirani, R. & Taylor, J. (2023). An Introduction to Statistical Learning with Applications in R (2ª ed.). Springer.
Kuhn, M. & Johnson, K. (2013). Applied Predictive Modeling. Springer.
Kuhn, M. & Silge, J. (2022). Tidy Modeling with R. O'Reilly.

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases Teóricas y/o Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único25/01/2027 - 13/05/2027VIERNES 11:00 - 13:00-INMACULADA GUTIERREZ GARCIA-PARDO


Actividades Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único25/01/2027 - 13/05/2027MARTES 13:00 - 15:00-INMACULADA GUTIERREZ GARCIA-PARDO