CREA: Colección de Recursos Educativos Abiertos

 

Implementación de modelos de Data Science

Archivos

NO SE HA AUTORIZADO la consulta de los documentos asociados

Fecha

2016-09-14

Título de la revista

ISSN de la revista

Título del volumen

Editor

Jaén: Universidad de Jaén

Resumen

[ES] Éste proyecto es un trabajo de investigación en el que se ha estudiado el problema de Big Data y se han implementado diversas técnicas de Data Science. Para ello se ha utilizado el entorno de programación Apache Spark junto a la biblioteca de minería de datos MLlib. Los algoritmos implementados han sido de clasificación multiclase y de clasificación multietiqueta, con especial atención a ésta última. Por último se han realizado distintas experimentaciones en un clúster.
[EN] This project is a research work in which I've studied the Big Data problem and various Data Science techniques have been implemented. For this purpose, the framework Apache Spark has been used along with the data mining library MLlib. Some multiclass and multilabel classification problem. Lastly various experiments have been deployed in a cluster.

Descripción

Palabras clave

Ingeniería del Software

Citación