Implementación de modelos de Data Science
Archivos
NO SE HA AUTORIZADO la consulta de los documentos asociados
Fecha
2016-09-14
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Jaén: Universidad de Jaén
Resumen
[ES] Éste proyecto es un trabajo de investigación en el que se ha estudiado el problema de Big Data y se han implementado diversas técnicas de Data Science. Para ello se ha utilizado el entorno de programación Apache Spark junto a la biblioteca de minería de datos MLlib. Los algoritmos implementados han sido de clasificación multiclase y de clasificación multietiqueta, con especial atención a ésta última. Por último se han realizado distintas experimentaciones en un clúster.
[EN] This project is a research work in which I've studied the Big Data problem and various Data Science techniques have been implemented. For this purpose, the framework Apache Spark has been used along with the data mining library MLlib. Some multiclass and multilabel classification problem. Lastly various experiments have been deployed in a cluster.
[EN] This project is a research work in which I've studied the Big Data problem and various Data Science techniques have been implemented. For this purpose, the framework Apache Spark has been used along with the data mining library MLlib. Some multiclass and multilabel classification problem. Lastly various experiments have been deployed in a cluster.
Descripción
Palabras clave
Ingeniería del Software