Rivera-Rivas, AntonioPérez-Godoy, María-DoloresRodrigo-Ginés, Francisco-JavierUniversidad de Jaén. Informática2018-10-082018-10-082016-09-14https://hdl.handle.net/10953.1/8483[ES] Éste proyecto es un trabajo de investigación en el que se ha estudiado el problema de Big Data y se han implementado diversas técnicas de Data Science. Para ello se ha utilizado el entorno de programación Apache Spark junto a la biblioteca de minería de datos MLlib. Los algoritmos implementados han sido de clasificación multiclase y de clasificación multietiqueta, con especial atención a ésta última. Por último se han realizado distintas experimentaciones en un clúster.[EN] This project is a research work in which I've studied the Big Data problem and various Data Science techniques have been implemented. For this purpose, the framework Apache Spark has been used along with the data mining library MLlib. Some multiclass and multilabel classification problem. Lastly various experiments have been deployed in a cluster.spainfo:eu-repo/semantics/restrictedAccessIngeniería del Software1203.171203.041203.15InformáticaInformaticsInteligencia ArtificalArtificial IntelligenceHeurísticaHeuristicImplementación de modelos de Data Scienceinfo:eu-repo/semantics/bachelorThesis