Grado en Ingeniería de Tecnologías de Telecomunicación (E.P.S. Linares)
URI permanente para esta colecciónhttps://hdl.handle.net/10953.1/330
Examinar
Examinando Grado en Ingeniería de Tecnologías de Telecomunicación (E.P.S. Linares) por Autor "Cabañas Molero, Pablo Antonio"
Mostrando 1 - 3 de 3
- Resultados por página
- Opciones de ordenación
Ítem SEPARACIÓN DE INSTRUMENTOS MUSICALES CON REDES NEURONALES PROFUNDAS PARA MÚSICA CLÁSICA(2023-12-19) López Casanova, Alberto ; Vera Candeas, Pedro ; Cabañas Molero, Pablo Antonio ; Universidad de Jaén. Ingeniería de Telecomunicación[ES] El presente Trabajo de Fin de Grado (TFG) se centra en la SSS en música clásica mediante el uso de redes neuronales profundas. Para ello se ha llevado a cabo el estudio y análisis de dos algoritmos de redes neuronales profundas, Open-Unmix y Demucs. Con este fin, se ha preparado un conjunto de datos para entrenar dos modelos, con el propósito de lograr la separación de fuentes musicales en archivos de cuartetos de cuerda: violín, viola, violonchelo y bajo. Para permitir a los usuarios realizar separaciones utilizando estos modelos, se ha desarrollado una aplicación en Python que toma como entrada un archivo musical y proporciona como salida las fuentes separadas mediante ambos modelos. Finalmente, para una evaluación objetiva de la calidad de separación obtenida con cada modelo, se ha creado un script de evaluación que compara las fuentes separadas por los modelos respecto a la separación perfecta, usando las métricas comúnmente empleadas en la bibliografía. Este enfoque permite analizar y comparar el rendimiento de OpenUnmix y Demucs en la tarea de separación de fuentes musicales.Ítem Servicio web para la conversión de canciones a formato karaoke usando inteligencia artificial(2024-07-24) Elbal Ruiz, Ramón; Vera Candeas, Pedro; Cabañas Molero, Pablo Antonio ; Universidad de Jaén. Ingeniería de Telecomunicación[es] El objetivo de este TFG es crear un servicio web para la conversión de canciones a un formato para karaoke (música con la voz eliminada y letras sincronizadas) utilizando tecnologías basadas en aprendizaje profundo. En la implementación del servicio, se utilizarán redes neuronales existentes en la bibliografía para realizar la separación voz-música (por ejemplo, Demucs), la transcripción/sincronización de las letras (por ejemplo, Whisper) y la corrección de errores de transcripción. El resultado debe ser un servicio accesible vía web que permita enviar un fichero de audio con una canción y que devuelva esa canción preparada en un formato para aplicaciones de karaoke.Ítem Vocal Boost: Software para PC para ajustar el volumen de los diálogos en tiempo real usando inteligencia artificial(2024-10-16) Almagro Martos, Bernardo; Vera Candeas, Pedro ; Cabañas Molero, Pablo Antonio ; Universidad de Jaén. Ingeniería de Telecomunicación[ES] El presente Trabajo de Fin de Grado (TFG) se centra en el desarrollo de un software para PC en Linux que permite regular el volumen de los diálogos de forma independiente al resto de sonidos, enfocado principalmente en películas o videos. Se ha utilizado la red neuronal profunda DEMUCS para separar la voz del resto de audio y se ha adaptado la misma para su funcionamiento en tiempo real. El software se ha integrado en una aplicación con interfaz gráfica para el sistema de sonido, utilizando herramientas como PulseAudio y Sounddevice. El resultado es una aplicación que permite al usuario ajustar el volumen de los diálogos de manera independiente al resto de sonidos en tiempo real.