Leveraging room acoustics for improved sound source separation in multi-microphone recording scenarios

García Martínez, Jaime

Leveraging room acoustics for improved sound source separation in multi-microphone recording scenarios

dc.audience.mediator	Universidad de Jaén. Escuela Politécnica Superior (Linares)
dc.contributor.advisor	Carabias Orti, Julio José
dc.contributor.advisor	Muñoz Montoro, Antonio Jesús
dc.contributor.author	García Martínez, Jaime
dc.contributor.other	Universidad de Jaén. Ingeniería de Telecomunicación
dc.date.accessioned	2025-05-08T12:17:15Z
dc.date.available	2025-05-08T12:17:15Z
dc.date.issued	2025-05-08
dc.description.abstract	Los modelos de separación de fuentes basados en deep learning requieren grandes conjuntos de datos con señales aisladas de referencia, normalmente inaccesibles en grabaciones de música orquestal. Este Trabajo Fin de Máster (TFM) explora un enfoque alternativo que emplea mediciones de la acústica de la sala para entrenar modelos de separación en escenarios con múltiples micrófonos, sin necesidad de señales de referencia explícitas. Se han entrenado modelos basados en deep learning del estado del arte utilizando la metodología propuesta, comparada con técnicas clásicas de procesado de señal y aprendizaje supervisado. Aunque el método propuesto presenta una ligera pérdida de rendimiento respecto al entrenamiento supervisado, supera a los métodos clásicos, demostrando la viabilidad de la metodología propuesta. Este TFM se enmarca en el proyecto REPERTORIUM (Horizonte Europa, acuerdo N.º 101095065), alineándose con su objetivo de desarrollar herramientas de grabación de audio inmersivo basadas en IA.	es
dc.description.abstract	Traditional deep learning-based sound source separation models rely on large-scale datasets containing ground-truth isolated sources, which are often unavailable in orchestral music recordings due to the nature of ensemble performances. This Master's thesis explores an alternative approach that leverages room acoustics measurements to train separation models in multi-microphone recording scenarios without requiring explicit reference signals. State-of-the-art deep learning models were trained using the proposed methodology and compared against classical signal processing techniques and supervised learning approaches. While the method introduces a small performance drop compared to supervised training, it still outperforms classical methods and demonstrates the feasibility of training separation models without ground-truth reference signals. This Master's thesis is tied to the REPERTORIUM project, funded by the European Union's Horizon Research and Innovation Programme (grant agreement N. 101095065), aligning with REPERTORIUM's broader goal of developing cost-effective immersive audio recording tools that leverage AI-based signal processing.	en
dc.identifier.uri	https://hdl.handle.net/10953.1/26256
dc.language.iso	eng
dc.rights	info:eu-repo/semantics/openAccess
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Spain	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject.classification	32501
dc.subject.classification	330706
dc.subject.classification	120304
dc.subject.classification	120312
dc.subject.other	Tecnología de las telecomunicaciones	es
dc.subject.other	Telecommunications technology	en
dc.subject.other	Tecnología electrónica	es
dc.subject.other	Electronic Technology	en
dc.subject.other	Inteligencia artificial	es
dc.subject.other	Artificial Intelligence	en
dc.subject.other	Bancos de datos	es
dc.subject.other	Data banks	en
dc.subject.other	Radiodifusión	es
dc.subject.other	Sonido	es
dc.subject.other	Televisión	es
dc.subject.other	Broadcasting	en
dc.subject.other	Sound	en
dc.subject.other	Television	en
dc.subject.other	Diseño de filtros	es
dc.subject.other	Filter design	en
dc.title	Leveraging room acoustics for improved sound source separation in multi-microphone recording scenarios	en
dc.type	info:eu-repo/semantics/masterThesis

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: MT Report Garcia-Martinez Jaime - Jaime Garcia Martinez.pdf
Tamaño:: 6.05 MB
Formato:: Adobe Portable Document Format

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 3.11 KB
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

Máster Universitario en Ingeniería de Telecomunicación

CREA: Colección de Recursos Educativos Abiertos

Leveraging room acoustics for improved sound source separation in multi-microphone recording scenarios

Archivos

Bloque original

Bloque de licencias

Colecciones