CREA: Colección de Recursos Educativos Abiertos

 

Sistema para la extracción de fuentes sonoras utilizando la transformada de Fourier bidimensional aplicado a un escenario voz/música

Fecha

2020-07-15

Título de la revista

ISSN de la revista

Título del volumen

Editor

Resumen

[ES] El oído humano, a diferencia de las máquinas, tiene la capacidad de distinguir sonidos específicos dentro de un escenario auditivo en el que intervienen muchos otros sonidos. Esto hace posible escoger un sonido en concreto, por ejemplo, un instrumento determinado en una canción, y concentrarse en él para seguirlo mentalmente a lo largo del tiempo. Mediante un procesado digital de señales podemos conseguir la separación de fuentes sonoras para extraer de manera aislada determinadas fuentes de audio a partir de la señal mezcla de audio, compuesta por voz cantada (singing voice) y acompañamiento instrumental, y así simular el procedimiento que realiza el oído humano. Concretamente, los métodos desarrollados se basan en la utilización de la transformada de Fourier bidimensional (2DFT) aplicada al espectrograma de la señal mezcla disponible en la escena auditiva. También se ha realizado una interfaz amigable para la utilización de dichos métodos por parte del usuario final. [EN] The human ear, unlike machines, has the ability to distinguish specific sounds within an auditory setting involving many other sounds. This makes it possible to choose a specific sound, for example, a certain instrument in a song, and focus on it to mentally follow it over time. Using a digital signal processing we can achieve the separation of sound sources to extract certain audio sources in isolation from the mixed audio signal, composed of singing voice and instrumental accompaniment, and thus simulate the procedure that performs the human ear. Specifically, the methods developed are based on the use of the two-dimensional Fourier transform (2DFT) applied to the spectrogram of the mixed signal available in the listening scene. A friendly interface has also been created for the use of these methods by the end user.

Descripción

Palabras clave

Sonido e Imagen

Citación