Procesado audio-visual para implementación de un mecanismo atencional
dc.audience.mediator | Universidad de Jaén. Escuela Politécnica Superior (Linares) | es_ES |
dc.contributor.advisor | Reche-López, Pedro-Jesús | |
dc.contributor.author | Martínez-Colón, Antonio | |
dc.contributor.other | Universidad de Jaén. Ingeniería de Telecomunicación | es_ES |
dc.date.accessioned | 2017-10-06T12:04:33Z | |
dc.date.available | 2017-10-06T12:04:33Z | |
dc.date.issued | 2017-10-06 | |
dc.description.abstract | [ES]El fin del proyecto desarrollado es localizar la posición, en tiempo real, de hablantes dentro de una habitación o sala, y controlar el movimiento de una vídeo cámara ip conforme a dicha información. La posición de dichos hablantes es localizada por medio de la fusión de sistemas de localización auditivos y visuales. La localización auditiva se realiza mediante la captura de señales sonoras con un array de micrófonos y el algoritmo SRP-PHAT, mientras que la parte visual utiliza la librería de visión artificial OpenCV para procesar el vídeo capturado. Este tipo de aplicación es útil en campos como la robótica para implementar mecanismos atencionales, o en sistemas de videoconferencia con múltiples hablantes en movimiento. Los objetivos inicialmente marcados con el proyecto se han alcanzado. | es_ES |
dc.description.abstract | [EN]The goal of the project is to locate the position in real time of speakers in a room and to control the movement of an ip videocamera based on the location information. The positions of the speakers are obtained through a fusion mechanism of both audio and video location systems. The audio location is based on the application of the SRP-PHAT algorithm to audio signals captured with a microphone array, while the visual one uses the OpenCV artificial vision library to process the captured video. This type of application is useful in fields such as robotics to implement attentional mechanisms or in videoconference systems with multiple speakers moving around. The initial goals of the project have been achieved. | es_ES |
dc.identifier.uri | http://hdl.handle.net/10953.1/5214 | |
dc.language.iso | spa | es_ES |
dc.rights | info:eu-repo/semantics/openAccess | es_ES |
dc.subject.classification | 2209.90 | es_ES |
dc.subject.classification | 3325.99 | es_ES |
dc.subject.classification | 3304.17 | es_ES |
dc.subject.classification | 1203.25 | es_ES |
dc.subject.other | Tratamiento digital. Imágenes | es_ES |
dc.subject.other | Tratamiento digital de audio | es_ES |
dc.subject.other | Sistemas en tiempo real | es_ES |
dc.subject.other | Diseño de sistemas de sensores | es_ES |
dc.title | Procesado audio-visual para implementación de un mecanismo atencional | es_ES |
dc.type | info:eu-repo/semantics/masterThesis | es_ES |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- TFM_ANTONIO_MARTINEZ_COLON.pdf
- Tamaño:
- 12.91 MB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 1.96 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: