Ingeniero de Telecomunicación (2000) y Doctor por la Universidad de Zaragoza (2005, con premio extraordinario de doctorado y premio Cátedra Telefónica), mi actividad investigadora se centra en las tecnologías del habla (reconocimiento automático del habla y del hablante, realce de la señal de voz,…) con una trayectoria balanceada entre publicaciones científicas y transferencia de resultados de la investigación con alto contenido en ambos ámbitos. Mis publicaciones en revistas recogidas en SCI-JCR se encuentran principalmente en el primer cuartil de sus respectivas categorías. Tres de ellas han recibido el premio al mejor artículo de revista JCR en sus respectivos años otorgado por la Red Temática en tecnologías del habla. Como es habitual en mi ámbito, publico regularmente en las principales conferencias internacionales ICASSP e Interspeech, indexadas en categorías altas de sus respectivas bases de datos, siendo estas vehículo de difusión comparable a las revistas JCR. Asimismo, publico en otras conferencias de prestigio tanto internacionales como nacionales. En cuanto a la calidad y número de proyectos y contratos de investigación, he participado en más de 50, tanto de investigador colaborador como de investigador principal, de los que aproximadamente la mitad están incluidos en programas competitivos, tanto europeos como nacionales (FP6, FP7, FEDER, CICYT, CENIT, PROFIT, AVANZA,…). He formado parte del comité organizador en varias conferencias y soy director de 4 tesis doctorales, dos de ellas en fases avanzadas de realización. Soy revisor de varias revistas (JCR) y de las principales conferencias del sector. Coordino desde 2010 la Red Temática en Tecnologías del Habla, que aglutina a los principales grupos de investigación españoles del ámbito. En el año 2006, realicé una estancia postdoctoral de investigación en la University of Texas at Dallas (USA) y también he participado en experiencias de movilidad como un curso por invitación en la Université de Technologie de Compiènge (Francia) o varios programas intensivos Erasmus en Lahti (Finlandia), Zaragoza y Roma (Italia). En cuanto a los contratos de transferencia, estos han dado lugar a varias patentes internacionales e informes técnicos relevantes que han supuesto mejoras tecnológicas sustanciales para las compañías involucradas. Poseo cuatro sexenios de investigación reconocidos por la CNEAI (tres de investigación, todos los posibles, y uno de transferencia). He participado en la organización de 6 conferencias, 2 de ellos de ámbito internacional: IV Jornadas en Tecnologías del Habla, V Jornadas de Reconocimiento Biométrico de Personas, Iberspeech 2012, 2014 y 2016 y Odyssey 2016.
Artículos
- Pastor, Miguel A.; Ribas, Dayana; Ortega, Alfonso; Miguel, Antonio; Lleida, Eduardo. Cross-corpus training strategy for speech emotion recognition using self-supervised representations. APPLIED SCIENCES (SWITZERLAND). 2023. DOI: 10.3390/app13169062
- Ribas, Dayana; Pastor, Miguel A.; Miguel, Antonio; Martinez, David; Ortega, Alfonso; Lleida, Eduardo. Automatic voice disorder detection using self-supervised representations. IEEE ACCESS. 2023. DOI: 10.1109/ACCESS.2023.3243986
- Mingote, Victoria; Miguel, Antonio; Ortega, Alfonso; Lleida, Eduardo. Class token and knowledge distillation for multi-head self-attention speaker verification systems. DIGITAL SIGNAL PROCESSING. 2023. DOI: 10.1016/j.dsp.2022.103859
- Barrio, Roberto; Lozano, Álvaro; Mayora-Cebollero, Ana; Mayora-Cebollero, Carmen; Miguel, Antonio; Ortega, Alfonso; Serrano, Sergio; Vigara, Rubén. Deep learning for chaos detection. CHAOS. 2023. DOI: 10.1063/5.0143876
- Lleida, Eduardo; Rodriguez-Fuentes, Luis Javier; Tejedor, Javier; Ortega, Alfonso; Miguel, Antonio; Bazán, Virginia; Pérez, Carmen; de Prada, Alberto; Penagarikano, Mikel; Varona, Amparo; Bordel, Germán; Torre-Toledano, Doroteo; Álvarez, Aitor; Arzelus, Haritz. An overview of the IberspeechRTVE 2022 challenges on speech technologies. APPLIED SCIENCES (SWITZERLAND). 2023. DOI: 10.3390/app13158577
- Gimeno, P.; Ribas, D.; Ortega, A.; Miguel, A.; Lleida, E. Unsupervised adaptation of deep speech activity detection models to unseen domains. APPLIED SCIENCES (SWITZERLAND). 2022. DOI: 10.3390/app12041832
- Mingote, V.; Miguel, A.; Ribas, D.; Ortega, A.; Lleida, E. aDCF loss function for deep metric learning in end-to-end text-dependent speaker verification systems. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING. 2022. DOI: 10.1109/TASLP.2022.3145307
- Mingote, Victoria; Viñals, Ignacio; Gimeno, Pablo; Miguel, Antonio; Ortega, Alfonso; Lleida, Eduardo. Multimodal Diarization Systems by Training Enrollment Models as Identity Representations. APPLIED SCIENCES (SWITZERLAND). 2022. DOI: 10.3390/app12031141
- Ribas, Dayana; Miguel, Antonio; Ortega, Alfonso; Lleida, Eduardo. Wiener Filter and Deep Neural Networks: A Well-Balanced Pair for Speech Enhancement. APPLIED SCIENCES (SWITZERLAND). 2022. DOI: 10.3390/app12189000
- Almudévar, Antonio; Sevillano, Pascual; Vicente, Luis; Preciado-Garbayo, Javier; Ortega, Alfonso. Unsupervised anomaly detection applied to F-OTDR. SENSORS. 2022. DOI: 10.3390/s22176515
- Prieto, S.; Ortega, A.; López-Espejo, I.; Lleida, E. Shouted and whispered speech compensation for speaker verification systems. DIGITAL SIGNAL PROCESSING. 2022. DOI: 10.1016/j.dsp.2022.103536
- Martínez, C.; Kontaxis, S.; Posadas-de Miguel, M.; García, E.; Siddi, S.; Aguiló, J.; Haro, J.M.; de la Cámara, C.; Bailón, R.; Ortega, A. Analysis of Prosodic Features During Cognitive Load in Patients with Depression. LECTURE NOTES IN ELECTRICAL ENGINEERING. 2021. DOI: 10.1007/978-981-15-8395-7_14
- Gimeno, P; Mingote, V; Ortega, A; Miguel, A; Lleida, E. Generalizing AUC Optimization to Multiclass Classification for Audio Segmentation With Limited Training Data. IEEE SIGNAL PROCESSING LETTERS. 2021. DOI: 10.1109/LSP.2021.3084501
- Mingote, Victoria; Viñals, Ignacio; Gimeno, Pablo; Miguel, Antonio; Ortega, Alfonso; Lleida, Eduardo. ViVoLAB Multimodal Diarization System for RTVE 2020 Challenge. IBERSPEECH 2021. 2021. DOI: 10.21437/IberSPEECH.2021-16
- Mingote, Victoria; Miguel, Antonio; Ortega, Alfonso; Lleida, Eduardo. Memory Layers with Multi-Head Attention Mechanisms for Text-Dependent Speaker Verification. PROCEEDINGS - ICASSP, IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING. 2021. DOI: 10.1109/ICASSP39728.2021.9414859
- Llombart, J.; Ribas, D.; Miguel, A.; Vicente, L.; Ortega, A.; Lleida, E. Progressive loss functions for speech enhancement with deep neural networks. EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING. 2021. DOI: 10.1186/s13636-020-00191-3
- Viñals, Ignacio; Ortega, Alfonso; Miguel, Antonio; Lleida, Eduardo. The Domain Mismatch Problem in the Broadcast Speaker Attribution Task. APPLIED SCIENCES (SWITZERLAND). 2021. DOI: 10.3390/app11188521
- Mingote, Victoria; Miguel, Antonio; Ortega, Alfonso; Lleida, Eduardo. Log-Likelihood-Ratio Cost Function as Objective Loss for Speaker Verification Systems. INTERSPEECH (USB). 2021. DOI: 10.21437/Interspeech.2021-1085
- Gimeno, Pablo; Viñals, Ignacio; Ortega, Alfonso; Miguel, Antonio; Lleida, Eduardo. Multiclass audio segmentation based on recurrent neural networks for broadcast domain data. EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING. 2020. DOI: 10.1186/s13636-020-00172-6
- Mingote, Victoria; Miguel, Antonio; Ribas, Dayana; Ortega, Alfonso; Lleida, Eduardo. Knowledge Distillation and Random Erasing Data Augmentation for Text-Dependent Speaker Verification. PROCEEDINGS - ICASSP, IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING. 2020. DOI: 10.1109/ICASSP40776.2020.9053153
- Prieto, S.; Ortega, A.; López-Espejo, I.; Lleida, E. Shouted speech compensation for speaker verification robust to vocal effort conditions. INTERSPEECH (USB). 2020. DOI: 10.21437/Interspeech.2020-1402
- Mingote, V.; Miguel, A.; Ortega, A.; Lleida, E. Optimization of the area under the ROC curve using neural network supervectors for text-dependent speaker verification. COMPUTER SPEECH AND LANGUAGE. 2020. DOI: 10.1016/j.csl.2020.101078
- Mingote, V.; Miguel, A.; Ortega, A.; Lleida, E. Training speaker enrollment models by network optimization. INTERSPEECH (USB). 2020. DOI: 10.21437/Interspeech.2020-2325
- Gimeno, P.; Mingote, V.; Ortega, A.; Miguel, A.; Lleida, E. Partial AUC optimisation using recurrent neural networks for music detection with limited training data. INTERSPEECH (USB). 2020. DOI: 10.21437/Interspeech.2020-1108
- Mingote, V.; Castan, D.; Mclaren, M.; Nandwana, M.K.; Ortega, A.; Lleida, E.; Miguel, A. Language recognition using triplet neural networks. INTERSPEECH (USB). 2019. DOI: 10.21437/Interspeech.2019-2437
- Mingote, V.; Miguel, A.; Ribas, D.; Ortega, A.; Lleida, E. Optimization of false acceptance/rejection rates and decision threshold for end-to-end text-dependent speaker verification systems. INTERSPEECH (USB). 2019. DOI: 10.21437/Interspeech.2019-2550
- Viñals, I.; Gimeno, P.; Ortega, A.; Miguel, A.; Lleida, E. Vivolab speaker diarization system for the Dihard 2019 challenge. INTERSPEECH (USB). 2019. DOI: 10.21437/Interspeech.2019-2462
- Llombart, J.; Ribas, D.; Miguel, A.; Vicente, L.; Ortega, A.; Lleida, E. Progressive speech enhancement with residual connections. INTERSPEECH (USB). 2019. DOI: 10.21437/Interspeech.2019-1748
- Llombart, J.; Ribas, D.; Miguel, A.; Vicente, L.; Ortega, A.; Lleida, E. Speech enhancement with wide residual networks in reverberant environments. INTERSPEECH (USB). 2019. DOI: 10.21437/Interspeech.2019-1745
- Lleida, Eduardo; Ortega, Alfonso; Miguel, Antonio; Bazán-Gil, Virginia; Perez, Carmen; Gómez, Manuel; de Prada, Alberto. Albayzin 2018 Evaluation: The IberSpeech-RTVE Challenge on Speech Technologies for Spanish Broadcast Media. APPLIED SCIENCES (SWITZERLAND). 2019. DOI: 10.3390/app9245412
- Viñals, Ignacio; Ortega, Alfonso; Villalba, Jesús; Miguel, Antonio; Lleida, Eduardo. Unsupervised adaptation of PLDA models for broadcast diarization. EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING. 2019. DOI: 10.1186/s13636-019-0167-7
- Mingote, Victoria; Miguel, Antonio; Ortega, Alfonso; Lleida, Eduardo. Supervector extraction for encoding speaker and phrase information with neural networks for text-dependent speaker verification. APPLIED SCIENCES (SWITZERLAND). 2019. DOI: 10.3390/app9163295
- Viñals, Ignacio; Ortega, Alfonso; Miguel, Antonio; Lleida, Eduardo. An analysis of the short utterance problem for speaker characterization. APPLIED SCIENCES (SWITZERLAND). 2019. DOI: 10.3390/app9183697
- Viñals, I.; Ribas, D.; Mingote, V.; Llombart, J.; Gimeno, P.; Miguel, A.; Ortega, A.; Lleida, E. Phonetically-aware embeddings, wide residual networks with time-delay neural networks and self attention models for the 2018 NIST speaker recognition evaluation. INTERSPEECH (USB). 2019. DOI: 10.21437/Interspeech.2019-2417
- Ortega, A.; Lleida, E.; San-Segundo, R.; Ferreiros, J.; Hurtado, L.; Sanchis, E.; Torres, M.I.; Justo, R. AMIC: Affective multimedia analytics with inclusive and natural communication. PROCESAMIENTO DEL LENGUAJE NATURAL. 2018. DOI: 10.26342/2018-61-19
- Cabello, L.; Lleida, E.; Simon, J.; Miguel, A.; Ortega, A. Text-to-Pictogram Summarization for Augmentative and Alternative Communication. PROCESAMIENTO DEL LENGUAJE NATURAL. 2018. DOI: 10.26342/2018-61-1
- Viñals, I.; Gimeno, P.; Ortega, A.; Miguel, A.; Lleida, E. Estimation of the number of speakers with variational Bayesian PLDA in the dihard diarization challenge. INTERSPEECH (USB). 2018. DOI: 10.21437/Interspeech.2018-1841
- Viñals, I.; Ortega, A.; Villalba, J.; Miguel, A.; Lleida, E. Domain Adaptation of PLDA models in Broadcast Diarization by means of Unsupervised Speaker Clustering. INTERSPEECH (USB). 2017. DOI: 10.21437/Interspeech.2017-84
- Miguel, A.; Llombart, J.; Ortega, A.; Lleida, E. Tied hidden factors in neural networks for end-To-end speaker recognition. INTERSPEECH (USB). 2017. DOI: 10.21437/Interspeech.2017-1314
- Villalba, J.; Ortega, A.; Miguel, A.; Lleida, E. Analysis of speech quality measures for the task of estimating the reliability of speaker verification decisions. SPEECH COMMUNICATION. 2016. DOI: 10.1016/j.specom.2016.01.005
- Ferreiros, J.; Pardo, J.M.; Hurtado, L.F; Segarra, E.; Ortega, A.; Lleida, E.; Torres, M.I.; Justo, R. ASLP-MULAN: Audio speech and language processing for multimedia analytics. PROCESAMIENTO DEL LENGUAJE NATURAL. 2016
- Villalba López, Jesús; Ortega Giménez, Alfonso; Miguel Artiaga, Antonio; Lleida Solano, Eduardo. Bayesian Networks to Model the Variability of Speaker Veri¿cation Scores in Adverse Environments. IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING. 2016. DOI: 10.1109/TASLP.2016.2607343
- Viñals, I.; Villalba, J.; Ortega, A.; Miguel, A.; Lleida, E. Bottleneck Based Front-End for Diarization Systems. LECTURE NOTES IN COMPUTER SCIENCE. 2016. DOI: 10.1007/978-3-319-49169-1_27
- Castán, D.; Tavarez, D.; Lopez-Otero, P.; Franco-Pedroso, J.; Delgado, H.; Navas, E.; Docio-Fernández, L.; Ramos, D.; Serrano, J.; Ortega, A.; Lleida, E. Albayzín-2014 evaluation: audio segmentation and classification in broadcast news domains. EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING. 2015. DOI: 10.1186/s13636-015-0076-3
- Martínez, D.;Lleida, E.;Green, P.;Christensen, H.;Ortega, A.;Miguel, A. Intelligibility assessment and speech recognizer word accuracy rate prediction for dysarthric speakers in a factor analysis subspace. ACM TRANSACTIONS ON ACCESSIBLE COMPUTING. 2015. DOI: 10.1145/2746405
- Olcoz, Julia; Ortega, Alfonso; Miguel, Antonio; Lleida, Eduardo. Confidence Measures in Automatic Speech Recognition Systems for Error Detection in Restricted Domains. LECTURE NOTES IN COMPUTER SCIENCE. 2014. DOI: 10.1007/978-3-319-13623-3_18
- Castan, Diego; Ortega Giménez, Alfonso; Miguel Artiaga, Antonio; Lleidasolano, Eduardo. A Preliminary Study of Acoustic Events Classification with Factor Analysis in Meeting Rooms. LECTURE NOTES IN COMPUTER SCIENCE. 2014. DOI: 10.1007/978-3-319-13623-3_22
- Garcia, José Enrique; Ortega Giménez, Alfonso; Miguel Artiaga, Antonio; Lleida Solano, Eduardo. Low bit rate compression methods of feature vectors for distributed speech recognition. SPEECH COMMUNICATION. 2014. DOI: 10.1016/j.specom.2013.11.007
- Castán, D.; Ortega, A.; Miguel, A.; Lleida, E. Audio segmentation-by-classification approach based on factor analysis in broadcast news domain. EURASIP JOURNAL ON AUDIO SPEECH AND MUSIC PROCESSING. 2014. DOI: 10.1186/s13636-014-0034-5
- Sanchis,E.; Ortega,A.; Torres,M. I.; Ferreiros,J. TIMPANO: Technology for complex human-machine conversational interaction with dynamic learning. PROCESAMIENTO DEL LENGUAJE NATURAL. 2013
- Martínez González, David; Ribas, Dayana; Lleida, Eduardo; Ortega, Alfonso; Miguel, Antonio Suprasegmental information modelling for autism disorder spectrum and specific language impairment classification. PROCEEDINGS OF THE ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, INTERSPEECH. 2013
- Castan, D.; Ortega, A.; Villalba, J.; Miguel, A.; Lleida, E. Segmentation-by-classification system based on factor analysis. PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. 2013. DOI: 10.1109/ICASSP.2013.6637755
- Vaquero,C.;Ortega,A.;Miguel,A.;Lleida,E. Quality assessment for speaker diarization and its application in speaker characterization. IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING. 2013. DOI: 10.1109/TASL.2012.2236317
- Martinez, D.; Lleida, E.; Ortega, A.; Miguel, A. Prosodic features and formant modeling for an ivector-based language recognition system. PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. 2013. DOI: 10.1109/ICASSP.2013.6638988
- Ribas González,D.;García Laínez,J. E.;Miguel,A.;Ortega Gimenez,A.;Lleida,E.;Lara,Calvo de. Evaluation of a new beam-search formant tracking algorithm in noisy environments. COMMUNICATIONS IN COMPUTER AND INFORMATION SCIENCE. 2012. DOI: 10.1007/978-3-642-35292-8_5
- Toledano,D. T.;Gimenez,A. O.;Teixeira,A. Communications in Computer and Information Science: Preface. COMMUNICATIONS IN COMPUTER AND INFORMATION SCIENCE. 2012
- Castá¡n,D.;Ortega Giménez,A.;Lleida,E. Factor analysis segmentation and classification in broadcast news domain. COMMUNICATIONS IN COMPUTER AND INFORMATION SCIENCE. 2012. DOI: 10.1007/978-3-642-35292-8_9
- Villalba,J.;Lleida,E.;Ortega,A.;Miguel,A. Reliability estimation of the speaker verification decisions using Bayesian networks to combine information from multiple speech quality measures. COMMUNICATIONS IN COMPUTER AND INFORMATION SCIENCE. 2012. DOI: 10.1007/978-3-642-35292-8_1
- Martínez,D.;Villalba,J.;Miguel,A.;Ortega,A.;Lleida,E. I3A Language Recognition system for Albayzin 2010 LRE. PROCEEDINGS OF THE ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, INTERSPEECH. 2011
- Castán,D.;Vaquero,C.;Ortega,A.;Martínez,D.;Villalba,J.;Lleida,E. Hierarchical audio segmentation with HMM and Factor Analysis in broadcast news domain. PROCEEDINGS OF THE ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, INTERSPEECH. 2011
- Miguel, A.;Ortega, A.;Buera, L. ;Lleida, E. Bayesian networks for discrete observation distributions in speech recognition. IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING. 2011
- Vaquero,C.;Ortega,A.;Lleida,E. Partitioning of two-speaker conversation datasets. PROCEEDINGS OF THE ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION, INTERSPEECH. 2011
- Buera, Luis;Miguel, Antonio;Saz, Oscar;Ortega, Alfonso ;Lleida, Eduardo. Unsupervised Data-Driven Feature Vector Normalization With Acoustic Model Adaptation for Robust Speech Recognition. IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING. 2010. DOI: 10.1109/TASL.2009.2026441
- Miguel, A.;Lleida,E.;Rose,R.;Buera,L.;Saz,O.;Ortega,A. Capturing Local Variability for Speaker Normalization in Speech Recognition. IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING. 2008
- Buera, L.;Lleida,E.;Miguel,A.;Ortega,A.;Saz,O. Cepstral Vector Normalization Based on Stereo Data for Robust Speech Recognition. IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING. 2007
- Garcia, Paloma;Ortega, Alfonso;Mingo, Jesus De;Valdovinos, Antonio. Nonlinear distortion cancellation using LINC transmitters in OFDM systems. IEEE TRANSACTIONS ON BROADCASTING. 2005
- Ortega, Alfonso;Lleida, Eduardo;Masgrau, Enrique. Speech reinforcement system for car cabin communications. IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING. 2005
- Garcia, Paloma; Mingo, Jesús De; Valdovinos, Antonio; Ortega, Alfonso. An Adaptive Digital Method of Imbalances Cancellation in Linc Transmitters. IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY. 2005. DOI: 10.1109/TVT.2005.844641
Comunicaciones
- Vaquero,C.;Ortega,A.;Lleida,E. Intra-session variability compensation and a hypothesis generation and selection strategy for speaker segmentation. PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING. 2011. DOI: 10.1109/ICASSP.2011.5947362
Capítulos
- Bottleneck Based Front-End for Diarization Systems. Viñals Bailo, Ignacio; Villalba Lopez, Jesús; Ortega Giménez, Alfonso; Miguel Artiaga, Antonio; Lleida Solano, Eduardo. ADVANCES IN SPEECH AND LANGUAGE TECHNOLOGIES FOR IBERIAN LANGUAGES: IBERSPEECH 2016. 2016
- A preliminary study of Acoustic Events Classification with Factor Analysis in Meeting Rooms. Ortega Giménez, Alfonso; Castán, Diego; Miguel, Antonio; Lleida, Eduardo. ADVANCES IN SPEECH AND LANGUAGE TECHNOLOGIES FOR IBERIAN LANGUAGES. 2014
- Confidence Measures in Automatic Speech Recognition for Error Detection in Restricted Domains. Ortega Giménez, Alfonso; Olcoz, Julia; Miguel, Antonio; Lleida, Eduardo. ADVANCES IN SPEECH AND LANGUAGE TECHNOLOGIES FOR IBERIAN LANGUAGES. IBERSPEECH 2014. 2014
- Unsupervised Accent Modeling for Language Identification. Martínez González, David; Villalba, Jesús; Lleida, Eduardo; Ortega, Alfonso. ADVANCES IN SPEECH AND LANGUAGE TECHNOLOGIES FOR IBERIAN LANGUAGES. 2014
- Evaluation of a New Beam-Search Formant Tracking Algorithm in Noisy Environments. Ribas Gonzalez, Dayana; García Laínez, Enrique; Ortega Giménez, Alfonso; Miguel Artiaga, Antonio; Lleida Solano, Eduardo; Calvo de Lara, José Ramón. ADVANCES IN SPEECH AND LANGUAGE TECHNOLOGIES FOR IBERIAN LANGUAGES. 2012
- Factor Analysis Segmentation and Classification in Broadcast News Domain. Castán Lavilla, Diego; Ortega Giménez, Alfonso; Lleida Solano, Eduardo. ADVANCES IN SPEECH AND LANGUAGE TECHNOLOGIES FOR IBERIAN LANGUAGES. 2012
- Reliability Estimation of the Speaker Verification Decisions Using Bayesian Networks to Combine Information from Multiple Speech Quality Measures. Villalba Lopez, Jesús; Lleida Solano, Eduardo; Ortega Giménez, Alfonso; Miguel Artiaga, Antonio. ADVANCES IN SPEECH AND LANGUAGE TECHNOLOGIES FOR IBERIAN LANGUAGES. 2012
- Score Level versus Audio Level Fusion for Voice Pathology Detection on the Saarbrücken Voice Database. Martínez González, David; Lleida, Eduardo; Ortega, Alfonso; Miguel, Antonio. ADVANCES IN SPEECH AND LANGUAGE TECHNOLOGIES FOR IBERIAN LANGUAGES. 2012
- Voice Pathology Detection on the Saarbrücken Voice Database with Calibration and Fusion of Scores Using MultiFocal Toolkit. Martínez González, David; Lleida, Eduardo; Ortega, Alfonso; Miguel, Antonio; Villalba, Jesús. ADVANCES IN SPEECH AND LANGUAGE TECHNOLOGIES FOR IBERIAN LANGUAGES. 2012
- ViVoLab UZ Language Recognition System for Albayzin 2010 LRE. Martínez González, David; Villalba, Jesús; Miguel, Antonio; Ortega, Alfonso; Lleida, Eduardo. PROCEEDINGS OF VI JORNADAS DE TECNOLOGÍA DEL HABLA AND II IBERIAN SLTECH WORKSHOP. 2010
- Acoustic Echo Reduction in a Two-Channel Speech Reinforcement System for Vehicles. Ortega Giménez, Alfonso; Lleida Solano, Eduardo; Buera Rodriguez, Luis; Miguel Artiaga, Miguel ADVANCES FOR IN-VEHICLE AND MOBILE SYSTEMS. 2007
- Alfonso Ortega ... [et al.]. Acoustic Echo Reduction in a Two-Channel Speech Reinforcement System for Vehicles. ADVANCES FOR IN-VEHICLE AND MOBILE SYSTEMS: CHALLENGES FOR INTERNATIONAL STANDARDS. 2007
- Cross-Probability Model Based on Gmm for Feature Vector Normalization. Buera Rodriguez, Luis; Miguel Artiaga, Antonio; Saz Torralba, Oscar; Lleida Solano, Eduardo; Ortega Giménez, Alfonso. IN-VEHICLE CORPUS AND SIGNAL PROCESSING FOR DRIVER BEHAVIOR.
Proyectos
- DESARROLLO DE UN PROTOTIPO PRECOMPETITIVO PARA EL ANALISIS AFECTIVO DE INFORMACION MULTIMEDIA - UZ. PDC2021-120846-C41. 01/12/21 - 31/05/24
- DIH-World open call - Innovation Action project co-funded by the Horizon 2020 Framework Programme of the European Union. 29/09/21 - 15/04/22
- ESPERANTO / Exchanges for SPEech ReseArch aNd TechnOlogies (G.A. No. 101007666). 01/01/21 - 31/12/25
- T36_20R: Vivolab. 01/01/20 - 31/12/22
- Tecnologías del habla para el indexado y búsqueda de contenido audiovisual (ETQ VIDEO INSIGHT). 01/05/18 - 31/12/19
- TIN2017-85854-C4-1-R: ANÁLISIS AFECTIVO DE INFORMACIÓN MULTIMEDIA CON COMUNICACIÓN INCLUSIVA NATURAL. 01/01/18 - 30/09/21
- GRUPO DE REFERENCIA ViVoLaB. 01/01/17 - 31/12/19
- GRUPO CONSOLIDADO T99 VIVOLAB. 01/01/16 - 31/12/16
- TEC2015-70061-REDT: RED TEMÁTICA EN TECNOLOGÍAS DEL HABLA 2015. 01/12/15 - 30/11/17
- GRUPO CONSOLIDADO T99 VIVOLAB. 01/01/15 - 31/12/15
- TIN2014-54288-C4-2-R: PROCESADO DE AUDIO, HABLA Y LENGUAJE PARA ANÁLISIS DE INFORMACIÓN MULTIMEDIA-UZ. 01/01/15 - 30/09/18
- GRUPO EMERGENTE T99 ViVoLab. 01/01/14 - 31/12/14
- IRIS / Towards Natural Interaction and Communication (G.A.no. 610986). 01/01/14 - 31/12/17
- GRUPO CONSOLIDADO T30 GRUPO DE TECNOLOGÍAS DE LAS COMUNICACIONES (GTC). 01/01/13 - 31/12/13
- Tecnologías Audio-visuales Multimodales Avanzadas (TAMA). 01/01/13 - 01/01/15
- TEC2011-13308-E.RED TEMATICA EN TECNOLOGIAS DEL HABLA 2011. 01/01/12 - 31/12/13
- TIN2011-28169-C05-02.TECNOLOGIA PARA LA INTERACCION CONVERSACIONAL COMPLEJA PERSONA-MAQUINA CON APRENDIZAJE DINAMICO-UZ. 01/01/12 - 30/06/15
- GRUPO CONSOLIDADO T30 GRUPO DE TECNOLOGIAS DE LAS COMUNICACIONES. 01/01/11 - 31/12/12
- TIN2008-06856-C05-04/TIN. PERSONALIZACIÓN Y ADAPTACIÓN AUTÓNOMA A LOS CONDICIONANTES DEL CONTEXTO EN LOS SISTEMAS DE DIÁLOGO HABLADO MULTIDOMINIO. 01/01/09 - 31/12/11
- GRUPO CONSOLIDADO T30 GRUPO DE TECNOLOGÍAS DE LAS COMUNICACIONES. 01/01/08 - 31/12/10
- NUEVAS TÉCNICAS Y TECNOLOGÍAS PARA EL PROCESADO Y LA TRANSMISIÓN DE INFORMACIÓN (WALQA). 01/01/08 - 31/12/10
- PLATAFORMA PARA EL ANÁLISIS SEMANTICO Y MEDICIÓN DEL IMPACTO DE CONTENIDOS Y CLIMA SOCIAL EN UN ENTORNO MULTICANAL (INTERNET, RADIO, TDT Y MOVILIDAD). 01/01/08 - 31/12/09
- PROFIT: SISTEMA INTEGRAL DE COMUNICACIONES PARA VEHICULOS. 01/01/07 - 31/12/07
- PETRI PET20050833 ORAL INTERFACE FOR DOMOTIC CONTROL. 19/12/06 - 18/12/08
- INTEGRACIÓN DE SISTEMAS AVANZADOS DE CAPTURA DE DATOS EN SISTEMAS DE GESTIÓN DE TRANSPORTE Y LOGÍSTICA. 01/07/06 - 31/12/07
- EDIFICIO SEGURO: ESTUDIO DE VIABILIDAD. 01/01/06 - 31/12/06
- PROFIT FIT 360000-2005-17 TECNOLOGIAS BIOMETRICAS PARA APLICACIONES DE CONTROL, SEGURIDAS, ACCESO E INFORMACION PERSONALIZADA (TECBIOEXP). 01/01/06 - 31/12/06
- TIN2005-08660-C04-01. TECNOLOGIAS DE ADAPTACION AL CONTEXTO ACUSTICO EN SISTEMAS DE DIALOGO MULTIDOMINIO. 31/12/05 - 30/12/08
- GRUPO CONSOLIDADO T30 TECNOLOGIAS DE LAS COMUNICACIONES GTC. 01/01/05 - 31/12/07
- PROFIT CIT-370100-2005-4 SISTEMA INTEGRAL DE COMUNICACIONES PARA VEHICULOS. 01/01/05 - 31/12/05
- PM055/2004. DESARROLLO DE SISTEMAS DE DETECCIÓN Y ALGORITMOS PARA IDENTIFICACIÓN DE EMOCIONES HUMANAS. 01/12/04 - 31/12/06
- BIOSECURE. 01/06/04 - 30/09/07
- TEL2002-05. ACCESO A INFORMACION REMOTA DESDE ASISTENTES DIGITALES PERSONALES (PDA) PARA SISTEMAS DE NAVEGACION PORTATILES. 01/01/03 - 31/12/03
- TIC2002-04103-C03-01.SISTEMA DE DIALOGO PARA EL ACCESO A LA INFORMACION MEDIANTE HABLA ESPONTANEA EN DIFERENTES ENTORNOS. 01/12/02 - 30/11/05
- TIC2001-2812-C05-04. SISTEMA DE DIALOGO DISTRIBUIDO PARA EL ACCESO A LA INFORMACION MEDIANTE HABLA NATURAL. 28/12/01 - 27/12/02
Dirección de tesis
- Advances in Binary and Multiclass Audio Segmentation with Deep Learning Techniques. Universidad de Zaragoza. Sobresaliente cum laude. 23/05/23
- Advances in Subspace-based Solutions for Diarization in the Broadcast Domain. Universidad de Zaragoza. Sobresaliente cum laude. 02/10/20
- Advances on audio segmentation and audio content description for multimedia documents. Universidad de Zaragoza. Sobresaliente cum laude. 17/12/14
- Robust Diarization for Speaker Characterization. Universidad de Zaragoza. Sobresaliente cum laude. 21/12/11
Dirección de proyectos fin de carrera
- Estudio comparativo de gaussian mixture models/hidden markov models y factor analysis en la segmentación por clasificación de señales de audio. Universidad de Zaragoza. Sobresaliente. 30/09/15
- Estudio y desarrollo de una solución basada en micrófonos integrados en cabina para comunicación oral en material ferroviario. Universidad de Zaragoza. Sobresaliente. 16/03/15
- Conversión automática de emociones para la transformación del habla independiente del locutor. Universidad de Zaragoza. Sobresaliente. 19/05/14
- Estudio de métodos de diarización en un entorno de Broadcast. Universidad de Zaragoza. Sobresaliente. 27/03/14
- Modelling and simulation of electronic warfare for Jamming of safety-critical wireless data transmission (Modelado y simulación de un sistema de guerra electrónica (Jamming) en una transmisión de datos inalámbrica crítica en seguridad. Universidad de Zaragoza. Notable. 13/07/12
- Recuperación automática de información en documentos de audio mediante una arquitectura distribuida. Universidad de Zaragoza. Notable. 09/03/12
- E-UTRA LTE UPLINK PHYSICAL CHANNEL SIMULATION. Universidad de Zaragoza. Notable. 10/07/09
- DISEÑO DE UNA RED ZIGBEE DE SENSORES PARA UN VEHÍCULO. Universidad de Zaragoza. Notable. 05/12/08
- SISTEMA DE COMUNICACION DE VOZ BASADO EN TECNOLOGIA BLUETOOTH. Universidad de Zaragoza. Sobresaliente. 19/09/05
- DESARROLLO DE UN INTERFAZ DE USUARIO ORAL-VISUAL PARA EL CONTROL DE UN MÓDEM GSM. Universidad de Zaragoza. Notable. 09/12/04
- ARQUITECTURA DISTRIBUIDA Y GESTIÓN DE COMUNICACIONES INALÁMBRICAS PARA UN SISTEMA DE NAVEGACIÓN PORTÁTIL CON INTERFAZ MULTIMODAL PARA(...). Universidad de Zaragoza. Sobresaliente. 16/09/04
- DESARROLLO DEL SUBSISTEMA DE CONTROL PARA UN SISTEMA DE COMUNICACIONES INTEGRALES EN UN VEHICULO. Universidad de Zaragoza. Notable. 23/02/04
- MEJORA DE LA COMUNICACIÓN ORAL ENTRE LOS PASAJEROS DE UN VEHÍCULO MEDIANTE PROCESADO DIGITAL DE LA SEÑAL EN TIEMPO REAL. Universidad de Zaragoza. Sobresaliente. 15/05/03
- CONVERSOR TEXTO-VOZ PARA PLATAFORMA POCKET-PC SOBRE SISTEMA OPERATIVO WINDOWS CE. Universidad de Zaragoza. Sobresaliente. 08/05/03
Dirección de proyectos fin de grado
- Desarrollo de una herramienta capaz de recoger logs en ubicaciones remotas utilizando el framework.NET. Universidad de Zaragoza. Notable. 14/02/22
- Deep generative models para sensores acústicos distribuidos. Universidad de Zaragoza. Matrícula de honor. 10/07/20
- Estudio y caracterización de algoritmos de procesado adaptativo para sensores acústicos distribuidos del tipo HDAS. Universidad de Zaragoza. Sobresaliente. 07/07/20
- Separación de música y voz en grabaciones mono. Universidad de Zaragoza. Notable. 12/12/18
- Detector de actividad vocal para diarización mediante redes neuronales en entornos Broadcast. Universidad de Zaragoza. Sobresaliente. 17/02/17
- Desarrollo y evaluación de herramientas para alineamiento automático de audio y texto con sistemas de reconocimiento automático del habla. Universidad de Zaragoza. Sobresaliente. 05/07/16
- Modelos de forma activa y modelos de apariencia activa para la predicción de la dirección de la mirada. Universidad de Zaragoza. Sobresaliente. 04/06/15
Dirección de proyectos fin de master
- Evaluación de diferentes aproximaciones basadas en modelo para el reconocimiento de emociones a partir de la voz. Universidad de Zaragoza. Sobresaliente. 07/10/22
- Implementación de diferentes técnicas de Deep Generative Models para detección de eventos en sensores acústicos distribuidos. Universidad de Zaragoza. Sobresaliente. 13/07/21
- Análisis y estudio de un corpus de habla adquirido sobre personas con depresión. Universidad de Zaragoza. Notable. 12/07/19
- Segmentación automática de audio con modelos basados en redes neuronales para entornos Broadcast. Universidad de Zaragoza. Sobresaliente. 13/07/18
- Estudio de técnicas de aprendizaje no supervisado en sistemas de reconocimiento automático del habla en dominios restringidos. Universidad de Zaragoza. Matrícula de honor. 17/12/12
Patentes de invención
- US9767806B2; US2015088509 (A1); EP2860706A2. ANTI-SPOOFING. ALFONSO ORTEGA; LUIS BUERA ; CARLOS VAQUERO. 2017
- US2015112682 (A1). METHOD FOR VERIFYING THE IDENTITY OF A SPEAKER AND RELATED COMPUTER READABLE MEDIUM AND COMPUTER. LUIS BUERA ; MARTA GARCIA ; MARTA SANCHEZ; DE LAS HERAS ALBERTO MARTIN; GUTIERREZ ALFREDO; CARLOS VAQUERO; ALFONSO ORTEGA. 2015
- US9002706B2; US2014081638 (A1). CUT AND PASTE SPOOFING DETECTION USING DYNAMIC TIME WARPING. JESUS ANTONIO VILLALBA; ALFONSO ORTEGA ; EDUARDO LLEIDA ;SARA REDONDO; MARTA GARCIA. 2014
- ES2382281B1; ES2382281 (A1). SISTEMA ACUSTICO PARA VEHICULOS ALAIOGOIKOA SERGIO; UGALDE JOSEBA; HERNAEZ INMACULADA; SARATXAGA IBON; DE BILBAO ENERITZ; NAVAS EVA; VICENTE LUIS; ORTEGA ALFONSO; LLEIDA EDUARDO; GONZALEZ FERNANDO JOSE; LEZAMA JAVIER 2012
- US7068798B2; WO 02/101728 A1. Methods and system for suppressing echoes and noises in environments under variable acoustic and highly feedback conditions. FERNANDO GALLEGO HUGAS; EDUARDO LLEIDA SOLANO; ENRIQUE MASGRAU GÓMEZ; ALFONSO ORTEGA GIMÉNEZ. 2002
Protección de software
- Sistema de detección de menciones en emisiones de radio y televisión. ORTEGA GIMÉNEZ, ALFONSO - LLEIDA SOLANO, EDUARDO - MIGUEL ARTIAGA, ANTONIO
- SUBTITULADO AUTOMÁTICO DE CONTENIDOS AUDIOVISUALES. LLEIDA SOLANO, EDUARDO - MIGUEL ARTIAGA, ANTONIO - ORTEGA GIMÉNEZ, ALFONSO
Participaciones en congresos
- 24th Annual Conference of the International Speech Communication Association, INTERSPEECH 2023. Participativo - Póster. Variational Classifier for Unsupervised Anomalous Sound Detection under Domain Generalization. Dublín. 22/08/23
- Iberspeech 2022. Participativo - Ponencia oral (comunicación oral). Cross-Corpus Speech Emotion Recognition with HuBERT Self-Supervised Representation. Granada. 13/11/22
- 16th International Conference Zaragoza-Pau on Mathematics and its Applications. Participativo - Ponencia oral (comunicación oral). Deep Learning for Chaos Detection. Jaca (Huesca). 07/09/22
- XXVII CEDYA/XVII Congreso de Matemática Aplicada. Participativo - Póster. Chaos Detection: from Lyapunov Exponents to Deep Learning. Zaragoza. 18/07/22
- Iberspeech 2020. Participativo - Ponencia oral (comunicación oral). ViVoLAB Multimodal Diarization System for RTVE 2020 Challenge. Valladolid. 24/03/21
- Iberspeech 2020. Participativo - Ponencia oral (comunicación oral). Diarization and Identity Attribution Compatibility in the Albayzin 2020 Challenge. Valladolid. 24/03/21
- 20th Annual Conference of the International Speech Communication Association, INTERSPEECH 2019. Participativo - Ponencia oral (comunicación oral). ViVoLAB Speaker Diarization System for the DIHARD 2019 Challenge. Graz. 16/09/19
- 20th Annual Conference of the International Speech Communication Association, INTERSPEECH 2019. Participativo - Póster. Phonetically-aware embeddings, Wide Residual Networks with Time-Delay Neural Networks and Self Attention models for the 2018 NIST Speaker Recognition Evaluation. Graz. 16/09/19
- Interspeech 2019. Participativo - Póster. Speech Enhancement with Wide Residual Networks in Reverberant Environments. Graz. 15/09/19
- Interspeech 2019. Participativo - Póster. Progressive Speech Enhancement with Residual Connections. Graz. 15/09/19
- Iberspeech 2018. Participativo - Ponencia oral (comunicación oral). Phonetic Variability Influence on Short Utterances in Speaker Verification. Barcelona. 21/11/18
- Iberspeech 2018. Participativo - Póster. In-domain Adaptation Solutions for the RTVE 2018 Diarization Challenge. Barcelona. 21/11/18
- Iberspeech 2018. Participativo - Ponencia oral (comunicación oral). A Recurrent Neural Network Approach to Audio Segmentation for Broadcast Domain Data. Barcelona. 21/11/18
- 19th Annual Conference of the International Speech Communication Association, INTERSPEECH 2018. Participativo - Ponencia oral (comunicación oral). Estimation of the Number of Speakers with Variational Bayesian PLDA in the DIHARD Diarization Challenge. Hyderabad. 05/09/18
- 18th Annual Conference of the International Speech Communication Association, INTERSPEECH 2017. Participativo - Ponencia oral (comunicación oral). Tied Hidden Factors in Neural Networks for End-to-End Speaker Recognition. Estocolmo. 29/08/17
- 18th Annual Conference of the International Speech Communication Association, INTERSPEECH 2017. Participativo - Ponencia oral (comunicación oral). Domain Adaptation of PLDA models in Broadcast Diarization by means of Unsupervised Speaker Clustering. Estocolmo. 29/08/17
- Iberspeech 2016. Participativo - Ponencia oral (comunicación oral). Automatic Text-to-Audio Alignment of Multimedia Broadcast Content. Lisboa. 20/11/16
- Iberspeech 2016. Participativo - Póster. The ViVoLab-I3A-UZ System for Albayzin 2016 Search-on-Speech Evaluation. Lisboa. 20/11/16
- Iberspeech 2016. Participativo - Ponencia oral (comunicación oral). Bottleneck Based Front-End for Diarization Systems. Lisboa. 20/11/16
- Iberspeech 2016. Participativo - Ponencia oral (comunicación oral). Character Sequence to Sequence Applications: Subtitle Segmentation and Part-of-Speech Tagging. Lisboa. 20/11/16
- IEEE Automatic Speech Recognition and Understanding (ASRU 2015). Participativo - Ponencia oral (comunicación oral). Variational Bayesian PLDA for Speaker Diarization in the MGB Challenge. Arizona. 12/12/15
- 16th Annual Conference of the International Speech Communication Association, INTERSPEECH 2015. Participativo - Ponencia oral (comunicación oral). Spoofing Detection with DNN and One-class SVM for the ASVspoof 2015 Challenge. Dresden. 09/09/15
- IberSPEECH 2014. Participativo - Ponencia oral (comunicación oral). Subtitling Tools Based On Automatic Speech Recognition. Las Palmas. 12/11/14
- IberSPEECH 2014. Participativo - Ponencia oral (comunicación oral). Confidence Measures in Automatic Speech Recognition for Error Detection in Restricted Domains. Las Palmas. 12/11/14
- IberSPEECH 2014. Participativo - Ponencia oral (comunicación oral). Unsupervised Accent Modeling for Language Identification. Las Palmas. 12/11/14
- IberSPEECH 2014. Participativo - Ponencia oral (comunicación oral). A preliminary study of Acoustic Events Classification with Factor Analysis in Meeting Rooms. Las Palmas. 12/11/14
- IberSPEECH 2014. Participativo - Ponencia oral (comunicación oral). Albayzin 2014 Search on Speech @ ViVolab UZ. Las Palmas. 12/11/14
- 15th Annual Conference of the International Speech Communication Association, INTERSPEECH 2014. Participativo - Ponencia oral (comunicación oral). Factor Analysis with Sampling Methods for Text Dependent Speaker Recognition. Singapur. 02/09/14
- 14th Annual Conference of the International Speech Communication Association, INTERSPEECH 2013. Participativo - Ponencia oral (comunicación oral). A New Bayesian Network to Assess the Reliability of Speaker Verification Decisions. Lyon. 28/08/13
- 14th Annual Conference of the International Speech Communication Association, INTERSPEECH 2013. Participativo - Ponencia oral (comunicación oral). The I3A Speaker Recognition System for NIST SRE12: Post-evaluation Analysis. Lyon. 28/08/13
- 14th Annual Conference of the International Speech Communication Association, INTERSPEECH 2013. Participativo - Ponencia oral (comunicación oral). Suprasegmental Information Modelling for Autism Disorder Spectrum and Specific Language Impairment Classification. Lyon. 28/08/13
- SLAM 2013 Speech, Language and Audio in Multimedia. Participativo - Ponencia oral (comunicación oral). Broadcast News Segmentation with Factor Analysis System. Marsella. 25/08/13
- 24th EAEEIE Annual Conference (EAEEIE), 2013. Participativo - Ponencia oral (comunicación oral). Collaborative learning in international teams on Technologies to Reduce the Access Barrier in Human Computer Interaction (TrabHCI) Erasmus Intensive Programme. Chania. 25/05/13
- IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2013). Participativo - Póster. Segmentation-by-classification system based on factor analysis. Vancouver. 12/05/13
- IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2013). Participativo - Ponencia oral (comunicación oral). Prosodic features and formant modeling for an ivector-based language recognition system. Vancouver. 12/05/13
- IberSPEECH 2012 Participativo - Ponencia oral (comunicación oral). Factor Analysis Segmentation and Classification in Broadcast News Domain. Madrid. 21/11/12
- IberSPEECH 2012 Participativo - Ponencia oral (comunicación oral). Reliability Estimation of the Speaker Verification Decisions Using Bayesian Networks to Combine Information from Multiple Speech Quality Measures. Madrid. 21/11/12
- IberSPEECH 2012 Participativo - Ponencia oral (comunicación oral). Evaluation of a New Beam-Search Formant Tracking Algorithm in Noisy Environments. Madrid. 21/11/12
- IberSPEECH 2012 Participativo - Ponencia oral (comunicación oral). Voice Pathology Detection on the Saarbrücken Voice Database with Calibration and Fusion of Scores Using Mul-tiFocal Toolkit Madrid. 21/11/12
- IberSPEECH 2012 Participativo - Ponencia oral (comunicación oral). Score Level versus Audio Level Fusion for Voice Pathology Detection on the Saarbrücken Voice Database. Madrid. 21/11/12
- AMADIS 2012 – VI Congreso de Accesibilidad a los Medios Audiovisuales para Personas con Discapacidad. Participativo - Ponencia oral (comunicación oral). Sistema de enfatización de la voz para bucles de inducción magnética. Burgos. 25/10/12
- 13th Annual Conference of the International Speech Communication Association. INTERSPEECH 2012. Participativo - Ponencia oral (comunicación oral). The BLZ Submission to the NIST 2011 LRE: Data Collection, System Development and Performance. Portland. 02/09/12
- VI Jornadas de Reconocimiento Biométrico de Personas JRBP 2012. Participativo - Ponencia oral (comunicación oral). Diarization for Speaker Characterization. Las Palmas de Gran Canaria. 08/02/12
- 12th Annual Conference of the International Speech Communication Association. INTERSPEECH 2011. Participativo - Ponencia oral (comunicación oral). Hierarchical Audio Segmentation with HMM and Factor Analysis in Broadcast News Domain. Florencia. 28/08/11
- 12th Annual Conference of the International Speech Communication Association. INTERSPEECH 2011. Participativo - Ponencia oral (comunicación oral). I3A Language Recognition System for Albayzin 2010 LRE. Florencia. 28/08/11
- 12th Annual Conference of the International Speech Communication Association. INTERSPEECH 2011. Participativo - Ponencia oral (comunicación oral). Partitioning of Two-Speaker Conversation Datasets. Florencia. 28/08/11
- International Conference on Acoustics, Speech and Signal Processing ICASSP 2011. Participativo - Ponencia oral (comunicación oral). Intra-session variability compensation and hypothesis generation and selection strategy for speaker segmentation. Praga. 20/05/11
- FALA 2010 "VI Jornadas en Tecnología del Habla" and II Iberian SLTech Workshop. Participativo - Ponencia oral (comunicación oral). Intra-session variability compensation for speaker segmentation Vigo. 12/11/10
- FALA 2010 "VI Jornadas en Tecnología del Habla" and II Iberian SLTech Workshop. Participativo - Ponencia oral (comunicación oral). Speaker Tree Generation for Model Selection in Automatic Speech Recognition. Vigo. 12/11/10
- FALA 2010 "VI Jornadas en Tecnología del Habla" and II Iberian SLTech Workshop. Participativo - Ponencia oral (comunicación oral). Speech/Music classification by using the C4.5 decision tree algorithm. Vigo. 12/11/10
- FALA 2010 "VI Jornadas en Tecnología del Habla" and II Iberian SLTech Workshop. Participativo - Ponencia oral (comunicación oral). A Prototype of Distributed Speech Technologies for the Development of Websites Accessible to the Blind Community. Vigo. 12/11/10
- FALA 2010 "VI Jornadas en Tecnología del Habla" and II Iberian SLTech Workshop. Participativo - Ponencia oral (comunicación oral). Predictive vector quantization using the M-algorithm for distributed speech recognition. Vigo. 12/11/10
- 11th Annual Conference of the International Speech Communication Association. INTERSPEECH 2010. Participativo - Ponencia oral (comunicación oral). Confidence Measures for Speaker Segmentation and their Relation to Speaker Verification. Makuhari. 11/09/10
- V jornadas de reconocimiento biométrico de personas JRBP 2010. Participativo - Ponencia oral (comunicación oral). I3A NIST SRE2010 System Description. Huesca. 11/09/10
- 11th Annual Conference of the International Speech Communication Association. INTERSPEECH 2010. Participativo - Ponencia oral (comunicación oral). Non-Linear Predictive Vector Quantization of Feature Vectors for Distributed Speech Recognition. Makuhari. 11/09/10
- V jornadas de reconocimiento biométrico de personas JRBP 2010. Participativo - Ponencia oral (comunicación oral). Confidence Measures and Hypothesis Selection Strategies for Speaker Segmentation. Huesca. 11/09/10
- 0th Annual Conference of the International Speech Communication Association. INTERSPEECH 2009. Participativo - Ponencia oral (comunicación oral). Differential Vector Quantization of Feature Vectors for Distributed Speech Recognition. Brighton. 02/09/09
- 10th Annual Conference of the International Speech Communication Association. INTERSPEECH 2009. Participativo - Ponencia oral (comunicación oral). Unsupervised Training Scheme with Non-Stereo Data for Empirical Feature Vector Compensation. Brighton. 02/09/09
- 10th Annual Conference of the International Speech Communication Association. INTERSPEECH 2009. Participativo - Póster. Graphical Models for Discrete Hidden Markov Models in Speech Recognition. Brighton. 02/09/09
- 10th Annual Conference of the International Speech Communication Association. INTERSPEECH 2009. Participativo - Póster. Local Projections and Support Vector Based Feature Selection in Speech Recognition. Brighton. 02/09/09
- 10th Annual Conference of the International Speech Communication Association. INTERSPEECH 2009. Participativo - Póster. Real-Time Live Broadcast News Subtitling System for Spanish. Brighton. 02/09/09
- IV Congreso de Accesibilidad a los Medios Audiovisuales para Personas con Discapacidad. AMADIS 09. Participativo - Ponencia oral (comunicación oral). Subtitulado en Tiempo Real de Informativos en Directo para la Televisión Mediante Reconocimiento Automático del Habla. Pamplona. 09/06/09
- IEEE International Symposium on Broadband Multimedia Systems and Broadcasting (BMSB). Participativo - Ponencia oral (comunicación oral). Audio and Text Synchronization for TV news Subtitling based on Automatic Speech Recognition. Bilbao. 05/05/09
- V Jornadas en Tecnologías del Habla. Participativo - Ponencia oral (comunicación oral). CUANTIFICACIÓN VECTORIAL DIFERENCIAL PARA LA TRANSMISIÓN EFICIENTE DE PARÁMETROS ACÚSTICOS EN SISTEMAS DE RECONOCIMIENTO AUTOMÁTICO DEL HABLA DISTRIBUIDO. Bilbao. 12/11/08
- V Jornadas en Tecnologías del Habla. Participativo - Ponencia oral (comunicación oral). Graphical Models for Discrete Observation Distributions in Speech Recognition. Bilbao. 12/11/08
- V Jornadas en Tecnologías del Habla. Participativo - Ponencia oral (comunicación oral). Arquitectura Distribuida para el Desarrollo de Sistemas de Diálogo Hablado, EDECAN. Bilbao. 12/11/08
- V Jornadas en Tecnologías del Habla. Participativo - Ponencia oral (comunicación oral). Generalized Gausssians for Continuous Observation Distributions in Speech Recognition. Bilbao. 12/11/08
- V Jornadas en Tecnologías del Habla. Participativo - Ponencia oral (comunicación oral). SISTEMA DE RECONOCIMIENTO AUTOMÁTICO DEL HABLA DISTRIBUIDO APLICADO A ENTORNOS LOGÍSTICOS. Bilbao. 12/11/08
- Jornadas de Reconocimiento Biométrico de Personas. Participativo - Ponencia oral (comunicación oral). Experiencia del I3A en la Evaluación de Reconocimiento de Locutor NIST 2008. Valladolid. 09/09/08
- International Conference on Spoken Language Processing (ICSLP- Interspeech). Participativo - Ponencia oral (comunicación oral). Feature Vector Normalization with Combined Standard and Throat Microphones for Robust ASR. Brisbane. 03/09/08
- IEEE Automatic Speech Recognition and Understanding Workshop, ASRU 2007. Participativo - Ponencia oral (comunicación oral). Robust Speech Recognition with on-line Unsupervised Acoustic Feature. Kyoto. 10/12/07
- Interspeech 2007. Participativo - Ponencia oral (comunicación oral). Evaluation of the Combined Use of MEMLIN and MLLR on the Non-native Adaptation Task of Hiwire Project Database. Amberes. 29/08/07
- Interspeech 2007. Participativo - Ponencia oral (comunicación oral). On the Jointly Unsupervised Feature Vector Normalization and Acoustic Model Compensation for Robust Speech Recognition. Amberes. 29/08/07
- II Jornadas de Innovación Educativa de la Escuela Politécnica Superior de Zamora. Participativo - Ponencia oral (comunicación oral). Distribución de la carga discente: estudio sobre las titulaciones del Centro Politécnico Superior de la Universidad de Zaragoza. Zamora. 19/06/07
- Biennial on DSP for in-Vehicle and Mobile Systems 2007. Participativo - Ponencia oral (comunicación oral). Robust Speech Recognition with on-line Unsupervised Acoustic Feature. Estambul. 01/06/07
- IEEE Intelligent Vehicles Symposium. Participativo - Ponencia oral (comunicación oral). On-Line Feature and Acoustic Model Space Compensation for Robust Speech Recognition in Car Environment. Estambul. 01/06/07
- I Jornadas de Innovación Docente, Tecnologías de la Información y la Comunicación e Investigación Educativa en la Universidad de Zaragoza. Participativo - Ponencia oral (comunicación oral). Estudio sobre la carga de trabajo del estudiante en las titulaciones del CPS. Zaragoza. 23/11/06
- III Jornadas de Reconocimiento Biométrico de Personas. Participativo - Ponencia oral (comunicación oral). Verificación e Identificación de Locutor con Normalización de Vectores de Características en Entornos Acústicos Adversos. Sevilla. 20/11/06
- IV Jornadas en Tecnología del Habla. Participativo - Ponencia oral (comunicación oral). A virtual butler controlled by speech. Zaragoza. 08/11/06
- IV Jornadas en Tecnología del Habla. Participativo - Ponencia oral (comunicación oral). Time-dependent Cross-Probability Model for Feature Vector Normalization. Zaragoza. 08/11/06
- International Conference on Spoken Language Processing, (ICSLP 2006). Participativo - Ponencia oral (comunicación oral). Time-dependent cross-probability model for Multi-Environment Model based LInear Normalization. Pittsburgh. 07/09/06
- International Conference on Spoken Language Processing, (ICSLP 2006). Participativo - Ponencia oral (comunicación oral). Local Transformation Models for Speech Recognition. Pittsburgh. 07/09/06
- International Conference on Spoken Language Processing, (ICSLP 2006). Participativo - Póster. Study of Time and Frequency Variability in Pathological Speech and Error Reduction Methods for Automatic Speech Recognition. Pittsburgh. 07/09/06
- IV Congreso Internacional de Docencia Universitaria e Innovación (CIDUI 2006). Participativo - Póster. Estudio de los perfiles y competencias profesionales en la titulación de Ingeniería de Telecomunicación. Barcelona. 05/07/06
- IV Congreso Internacional de Docencia Universitaria e Innovación (CIDUI 2006). Participativo - Póster. Evaluación de la carga discente de la titulación de Ingeniería de Telecomunicación: asignación de créditos ECTS. Barcelona. 05/07/06
- IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2006). Participativo - Póster. Stability Control in a Two-Channel Speech Reinforcement System for Vehicles. Toulouse. 10/05/06
- IEEE Automatic Speech Recognition and Understanding Workshop, ASRU 2005. Participativo - Ponencia oral (comunicación oral). Recent Advances in PD-MEMLIN for Speech Recognition in Car Conditions. Cancún. 25/11/05
- XX Symposium de la Unión Internacional de Radio (URSI). Participativo - Ponencia oral (comunicación oral). Tratamiento Robusto del Sonido en el Interior de Vehículos. Gandía. 14/09/05
- Interspeech 2005 – Eurospeech- 9th European Conference on Speech Communication and Technology. Participativo - Póster. Augmented State Space Acoustic Decoding for Modeling Local Variability in Speech. Lisboa. 09/09/05
- Interspeech 2005 – Eurospeech- 9th European Conference on Speech Communication and Technology. Participativo - Ponencia oral (comunicación oral). Robust Speech Recognition in Cars Using Phoneme Dependent Multi-Environment Linear Normalization. Lisboa. 09/09/05
- Interspeech 2005 – Eurospeech- 9th European Conference on Speech Communication and Technology. Participativo - Póster. Acoustic Feedback Cancellation in Speech Reinforcement System for Vehicles. Lisboa. 09/09/05
- Biennial on DSP for in-Vehicle and Mobile Systems. Participativo - Ponencia oral (comunicación oral). Multi-Environment Linear Normalization for Robust Speech Analysis in Cars. Sesimbra. 02/09/05
- 14th IST Mobile & Wireless Communications Summit 2005. Participativo - Ponencia oral (comunicación oral). Adaptive LINC Structure applied to Power Amplifier with Memory Effects for Wideband. Dresde. 19/06/05
- Summer School for Advanced Studies on Biometrics for Secure Authentication: Miltimodality and System Integration. Participativo - Ponencia oral (comunicación oral). Speaker Verification and Identification using Phoneme Dependent Multi-Environment based Linear Normalization in Adverse and Dynamic Acoustic Environments. Algherio. 06/06/05
- III Jornadas en Tecnología del Habla. Participativo - Ponencia oral (comunicación oral). Algoritmos de Compensación de Características Cepstrales para Reconocimiento Automático del Habla Robusto. Valencia. 12/11/04
- III Jornadas en Tecnología del Habla. Participativo - Ponencia oral (comunicación oral). Decodificación Eficiente para Normalización del Tracto Vocal en Reconocimiento Automático del Habla en Tiempo Real. Valencia. 12/11/04
- III Jornadas en Tecnología del Habla. Participativo - Ponencia oral (comunicación oral). Avances en la Normalización Cepstral con Señal Estéreo para el Reconocimiento Robusto de Voz en el Entorno del Vehículo. Valencia. 12/11/04
- III Jornadas en Tecnología del Habla. Participativo - Ponencia oral (comunicación oral). Base de Datos Audiovisual y Multicanal en Castellano para Reconocimiento Automático del Habla Multimodal en el Automóvil. Valencia. 12/11/04
- XXII Congreso Anual de la Sociedad Española de Ingeniería Biomédica (CASEIB). Participativo - Ponencia oral (comunicación oral). Sistema de Telemonitorización en Vehículos de Emergencias Médicas sobre UMTS. Santiago de Compostela. 11/11/04
- The Seventh International Symposium on Wireless Personal Multimedia Communications (WPMC'04). Participativo - Ponencia oral (comunicación oral). A Novel Digital Imbalances Cancellation Method in LINC Transmitters. Abano Terme. 12/09/04
- International Conference “Speech and Computer” SPECOM-2004. Participativo - Ponencia oral (comunicación oral). Multi-Environments Models Based Linear Normalization for Robust Speech Recognition. San Petersburgo. 07/09/04
- 15th IEEE International Symposium on Personal, Indoor and Mobile Radio Communications (PIMRC 2004). Participativo - Ponencia oral (comunicación oral). Nonlinear Distortion Cancellation in OFDM Systems Using an Adaptive LINC Structure. Barcelona. 05/09/04
- IEEE 59th vehicular technology conference (VTC 2004 Spring). Participativo - Ponencia oral (comunicación oral). Adaptive digital correction of gain and phase Imbalances in LINC Transmitters. Milán. 17/05/04
- International Conference on Acoustics, Speech and Signal Processing (ICASSP 2004). Participativo - Ponencia oral (comunicación oral). Multi-Environments Models Based Linear Normalization for Speech Recognition in Car Conditions. Montreal. 05/05/04
- 4th International Conference on Language Resources and Evaluation (LREC 2004). Participativo - Ponencia oral (comunicación oral). AV@CAR: A Spanish Multichannel Multimodal Corpus for In-Vehicle Automatic Audio-Visual Speech Recognition. Lisboa. 04/05/04
- 5th European Wireless Conference (EW 2004). Participativo - Ponencia oral (comunicación oral). Adaptive Imbalances Correction in LINC Transmitters. Barcelona. 24/02/04
- XVIII SIMPOSIUM NACIONAL DE LA URSI. Participativo - Ponencia oral (comunicación oral). Estudio de un método adaptativo de linealización feedforward. La Coruña. 10/09/03
- 8th European Conference on Speech Communication and Technology (Eurospeech 2003). Participativo - Ponencia oral (comunicación oral). Residual Echo Power Estimation for Speech Reinforcement Systems in Vehicles. Ginebra 10/09/03
- XVIII SIMPOSIUM NACIONAL DE LA URSI. Participativo - Ponencia oral (comunicación oral). Método adaptativo para el equilibrio de las ramas de un transmisor LINC. La Coruña. 10/09/03
- 5ª Semana Geomática. Participativo - Ponencia oral (comunicación oral). Interface oral para el acceso a sistemas de información en vehículos. Barcelona. 08/02/03
- II Jornadas en Tecnologías del Habla. Participativo - Ponencia oral (comunicación oral). Reconocimiento Automático del Habla en vehículos, resultados con SpeechDat-Car. Granada. 04/12/02
- XI European Signal Processing Conference. EUSIPCO 2002. Participativo - Póster. DSP to Improve Oral Communications Inside Vehicles. Toulouse 05/09/02
- Audio Engineering Society 21st International Conference. Architectural Acoustic & Sound Reinforcement. Participativo - Ponencia oral (comunicación oral). Speech Reinforce Inside Vehicles. San Petersburgo. 20/06/02
- Acoustics, Speech, and Signal Processing (ICASSP), 2002 IEEE International Conference on. Participativo - Ponencia oral (comunicación oral). Cabin Car Communication System to improve Communications Inside a Car. Orlando. 15/05/02
- XVI Simposium Nacional de la Unión Internacional de Radio (URSI 2001). Participativo - Ponencia oral (comunicación oral). Sistema de Comunicación Oral para el Interior de automóviles. Madrid. 20/09/01
- 7th European Conference on Speech Communication and Technology (Eurospeech 2001). Participativo - Ponencia oral (comunicación oral). Acoustic Echo Control and Noise Reduction for Cabin Car Communication. Aalborg. 08/09/01
- XV Simposium Nacional de la Unión Internacional de Radio (URSI 2000). Participativo - Ponencia oral (comunicación oral). Control Activo de Ruido con Ecualización del Camino Secundario. Zaragoza. 13/09/00
Estancias
- Face in Motion. Oporto. Portugal. 03/08/15 - 05/10/15
- University of Texas at Dallas. Erik Jonsson School of Engineering and Computer Science. Richardson, Texas. Estados Unidos de América. 24/04/06 - 07/08/06
Organizaciones de actividades de I+D+i
- Iberspeech 2016. 23/11/16 - 25/11/16
- Odyssey 2016. 22/06/16 - 24/06/16
- Iberspeech 2014. 12/11/14 - 14/11/14
- Iberspeech 2012. 21/11/12 - 23/11/12
- V Jornadas de Reconocimiento Biométrico de Personas 09/09/10 - 10/09/10
- IV Jornadas en Tecnologías del Habla 08/11/06 - 10/11/06
Gestiones de actividades de I+D+i
- Instituto Universitario de Investigación en Ingeniería de Aragón. Subdirector de Transferencia Tecnológica. Instituto de Investigación en Ingeniería de Aragón. 19/11/19
- Universidad de Zaragoza. Miembro electo de la Comisión Mixta de Juntas de Centro y de la Comisión de Garantía de Calidad. 12/06/08 - 21/02/12
- Centro Politécnico Superior. Miembro electo de la Junta de Centro. Centro Politécnico Superior. 12/02/08 - 21/02/12
Evaluaciones en artículos I+D+i
- Evaluación de Proyectos de I+D. Agencia Flamenca de Innovación (Bélgica) / Flanders Innovation & Entrepreneurship. No existe. 01/01/21 - 31/12/21
- Evaluación de proyectos de Investigación. Fundação para a Ciência e a Tecnologia (FCT). Portugal. 08/02/16
- Evaluación de proyectos de Investigación. Agència de Gestió d’Ajuts Universitaris i de Recerca (AGAUR). Cataluña. España. 08/09/15
- Evaluación de proyectos de Investigación. Agencia Nacional de Evaluación y Prospectiva (ANEP). España. 04/03/14
- Evaluación de proyectos de Investigación. Asociación Española de Normalización y Certificación AENOR. España. 12/09/12
- Conferencia internacional referencia en el sector. INTERSPEECH. International Conference on Speech Communication and Technology. No existe. 01/01/05
- Conferencia internacional referencia en el sector. International Conference on Acoustics, Speech and Signal Processing ICASSP. No existe. 01/01/05
- Conferencia internacional referencia en el sector. IEEE Vehicular Technology Conference: VTC & Personal, Indoor and Radio Communications (PIMRC). No existe. 01/01/05
- Conferencia internacional referencia en el sector. International Conference of the IEEE Engineering in Medicine and Biology Society (IEEE EMBS). No existe. 01/01/05
- Revisión de artículos en revistas científicas o tecnológicas. EURASIP Journal on Applied Signal Processing. No existe. 01/01/05
- Revisión de artículos en revistas científicas o tecnológicas. Journal of the Audio Engineering Society. No existe. 01/01/05 - 04/01/18
- Revisión de artículos en revistas científicas o tecnológicas. Speech Communication, Elsevier. No existe. 01/01/05
- Revisión de artículos en revistas científicas o tecnológicas. IEEE Signal Processing Letters. No existe. 01/01/05
- Revisión de artículos en revistas científicas o tecnológicas. IEEE Transactions on Audio, Speech and Language Processing. Estados Unidos de América. 01/01/05
- Revisión de artículos en revistas científicas o tecnológicas. IEEE Transactions on Circuits and Systems I. No existe. 01/01/05
Otros méritos
- • Coordinador de la Red Temática en Tecnologías del Habla desde 2010 hasta Noviembre de 2016. 12/11/10
- • Prof. Invitado por la Université de Tecnologie de Compiègne (Francia) Curso de 10 horas en Máster Interuniversitario Hispano-Francés 'Human Computer Speech-Based Interfaces and Natural Interaction'. 25/05/10
- • Miembro del grupo de innovación docente INDOTEC. INDOTEC, reconocido por la Univ. de Zaragoza en convocatoria pública. 22/02/07
- • Premio Extraordinario de Doctorado por la Universidad de Zaragoza. Curso académico 2005/2006. 01/09/06
- • Premio Cátedra Telefónica a la Mejor Tesis Doctoral de Caracter Técnico. Curso académico 2005/2006. 01/09/06
|