Juan Zuluaga-Gomez - Idiap Publications

Update cookies preferences

First name(s):	Juan
Last name(s):	Zuluaga-Gomez

| 1 | 2 |

Fast Streaming Transducer ASR Prototyping via Knowledge Distillation with Whisper, Thorbecke Iuliia, Juan Zuluaga-Gomez, Esaú Villatoro-Tello, Shashi Kumar, Pradeep Rangappa, Sergio Burdisso, Petr Motlicek, Karthik Pandia D S and Aravind Ganapathiraju, Idiap-RR-10-2024

attachment

TokenVerse: Unifying Speech and NLP Tasks via Transducer-based ASR, Shashi Kumar, Srikanth Madikeri, Juan Zuluaga-Gomez, Nigmatulina Iuliia, Esaú Villatoro-Tello, Sergio Burdisso, Petr Motlicek, Karthik Pandia D S and Aravind Ganapathiraju, Idiap-RR-07-2024

attachment

[URL]

XLSR-Transducer: Streaming ASR for Self-Supervised Pretrained Models, Shashi Kumar, Srikanth Madikeri, Juan Zuluaga-Gomez, Esaú Villatoro-Tello, Nigmatulina Iuliia, Petr Motlicek, Manjunath K E and Aravind Ganapathiraju, Idiap-RR-08-2024

attachment

[URL]

Implementing contextual biasing in GPU decoder for online ASR, Nigmatulina Iuliia, Srikanth Madikeri, Esaú Villatoro-Tello, Petr Motlicek, Juan Zuluaga-Gomez, Karthik Pandia D S and Aravind Ganapathiraju, Idiap-RR-02-2023

attachment

IDIAPers @ Causal News Corpus 2022: Efficient Causal Relation Identification Through a Prompt-based Few-shot Approach, Sergio Burdisso, Juan Zuluaga-Gomez, Esaú Villatoro-Tello, Martin Fajcik, Muskaan Singh, Pavel Smrz and Petr Motlicek, Idiap-RR-13-2022

attachment

IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal Triplets via Pre-trained Autoregressive Language Model, Martin Fajcik, Muskaan Singh, Juan Zuluaga-Gomez, Esaú Villatoro-Tello, Sergio Burdisso, Petr Motlicek and Pavel Smrz, Idiap-RR-12-2022

attachment

BERTraffic: A Robust BERT-Based Approach for Speaker Change Detection and Role Identification of Air-Traffic Communications, Juan Zuluaga-Gomez, Seyyed Saeed Sarfjoo, Amrutha Prasad, Nigmatulina Iuliia, Petr Motlicek, Oliver Ohneiser and Hartmut Helmke, Idiap-RR-15-2021

Contextual Semi-Supervised Learning: An Approach To Leverage Air-Surveillance and Untranscribed ATC Data in ASR Systems, Juan Zuluaga-Gomez, Nigmatulina Iuliia, Amrutha Prasad, Petr Motlicek, Karel Vesely, Martin Kocour and Igor Szoke, Idiap-RR-14-2021

attachment

[URL]

Grammar Based Identification Of Speaker Role For Improving ATCO And Pilot ASR, Amrutha Prasad, Juan Zuluaga-Gomez, Petr Motlicek, Oliver Ohneiser, Hartmut Helmke, Seyyed Saeed Sarfjoo and Nigmatulina Iuliia, Idiap-RR-22-2021

attachment

Improving callsign recognition with air-surveillance data in air-traffic communication, Nigmatulina Iuliia, Rudolf Braun, Juan Zuluaga-Gomez and Petr Motlicek, Idiap-RR-20-2021

[URL]

A Virtual Simulation-Pilot Agent for Training of Air Traffic Controllers, Juan Zuluaga-Gomez, Amrutha Prasad, Nigmatulina Iuliia, Petr Motlicek and Matthias Kleinert, in: Aerospace, 10(5), 2023

attachment

[DOI]
[URL]

An Automatic Speaker Clustering Pipeline for the Air Traffic Communication Domain, Driss Khalil, Amrutha Prasad, Petr Motlicek, Juan Zuluaga-Gomez, Nigmatulina Iuliia, Srikanth Madikeri and Schüpbach Christof, in: Aerospace, 10(10):876, 2023

attachment

[DOI]
[URL]

Lessons Learned in Transcribing 5000 h of Air Traffic Control Communications for Robust Automatic Speech Understanding, Juan Zuluaga-Gomez, Nigmatulina Iuliia, Amrutha Prasad, Petr Motlicek, Driss Khalil, Srikanth Madikeri, Allan Tart, Igor Szoke, Vincent Lenders, Mickael Rigault and Khalid Choukri, in: Aerospace, 10(10):898, 2023

attachment

[DOI]
[URL]

Validating Automatic Speech Recognition and Understanding for Pre-Filling Radar Labels-Increasing Safety While Reducing Air Traffic Controllers' Workload, Nils Ahrenhold, Hartmut Helmke, Thorsten Mühlhausen, Oliver Ohneiser, Matthias Kleinert, heiko Ehr, Lucas Klamert and Juan Zuluaga-Gomez, in: Aerospace, 10(6):538, 2023

attachment

[DOI]

Domain-Adversarial Based Model with Phonological Knowledge for Cross-Lingual Speech Recognition, Qingran Zhan, Xiang Xie, Hu Chenguang, Juan Zuluaga-Gomez, Jing Wang and Haobo Cheng, in: Electronics, 10(24):1-15, 2021

attachment

[DOI]
[URL]

ATCO2 corpus: A Large-Scale Dataset for Research on Automatic Speech Recognition and Natural Language Understanding of Air Traffic Control Communications, Juan Zuluaga-Gomez, Karel Vesely, Igor Szoke, Blatt Alexander, Petr Motlicek, Martin Kocour, Khalid Choukri, Nigmatulina Iuliia, Claudia Cevenini, Allan Tart, Jan Cernocky and Dietrich Klakow, in: Journal of Data-centric Machine Learning Research, 2024

[URL]

Fine-Tuning Pretrained Models with NVIB for Improved Generalisation, Fabio Fehr, Alina Elena Baia, Xiaoguang Chang, Andrei Catalin Coman, Karl El Hajal, Dina El Zein, Shashi Kumar, Juan Zuluaga-Gomez, Andrea Cavallaro, Damien Teney and James Henderson, in: Workshop on Spurious Correlation and Shortcut Learning: Foundations and Solutions, 2025

[URL]

Speech Data Selection for Efficient ASR Fine-Tuning using Domain Classifier and Pseudo-Label Filtering, Pradeep Rangappa, Juan Zuluaga-Gomez, Srikanth Madikeri, Andrés Carofilis, Jeena Prakash, Sergio Burdisso, Shashi Kumar, Esaú Villatoro-Tello, Nigmatulina Iuliia, Petr Motlicek, Karthik Pandia D S and Aravind Ganapathiraju, in: 2025 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2025), 2025

attachment

[DOI]
[URL]

Unifying Global and Near-Context Biasing in a Single Trie Pass., Thorbecke Iuliia, Esaú Villatoro-Tello, Juan Zuluaga-Gomez, Shashi Kumar, Sergio Burdisso, Pradeep Rangappa, Andrés Carofilis, Srikanth Madikeri, Petr Motlicek, Karthik Pandia D S, Kadri Hacioğlu and Andreas Stolcke, in: Text, Speech, and Dialogue. TSD 2025. Lecture Notes in Computer Science, Springer, Springer, 2025

attachment

[DOI]
[URL]

XLSR-Transducer: Streaming ASR for Self-Supervised Pretrained Models, Shashi Kumar, Srikanth Madikeri, Juan Zuluaga-Gomez, Esaú Villatoro-Tello, Iuliia Thorbecke, Petr Motlicek, Manjunath K E and Aravind Ganapathiraju, in: Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Hyderabad, India, IEEE, 2025

attachment

[DOI]
[URL]

Fast Streaming Transducer ASR Prototyping via Knowledge Distillation with Whisper, Iuliia Thorbecke, Juan Zuluaga-Gomez, Esaú Villatoro-Tello, Shashi Kumar, Pradeep Rangappa, Sergio Burdisso, Petr Motlicek, Karthik Pandia D S and Aravind Ganapathiraju, in: Findings of the Association for Computational Linguistics: EMNLP 2024, pages 16747–16762, Association for Computational Linguistics (ACL), 2024

attachment

[DOI]
[URL]

TokenVerse: Towards Unifying Speech and NLP Tasks via Transducer-based ASR, Shashi Kumar, Srikanth Madikeri, Juan Zuluaga-Gomez, Iuliia Thorbecke, Esaú Villatoro-Tello, Sergio Burdisso, Petr Motlicek, Karthik Pandia D S and Aravind Ganapathiraju, in: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, pages 20988–20995, Association for Computational Linguistics (ACL), 2024

attachment

[DOI]
[URL]

Automatic Speech Recognition and Understanding for Radar Label Maintenance Support Increases Safety and Reduces Air Traffic Controllers’ Workload, Hartmut Helmke, Matthias Kleinert, Nils Ahrenhold, heiko Ehr, Thorsten Mühlhausen, Oliver Ohneiser, Petr Motlicek, Amrutha Prasad, Juan Zuluaga-Gomez, Lucas Klamert, Jelena Dokic and Ella Pinska Chauvin, in: Fifteenth USA/Europe Air Traffic Management Research and Development Seminar (ATM2023), Eurocontrol (Europe), FAA (U.S.), Savannah, Georgia, USA, 2023

attachment

[URL]

BERTraffic: BERT-based Joint Speaker Role and Speaker Change Detection for Air Traffic Control Communications, Juan Zuluaga-Gomez, Seyyed Saeed Sarfjoo, Amrutha Prasad, Nigmatulina Iuliia, Petr Motlicek, Karel Ondřej and Oliver Ohneiser, in: 2023 IEEE Spoken Language Technology Workshop (SLT), IEEE, 2023

attachment

[URL]

CommonAccent: Exploring Large Acoustic Pretrained Models for Accent Classification Based on Common Voice, Juan Zuluaga-Gomez, Ahmed Sara, Visockas Danielius and Subakan Cem, in: Proc. Interspeech 2023, 2023

attachment

[URL]

Effectiveness of Text, Acoustic, and Lattice-based representations in Spoken Language Understanding tasks, Esaú Villatoro-Tello, Srikanth Madikeri, Juan Zuluaga-Gomez, Bidisha Sharma, Seyyed Saeed Sarfjoo, Nigmatulina Iuliia, Petr Motlicek, Alexei V. Ivanov and Aravind Ganapathiraju, in: Proceedings of the 2023 IEEE International Conference on Acoustics, Speech and Signal Processing, 2023

attachment

End-to-End Single-Channel Speaker-Turn Aware Conversational Speech Translation, Juan Zuluaga-Gomez, Zhaocheng Huang, Xing Niu, Sundararajan Srinavasan, Prashant Mathur, Brian Thompson and Marcello Federico, in: The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP), Singapore, 2023

attachment

[URL]

How Does Pre-trained Wav2Vec 2.0 Perform on Domain-Shifted ASR? An Extensive Benchmark on Air Traffic Control Communications, Juan Zuluaga-Gomez, Amrutha Prasad, Nigmatulina Iuliia, Seyyed Saeed Sarfjoo, Petr Motlicek, Matthias Kleinert, Hartmut Helmke, Oliver Ohneiser and Qingran Zhan, in: 2023 IEEE Spoken Language Technology Workshop (SLT), IEEE, 2023

attachment

[URL]

HyperConformer: Multi-head HyperMixer for Efficient Speech Recognition, Florian Mai, Juan Zuluaga-Gomez, Titouan Parcollet and Petr Motlicek, in: Proc. Interspeech 2023, Ireland, 2023

attachment

Implementing contextual biasing in GPU decoder for online ASR, Nigmatulina Iuliia, Srikanth Madikeri, Esaú Villatoro-Tello, Petr Motlicek, Juan Zuluaga-Gomez, Karthik Pandia D S and Aravind Ganapathiraju, in: Proc. Interspeech 2023, pages 4494--4498, 2023

attachment

[DOI]
[URL]

A two-step approach to leverage contextual data: speech recognition in air-traffic communications, Nigmatulina Iuliia, Juan Zuluaga-Gomez, Amrutha Prasad, Seyyed Saeed Sarfjoo and Petr Motlicek, in: Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), pages 6282-6286, IEEE, 2022

attachment

[DOI]
[URL]

Grammar Based Speaker Role Identification for Air Traffic Control Speech Recognition, Amrutha Prasad, Juan Zuluaga-Gomez, Petr Motlicek, Seyyed Saeed Sarfjoo, Nigmatulina Iuliia, Oliver Ohneiser and Hartmut Helmke, in: 12th SESAR Innovation Days, 2022

attachment

IDIAPers @ Causal News Corpus 2022: Efficient Causal Relation Identification Through a Prompt-based Few-shot Approach, Sergio Burdisso, Juan Zuluaga-Gomez, Esaú Villatoro-Tello, Martin Fajcik, Muskaan Singh, Pavel Smrz and Petr Motlicek, in: The 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE @ EMNLP 2022), 2022

[URL]

IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal Triplets via Pre-trained Autoregressive Language Model, Martin Fajcik, Muskaan Singh, Juan Zuluaga-Gomez, Esaú Villatoro-Tello, Sergio Burdisso, Petr Motlicek and Pavel Smrz, in: The 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE @ EMNLP 2022), 2022

[URL]

Readback Error Detection by Automatic Speech Recognition and Understanding -- Results of HAAWAII Project for Isavia’s Enroute Airspace, Hartmut Helmke, Karel Ondřej, Shruthi Shetty, Hörður Arilíusson, Teodor S. Simiganoschi, Matthias Kleinert, Oliver Ohneiser, heiko Ehr, Juan Zuluaga-Gomez and Pavel Smrz, in: 11th SESAR Innovation Days, SESAR, pages 9, 2022

attachment

Speech and Natural Language Processing Technologies for Pseudo-Pilot Simulator, Amrutha Prasad, Juan Zuluaga-Gomez, Petr Motlicek, Seyyed Saeed Sarfjoo, Nigmatulina Iuliia and Karel Vesely, in: 12th SESAR Innovation Days, 2022

attachment

Automatic processing pipeline for collecting and annotating air-traffic voice communication data, Martin Kocour, Karel Vesely, Igor Szoke, Santosh Kesiraju, Juan Zuluaga-Gomez, Blatt Alexander, Amrutha Prasad, Nigmatulina Iuliia, Petr Motlicek and et al., in: Proceedings of 9th OpenSky Symposium 2020, OpenSky Network, Brussels, Belgium, pages 1-9, MDPI, 2021

attachment

Boosting of contextual information in ASR for air-traffic call-sign recognition, Martin Kocour, Karel Vesely, Blatt Alexander, Juan Zuluaga-Gomez, Igor Szoke, Jan Cernocky, Dietrich Klakow and Petr Motlicek, in: Interspeech 2021, 2021

attachment

| 1 | 2 |

processing time: 0.0009 seconds.