Publication list - Idiap Publications

Exploratory Study on Direct Prediction of Diabetes using Deep Residual Networks, Samaneh Abbasi-Sureshjani, Behdad Dasht Bozorg, Bart ter Haar Romeny and Francois Fleuret, in: Proceedings of the thematic conference on computational vision and medical image processing, 2017

Boosted Exudate Segmentation in Retinal Images using Residual Nets, Samaneh Abbasi-Sureshjani, Behdad Dasht Bozorg, Bart ter Haar Romeny and Francois Fleuret, in: Proceedings of the MICCAI Workshop on Ophthalmic Medical Image Analysis, 2017

Understanding Raw Waveform based CNN through Low-rank Spectro-Temporal Decoupling, Vinayak Abrol, S. Pavankumar Dubagunta and Mathew Magimai-Doss, Idiap-RR-11-2019

A BSS-based Approach for Localization of Simultaneous Speakers in Reverberant Conditions, Hamid Reza Abutalebi, Hedieh Heli, Danil Korchagin and Hervé Bourlard, in: Proceedings of the 19th European Signal Processing Conference (EUSIPCO), 2011

Performance Improvement of TDOA-Based Speaker Localization in Joint Noisy and Reverberant Conditions, Hamid Reza Abutalebi and Hossein Momenzadeh, in: EURASIP Journal on Advances in Signal Processing, 2011

[DOI]

Speech Enhancement using Beta-order MMSE Spectral Amplitude Estimator with Laplacian Prior, Hamid Reza Abutalebi, Mehdi Rashidinejad, Hervé Bourlard and Ali Akbar Tadaion, Idiap-RR-24-2011

Modeling and Optimal Control of the Open Torque-Controlled Quadruped Robot Solo-12, Niederberger Adi, Idiap-Com-02-2022

Gammatone Wavelet Cepstral Coefficients for Robust Speech Recognition, Aniruddha Adiga, Mathew Magimai-Doss and Chandra Sekhar Seelamantula, in: Proceedings of IEEE TENCON, 2013

Kernelized Infomax Clustering, Felix Agakov and David Barber, Idiap-RR-73-2005

An Auxiliary Variational Method, Felix Agakov and David Barber, Idiap-RR-86-2004

Variational Information Maximization in Gaussian Channels, Felix Agakov and David Barber, Idiap-RR-88-2004

GLoFool: global enhancements and local perturbations to craft adversarial images, Mirko Agarla and Andrea Cavallaro, in: Proceedings of the European Conference on Computer Vision (ECCV) Workshops, 2024

Findings of the IWSLT 2023 evaluation campaign, Milind Agarwal, Sweta Agarwal, Antonios Anastasopoulos, Luisa Bentivogli, Ondrej Bojar, Claudia Borg, Marine Carpuat, Roldano Cattoni, Mauro Cettolo, Mingda Chen, William Chen, Khalid Choukri, Alexandra Chronopoulou, Anna Currey, Thierry Declerck, Qianqian Dong, Kevin Duh, Yannick Esteve, Marcello Federico, Souhir Gahbiche, Barry Haddow, Benjamin Hsu, Phu Mon Htut, Hirofumi Inaguma, David Javorsky, John Judge, Yasumasa Kano, Tom Ko, Rishu Kumar, Pengwei Li, Xutai Ma, Prashant Mathur, Evgeny Matusov, Paul McNamee, John P. McCrae, Kenton Murray, Maria Nadejde, Satoshi Nakamura, Matteo Negri, Ha Nguyen, Jan Niehues, Xing Niu, Atul Kr. Ojha, John E. Ortega, Proyag Pal, Juan Pino, Lonneke van der Plas, Peter Polak, Elijah Rippeth, Elizabeth Salesky, Jiatong Shi, Matthias Sperber, Sebastian Stuker, Katsuhito Sudoh, Yun Tang, Brian Thompson, Kevin Tran, Marco Turchi, Alex Waibe, Mingxuan Wang, Shinji Watanabe and Rodolfo Zevallos, in: Proceedings of the IWSLT conference, 2023

Missed Opportunities in Building Energy Performance Assessment, Minu Agarwal, Parag Cameron-Rastogi, Giuseppe Peronato and Georgios Mavromatidis, in: Journal of Sustainable Real Estate, 16(1), 2024

[DOI]

Vision-Language Pretraining: Current Trends and the Future, Aishwarya Agrawal, Damien Teney and Aida Nematzadeh, in: Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics: Tutorial Abstracts, 2022

[URL]

Entity Matching Across Small Networks Using Node Attributes, Zahra Ahmadi, Zijian Zhang, Hoang H. Nguyen, Sergio Burdisso, Srikanth Madikeri, Petr Motlicek, Erinc Dikici, Gerhard Backfried, Marek Kovac and Daniel Kudenko, in: ECAI 2024 - 27th European Conference on Artificial Intelligence, October 19-24, 2024, Santiago de Compostela, Spain - Including 13th Conference on Prestigious Applications of Intelligent Systems (PAIS 2024), Proceedings, 2024

[DOI]

Validating Automatic Speech Recognition and Understanding for Pre-Filling Radar Labels-Increasing Safety While Reducing Air Traffic Controllers' Workload, Nils Ahrenhold, Hartmut Helmke, Thorsten Mühlhausen, Oliver Ohneiser, Matthias Kleinert, heiko Ehr, Lucas Klamert and Juan Zuluaga-Gomez, in: Aerospace, 10(6):538, 2023

[DOI]

HMM inference towards flexible speech recognition, Ait-Hassou Aissa, Idiap-Com-03-2003

Improved Unknown-Multiple Speaker clustering using HMM, Jitendra Ajmera, Hervé Bourlard and I. Lapidot, Idiap-RR-23-2002

Unknown-Multiple Speaker clustering using HMM, Jitendra Ajmera, Hervé Bourlard, I. Lapidot and Iain A. McCowan, in: ICSLP, 2002

Unknown-Multiple Speaker clustering using HMM, Jitendra Ajmera, Hervé Bourlard, I. Lapidot and Iain A. McCowan, Idiap-RR-07-2002

Clustering And Segmenting Speakers And Their Locations In Meetings, Jitendra Ajmera, Guillaume Lathoud and Iain A. McCowan, in: ICASSP, 2004

Clustering And Segmenting Speakers And Their Locations In Meetings, Jitendra Ajmera, Guillaume Lathoud and Iain A. McCowan, Idiap-RR-55-2003

An Online Audio Indexing System, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, 2004

Robust Audio Segmentation, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, Idiap-RR-35-2004

Robust Audio Segmentation, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, École Polytechnique Fédérale de Lausanne, 2004

Robust Speaker Change Detection, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, in: IEEE Signal Processing Letters (to appear), 2003

Speech/Music Discrimination using Entropy and Dynamism Features in a HMM Classification Framework, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, in: Speech Communication, 40, 2003

An Online Audio Indexing System, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, Idiap-RR-39-2003

Robust HMM-Based Speech/Music Segmentation, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, in: ICASSP, 2002

Robust Speaker Change Detection, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, Idiap-RR-39-2002

Robust HMM-Based Speech/Music Segmentation, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, Idiap-RR-33-2001

Speech/Music Discrimination using Entropy and Dynamism Features in a HMM Classification Framewor, Jitendra Ajmera, Iain A. McCowan and Hervé Bourlard, Idiap-RR-26-2001

A Robust Speaker Clustering Algorithm, Jitendra Ajmera and Charles Wooters, in: IEEE Automatic Speech Recognition Understanding Workshop, 2003

A Robust Speaker Clustering Algorithm, Jitendra Ajmera and Charles Wooters, Idiap-RR-38-2003

Biometrics: In Search of Identity and Security (Q & A), Zahid Akhtar, Abdenour Hadid, Mark Nixon, Massimo Tistarelli, Jean-Luc Dugelay and Sébastien Marcel, in: IEEE MultiMedia, PP, 2017

[DOI]

Multimodal Integration for Meeting Group Action Segmentation and Recognition, Marc Al-Hames, Alfred Dielmann, Daniel Gatica-Perez, Stephan Reiter, Steve Renals and Dong Zhang, in: MLMI, 2005

Multimodal Integration for Meeting Group Action Segmentation and Recognition, Marc Al-Hames, Alfred Dielmann, Daniel Gatica-Perez, Stephan Reiter, Steve Renals and Dong Zhang, Idiap-RR-31-2005

Finding Audio-Visual Events in Informal Social Gatherings, Xavier Alameda-Pineda, Vasil Khalidov, Radu Horaud and Florence Forbes, in: IEEE/ACM 13th International Conference on Multimodal Interaction, 2011

Gesture control interface for immersive panoramic displays, Marcel Alcoverro, Xavier Suau, Adolfo Lopez-Mendez, Josep R. Morros, Javier Ruiz-Hidalgo, Albert Gil and Josep R. Casas, in: Multimedia Tools and Applications, 1380-7501:1-27, 2013

[DOI]

Weakly-supervised Autism Severity Assessment in Long Videos, Abid Ali, Mahmoud Ali, Camilla Barbini, Séverine Dubuisson, Jean-Marc Odobez, Francois Bremond and Suzanne Thümmler, in: International Conference on Content-based Multimedia Indexing, 2024

Loose Social-Interaction Recognition in Real-world Therapy Scenarios, Abid Ali, Rui Dai, Ashish Marisetty, Guillaume Astruc, Monique Thonnat, Jean-Marc Odobez, Suzanne Thümmler and Francois Bremond, in: IEEE/CVF Winter Conference on Applications of Computer Vision, 2025

A real-time deformable detector., Karim Ali, Francois Fleuret, David Hasler and Pascal Fua, in: IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012

Joint Pose Estimator and Feature Learning for Object Detection, Karim Ali, Francois Fleuret, David Hasler and Pascal Fua, in: Proceedings of the IEEE International Conference on Computer Vision, 2009

FlowBoost - Appearance Learning from Sparsely Annotated Video, Karim Ali, David Hasler and Francois Fleuret, in: Proceedings of the IEEE international conference on Computer Vision and Pattern Recognition, 2011

Learning from demonstrations with partially observable task parameters, T. Alizadeh, Sylvain Calinon and D. G. Caldwell, in: Proc. IEEE Intl Conf. on Robotics and Automation (ICRA), Hong Kong, pages 3309 - 3314, IEEE, 2014

[DOI]

CARMA: Enhanced Compositionality in LLMs via Advanced Regularisation and Mutual Information Alignment, Nura Aljaafari, Danilo Carvalho and Andre Freitas, in: The 2025 Conference on Empirical Methods in Natural Language Processing, 2025

TRACE: Training and Inference-Time Interpretability Analysis for Language Models, Nura Aljaafari, Danilo Carvalho and Andre Freitas, in: Demonstration at the 2025 Conference on Empirical Methods in Natural Language Processing, 2025

Effective Graph and Rank-based Contextual Embeddings for Textual and Multimedia Data, Thiago Almeida, Gustavo Leticio, Lucas Pascotti, Andre Freitas and Daniel Pedronette, in: International Joint Conference on Neural Networks, 2025

Brain-Machine Interfaces through Control of Electroencephalographic Signals and Vibrotactile Feedback, F. Aloise, N. Caporusso, D. Mattia, F. Babiloni, L. Kauhanen, José del R. Millán, Marnix Nuttin, M. G. Marciani and F. Cincotti, in: Proceedings of the 12th International Conference on Human-Computer Interaction, 2007