Publication list - Idiap Publications

Spoofing Attacks To 2D Face Recognition Systems With 3D Masks, Nesli Erdogmus and Sébastien Marcel, Idiap-RR-42-2013

Body communicative cue extraction for conversational analysis, Alvaro Marcos-Ramiro, Daniel Pizarro-Perez, Marta Marron-Romera, Laurent Son Nguyen and Daniel Gatica-Perez, in: Proceedings of IEEE International Conference on Automatic Face and Gesture Recognition, 2013

Structured Sparse Acoustic Modeling for Speech Separation, Afsaneh Asaei, Mohammad Golbabaee, Hervé Bourlard and Volkan Cevher, in: Signal Processing with Adaptive Sparse Structured Representations SPARS, SPARS, 2013

Model-based Sparse Component Analysis for Multiparty Distant Speech Recognition, Afsaneh Asaei, École Polytechnique Fédérale de Lausanne, 2013

A Multipath Sparse Beamfroming Method, Afsaneh Asaei, Bhiksha Raj, Hervé Bourlard and Volkan Cevher, in: Signal Processing with Adaptive Sparse Structured Representations SPARS, 2013

A Track Creation and Deletion Framework for Long-Term Online Multi-Face Tracking, Stefan Duffner and Jean-Marc Odobez, in: IEEE Transactions on Image Processing, 2013

Parameter Estimation and Contextual Adaptation for a Multi-Object Tracking CRF Model, Alexandre Heili and Jean-Marc Odobez, in: IEEE Workshop on Performance Evaluation of Tracking and Surveillance, 2013

I4U Submission to NIST SRE 2012: a large-scale collaborative effort for noise-robust speaker verification, Rahim Saedi, Kong Aik Lee, Tomi Kinnunen, Tawfik Hasan, Benoit Fauve, Pierre-Michel Bousquet, Elie Khoury, Pablo Luis Sordo Martinez, Jia Min Karen Kua, Changhuai You, Hanwu Sun, Anthony Larcher, Padmanabhan Rajan, Ville Hautamäki, Cemal Hanilci, Billy Braithwaite, Gonzalez-Hautamäki Rosa, Seyed Omid Sadjadi, Gang Liu, Hynek Boril, Navid Shokouhi, Driss Matrouf, Laurent El Shafey, Pejman Mowlaee, Julien Epps, Tharmarajah Thiruvaran, David Van Leeuwen, Bin Ma, Haizhou Li, John Hansen, Jean-François Bonastre, Sébastien Marcel, John Mason and Eliathamby Ambikairajah, Idiap-RR-34-2013

A Simple Continuous Pitch Estimation Algorithm, Philip N. Garner, Milos Cernak and Petr Motlicek, in: IEEE Signal Processing Letters, 20(1):102--105, 2013

[URL]

treeKL: A distance between high dimension empirical distributions, Riwal Lefort and Francois Fleuret, in: Pattern Recognition Letters, 34(2):140-145, 2013

ON THE (UN)IMPORTANCE OF THE CONTEXTUAL FACTORS IN HMM-BASED SPEECH SYNTHESIS AND CODING, Milos Cernak, Petr Motlicek and Philip N. Garner, Idiap-RR-06-2013

A Sequential Topic Model for Mining Recurrent Activities from Long Term Video Logs, Jagannadan Varadarajan, Remi Emonet and Jean-Marc Odobez, in: International Journal of Computer Vision, 103(1):100-126, 2013

MediaParl: Bilingual mixed language accented speech database, David Imseng, Hervé Bourlard, Holger Caesar, Philip N. Garner, Gwénolé Lecorvé and Alexandre Nanchen, Idiap-RR-03-2013

Computing Text Semantic Relatedness using the Contents and Links of a Hypertext Encyclopedia, Majid Yazdani and Andrei Popescu-Belis, in: Artificial Intelligence Journal, 194:176–202, 2013

[DOI]

Robust triphone mapping for acoustic modeling, Milos Cernak, David Imseng and Hervé Bourlard, Idiap-RR-02-2013

Comparing different acoustic modeling techniques for multilingual boosting, David Imseng, John Dines, Petr Motlicek, Philip N. Garner and Hervé Bourlard, Idiap-RR-01-2013

Notes on Probabilistic Linear Discriminant Analysis, Chris McCool and Laurent El Shafey, Idiap-Com-03-2013

Session Variability Modelling for Face Authentication, Chris McCool, Roy Wallace, Mitchell McLaren, Laurent El Shafey and Sébastien Marcel, Idiap-RR-17-2013

Generating Exact Lattices in The WFST Framework, Daniel Povey, Mirko Hannemann, Gilles Boulianne, Lukas Burget, Arnab Ghoshal, Milos Janda, Martin Karafiat, Stefan Kombrink, Petr Motlicek, Yanmin Qian, Korbinian Riedhammer, Karel Vesely and Ngoc Thang Vu, in: Proceedings of 2012 IEEE International Conference on Acoustics, Speech and Signal Processing., The 37th International Conference on Acoustics, Speech, and Signal Processing, Kyoto, JP, Kyoto, Japan, pages 4213-4216, IEEE Signal Processing Societ, 2012

[DOI]

Statistical Shape Descriptors for Ancient Maya Hieroglyphs Analysis, Edgar Roman-Rangel, École Polytechnique Fédérale de Lausanne, 2012

Regularized Bundle Methods for Convex and Non-Convex Risks, Trinh-Minh-Tri Do and Thierry Artieres, in: Journal of Machine Learning Research, 13:3539-3583, 2012

A Probabilistic Approach to Mining Mobile Phone Data Sequences, Katayoun Farrahi and Daniel Gatica-Perez, in: Personal and Ubiquitous Computing, 2012

Unified Framework Of Feature Based Adaptation For Statistical Speech Synthesis And Recognition, Lakshmi Saheer, Ecole Polytechnique Federale de Lausanne (EPFL), 2012

Data-Driven Enhancement of State Mapping-Based Cross-Lingual Speaker Adaptation, Hui Liang, Idiap-RR-38-2012

A Probabilistic Framework for Multiple Speaker Localization, Youssef Oualil, Mathew Magimai-Doss, Friedrich Faubel and Dietrich Klakow, Idiap-RR-37-2012

FaceTube: predicting personality from facial expressions of emotion in online conversational video, Joan-Isaac Biel, Lucia Teijeiro-Mosquera and Daniel Gatica-Perez, in: Proceedings International Conference on Multimodal Interfaces (ICMI-MLMI), 2012

Speaker Diarization and Linking of Large Corpora, Marc Ferras and Hervé Bourlard, in: Proceedings of the IEEE Workshop on Spoken Language Technology, 2012

Robot-to-group Interaction in a Vernissage: Architecture & Dataset for Multi-party Dialog, David Klotz, Johannes Wienke, Britta Wrede, Sebastian Wrede, Samira Sheikhi, Dinesh Babu Jayagopi, Vasil Khalidov and Jean-Marc Odobez, in: Proceedings of 5th International Conference on Cognitive Systems, 2012

Implementing Neural Networks Efficiently, Ronan Collobert, Koray Kavukcuoglu and Clément Farabet, in: Neural Networks: Tricks of the Trade, Springer, 2012

Deep Learning via Semi-Supervised Embedding, Jason Weston, Frédéric Ratle, Hossein Mobahi and Ronan Collobert, in: In Neural Networks: Tricks of the Trade, Springer, 2012

A Method, Apparatus and Computer Program for Determining the Location of a Plurality of Speech Source, Afsaneh Asaei, Hervé Bourlard and Volkan Cevher, in: 2012US-13/654055, 2012

[URL]

Unsupervised Activity Analysis and Monitoring algorithms for Effective Surveillance Systems, Jean-Marc Odobez, C. Carincotte, Remi Emonet, E. Jouneau, Sofia Zaidenberg, Bertrand Raverra, Francois Bremond and Andrea Grifoni, in: European Conference on Computer Vision, 2012

Sampling techniques for audio-visual tracking and head pose estimation, Jean-Marc Odobez and Oswald Lanz, in: Multimodal Signal Processing: Human Interactions in Meetings, pages 84-102, Cambridge University Press, 2012

Recognizing the Visual Focus of Attention for Human Robot Interaction, Samira Sheikhi, Vasil Khalidov and Jean-Marc Odobez, in: IEEE International Conference on Intelligent Robots and Systems (IROS) - Human Behavior Understanding Workshop(IROS-HBU), 2012

Investigating the Midline Effect for Visual Focus of Attention Recognition, Samira Sheikhi and Jean-Marc Odobez, in: Int Conf. on Multimodal Interaction (ICMI), Santa Monica, 2012

The I4U Submission to the 2012 NIST Speaker Recognition Evaluation, Kong Aik Lee, Rahim Saedi, Tawfik Hasan, Tomi Kinnunen, Benoit Fauve, Pierre-Michel Bousquet, Elie Khoury, Pablo Luis Sordo Martinez, Tharmarajah Thiruvaran, Changhuai You, Padmanabhan Rajan, David Van Leeuwen, Seyed Omid Sadjadi, Driss Matrouf, Laurent El Shafey, John Mason, Eliathamby Ambikairajah, Hanwu Sun, Anthony Larcher, Bin Ma, Ville Hautamäki, Cemal Hanilci, Billy Braithwaite, Gonzalez-Hautamäki Rosa, Gang Liu, Hynek Boril, Navid Shokouhi, John Hansen, Jean-François Bonastre and Sébastien Marcel, in: NIST Speaker Recognition Conference, 2012

Together Anywhere, Together Anytime, Technologies for Intimate Interactions, Dick C. A. Bulterman, Petr Motlicek, Stefan Duffner and Danil Korchagin, Centrum Wiskunde & Informatica, 2012

IMPROVING ACOUSTIC BASED KEYWORD SPOTTING USING LVCSR LATTICES, Petr Motlicek, Fabio Valente and Igor Szoke, in: Proceedings on IEEE International Conference on Acoustics, Speech and Signal Processing, IEEE, Japan, pages 4413-4416, 2012

IMPROVING ACOUSTIC BASED KEYWORD SPOTTING USING LVCSR LATTICES, Petr Motlicek, Fabio Valente and Igor Szoke, Idiap-RR-36-2012

ICB 2013 - Competition on speaker recognition in mobile environment using the MOBIO database: The Evaluation Plan, Elie Khoury, Sébastien Marcel and Manuel Günther, Idiap-Com-04-2012

The Idiap Speaker Recognition Evaluation System at NIST SRE 2012, Elie Khoury, Laurent El Shafey and Sébastien Marcel, in: NIST Speaker Recognition Conference, NIST, Orlando, USA, 2012

Automatic Social Role Recognition In Professional Meetings, A. Sapru and Hervé Bourlard, Idiap-RR-35-2012

Bi-Modal Authentication in Mobile Environments Using Session Variability Modelling, Petr Motlicek, Laurent El Shafey, Roy Wallace, Chris McCool and Sébastien Marcel, in: Proceedings of the 21st International Conference on Pattern Recognition, 2012

Face Verification using Gabor Filtering and Adapted Gaussian Mixture Models, Laurent El Shafey, Roy Wallace and Sébastien Marcel, in: Proceedings of the 11th International Conference of the Biometrics Special Interest Group, Darmstadt, Germany, pages 397-408, GI-Edition, 2012

Grapheme and Multilingual Posterior Features For Under-Resource Speech Recognition: A Study on Scottish Gaelic, Ramya Rasipuram, Peter Bell and Mathew Magimai-Doss, Idiap-RR-34-2012

Modeling dominance effects on nonverbal behaviors using granger causality, Kyriaki Kalimeri, Bruno Lepri, Oya Aran, Dinesh Babu Jayagopi, Daniel Gatica-Perez and Fabio Pianesi, in: Proceedings of International Conference on Multimodal Interaction, ICMI 2012, Santa Monica, CA, 2012

The TA2 Database – A Multi-Modal Database From Home Entertainment, Stefan Duffner, Petr Motlicek and Danil Korchagin, in: International Journal of Computer and Electrical Engineering, 4(5):670-673, 2012

[URL]

Real-time model learning using Incremental Sparse Spectrum Gaussian Process Regression, Arjan Gijsberts and Giorgio Metta, in: Neural Networks, 2012

Experiences in the Creation of an Electromyography Database to Help Hand Amputated Persons, Manfredo Atzori, Arjan Gijsberts, Simone Heynen, Anne-Gabrielle Mittaz Hager, Claudio Castellini, Barbara Caputo and Henning Müller, in: Proceedings of the 24th European Medical Informatics Conference, 2012

Bob: a free signal processing and machine learning toolbox for researchers, André Anjos, Laurent El Shafey, Roy Wallace, Manuel Günther, Chris McCool and Sébastien Marcel, in: Proceedings of the ACM Multimedia Conference, 2012

[URL]