CONF Iuliia_INTERSPEECH_2023/IDIAP Implementing contextual biasing in GPU decoder for online ASR Iuliia, Nigmatulina Madikeri, Srikanth Villatoro-Tello, Esaú Motlicek, Petr Zuluaga-Gomez, Juan S, Karthik Pandia D Ganapathiraju, Aravind Contextual Adaptation finite-state transducers GPU decoding real-time speech recognition EXTERNAL http://publications.idiap.ch/attachments/papers/2023/Iuliia_INTERSPEECH_2023.pdf PUBLIC http://publications.idiap.ch/index.php/publications/showcite/Iuliia_Idiap-RR-02-2023 Related documents Proc. Interspeech 2023 2023 GPU decoding significantly accelerates the output of ASR predictions. While GPUs are already being used for online ASR decoding, post-processing and rescoring on GPUs have not been properly investigated yet. Rescoring with available contextual information can considerably improve ASR predictions. Previous studies have proven the viability of lattice rescoring in decoding and biasing language model (LM) weights in offline and online CPU scenarios. In real-time GPU decoding, partial recognition hypotheses are produced without lattice generation, which makes the implementation of biasing more complex. The paper proposes and describes an approach to integrate contextual biasing in real-time GPU decoding while exploiting the standard Kaldi GPU decoder. Besides the biasing of partial ASR predictions, our approach also permits dynamic context switching allowing a flexible rescoring per each speech segment directly on GPU. The code is publicly released1 and tested with open-sourced test sets. REPORT Iuliia_Idiap-RR-02-2023/IDIAP Implementing contextual biasing in GPU decoder for online ASR Iuliia, Nigmatulina Madikeri, Srikanth Villatoro-Tello, Esaú Motlicek, Petr Zuluaga-Gomez, Juan S, Karthik Pandia D Ganapathiraju, Aravind EXTERNAL http://publications.idiap.ch/attachments/reports/2023/Iuliia_Idiap-RR-02-2023.pdf PUBLIC Idiap-RR-02-2023 2023 Idiap May 2023 GPU decoding significantly accelerates the output of ASR predictions. While GPUs are already being used for online ASR decoding, post-processing and rescoring on GPUs have not been properly investigated yet. Rescoring with available contextual information can considerably improve ASR predictions. Previous studies have proven the viability of lattice rescoring in decoding and biasing language model (LM) weights in offline and online CPU scenarios. In real-time GPU decoding, partial recognition hypotheses are produced without lattice generation, which makes the implementation of biasing more complex. The paper proposes and describes an approach to integrate contextual biasing in real-time GPU decoding while exploiting the standard Kaldi GPU decoder. Besides the biasing of partial ASR predictions, our approach also permits dynamic context switching allowing a flexible rescoring per each speech segment directly on GPU. The code is publicly released1 and tested with open-sourced test sets.

</datafield>

<subfield code="a">Iuliia_INTERSPEECH_2023/IDIAP</subfield>

</datafield>

<subfield code="a">Implementing contextual biasing in GPU decoder for online ASR</subfield>

</datafield>

<subfield code="a">Iuliia, Nigmatulina</subfield>

</datafield>

<subfield code="a">Madikeri, Srikanth</subfield>

</datafield>

<subfield code="a">Villatoro-Tello, Esaú</subfield>

</datafield>

<subfield code="a">Motlicek, Petr</subfield>

</datafield>

<subfield code="a">Zuluaga-Gomez, Juan</subfield>

</datafield>

<subfield code="a">S, Karthik Pandia D</subfield>

</datafield>

<subfield code="a">Ganapathiraju, Aravind</subfield>

</datafield>

<subfield code="a">Contextual Adaptation</subfield>

</datafield>

<subfield code="a">finite-state transducers</subfield>

</datafield>

<subfield code="a">GPU decoding</subfield>

</datafield>

<subfield code="a">real-time speech recognition</subfield>

</datafield>

<subfield code="i">EXTERNAL</subfield>

<subfield code="u">http://publications.idiap.ch/attachments/papers/2023/Iuliia_INTERSPEECH_2023.pdf</subfield>

<subfield code="x">PUBLIC</subfield>

</datafield>

<subfield code="u">http://publications.idiap.ch/index.php/publications/showcite/Iuliia_Idiap-RR-02-2023</subfield>

<subfield code="z">Related documents</subfield>

</datafield>

<subfield code="a">Proc. Interspeech 2023</subfield>

</datafield>

</datafield>

<subfield code="a">GPU decoding significantly accelerates the output of ASR predictions. While GPUs are already being used for online ASR decoding, post-processing and rescoring on GPUs have not been properly investigated yet. Rescoring with available contextual information can considerably improve ASR predictions. Previous studies have proven the viability of lattice rescoring in decoding and biasing language model (LM) weights in offline and online CPU scenarios. In real-time GPU decoding, partial recognition hypotheses are produced without lattice generation, which makes the implementation of biasing more complex. The paper proposes and describes an approach to integrate contextual biasing in real-time GPU decoding while exploiting the standard Kaldi GPU decoder. Besides the biasing of partial ASR predictions, our approach also permits dynamic context switching allowing a flexible rescoring per each speech segment directly on GPU. The code is publicly released1 and tested with open-sourced test sets.</subfield>

</datafield>

</record>

<subfield code="a">REPORT</subfield>

</datafield>

<subfield code="a">Iuliia_Idiap-RR-02-2023/IDIAP</subfield>

</datafield>

<subfield code="a">Implementing contextual biasing in GPU decoder for online ASR</subfield>

</datafield>

<subfield code="a">Iuliia, Nigmatulina</subfield>

</datafield>

<subfield code="a">Madikeri, Srikanth</subfield>

</datafield>

<subfield code="a">Villatoro-Tello, Esaú</subfield>

</datafield>

<subfield code="a">Motlicek, Petr</subfield>

</datafield>

<subfield code="a">Zuluaga-Gomez, Juan</subfield>

</datafield>

<subfield code="a">S, Karthik Pandia D</subfield>

</datafield>

<subfield code="a">Ganapathiraju, Aravind</subfield>

</datafield>

<subfield code="i">EXTERNAL</subfield>

<subfield code="u">http://publications.idiap.ch/attachments/reports/2023/Iuliia_Idiap-RR-02-2023.pdf</subfield>

<subfield code="x">PUBLIC</subfield>

</datafield>

<subfield code="a">Idiap-RR-02-2023</subfield>

</datafield>

<subfield code="b">Idiap</subfield>

</datafield>

</datafield>

</datafield>

</record>

</collection>