CONF Rasipuram_ICANN2011_2011/IDIAP Improving Articulatory Feature and Phoneme Recognition using Multitask Learning Rasipuram, Ramya Magimai-Doss, Mathew articulatory features multilayer perceptron multitask learning posterior probabilities Artificial Neural Networks and Machine Learning - ICANN 2011 Lecture Notes in Computer Science 6791 299-306 2011 Springer Berlin / Heidelberg http://www.springerlink.com/content/779304480w372682/ URL 10.1007/978-3-642-21735-7_37 doi Speech sounds can be characterized by articulatory features. Articulatory features are typically estimated using a set of multilayer perceptrons (MLPs), i.e., a separate MLP is trained for each articulatory feature. In this paper, we investigate multitask learning (MTL) approach for joint estimation of articulatory features with and without phoneme classification as subtask. Our studies show that MTL MLP can estimate articulatory features compactly and efficiently by learning the inter-feature dependencies through a common hidden layer representation. Furthermore, adding phoneme as subtask while estimating articulatory features improves both articulatory feature estimation and phoneme recognition. On TIMIT phoneme recognition task, articulatory feature posterior probabilities obtained by MTL MLP achieve a phoneme recognition accuracy of 73.2%, while the phoneme posterior probabilities achieve an accuracy of 74.0%.

</datafield>

<subfield code="a">Rasipuram_ICANN2011_2011/IDIAP</subfield>

</datafield>

<subfield code="a">Improving Articulatory Feature and Phoneme Recognition using Multitask Learning</subfield>

</datafield>

<subfield code="a">Rasipuram, Ramya</subfield>

</datafield>

<subfield code="a">Magimai-Doss, Mathew</subfield>

</datafield>

<subfield code="a">articulatory features</subfield>

</datafield>

<subfield code="a">multilayer perceptron</subfield>

</datafield>

<subfield code="a">multitask learning</subfield>

</datafield>

<subfield code="a">posterior probabilities</subfield>

</datafield>

<subfield code="a">Artificial Neural Networks and Machine Learning - ICANN 2011</subfield>

</datafield>

<subfield code="a">Lecture Notes in Computer Science</subfield>

</datafield>

</datafield>

<subfield code="b">Springer Berlin / Heidelberg</subfield>

</datafield>

<subfield code="u">http://www.springerlink.com/content/779304480w372682/</subfield>

</datafield>

</datafield>

<subfield code="a">Speech sounds can be characterized by articulatory features. Articulatory features are typically estimated using a set of multilayer perceptrons (MLPs), i.e., a separate MLP is trained for each articulatory feature. In this paper, we investigate multitask learning (MTL) approach for joint estimation of articulatory features with and without phoneme classification as subtask. Our studies show that MTL MLP can estimate articulatory features compactly and efficiently by learning the inter-feature dependencies through a common hidden layer representation. Furthermore, adding phoneme as subtask while estimating articulatory features improves both articulatory feature estimation and phoneme recognition. On TIMIT phoneme recognition task, articulatory feature posterior probabilities obtained by MTL MLP achieve a phoneme recognition accuracy of 73.2%, while the phoneme posterior probabilities achieve an accuracy of 74.0%.</subfield>

</datafield>

</record>

</collection>