25 Sep CONFERENCE INTERSPEECH 2018
Seules quelques personnes ont eu la chance de présenter leur travail lors de la conférence Interspeech qui s’est tenue du 2 au 6 septembre 2018 à Hyderabad, en Inde. Interspeech est la conférence la plus vaste et la plus complète au monde sur la science du traitement du langage parlé.
Notre thésard, Titouan Parcollet, a été sélectionné pour présenter son article avec pour sujet : « Réseaux de neurones convolutionnels de quaternions pour la reconnaissance automatique bout à bout de la parole ». (Titre original « Quaternion Convolutional Neural Networks for End-to-End Automatic Speech Recognition »), co-écrit avec Yoshua Bengio, chercheur canadien spécialiste en Intelligence Artificielle.
Résumé de l’article : De nos jours, une des problématiques majeures des réseaux de neurones est de représenter le plus naturellement et efficacement possible la masse d’information à notre disposition, afin d’utiliser au maximum les données pour obtenir de meilleurs résultats. Etant une extension des nombres complexes, les quaternions sont quadridimensionnels et s’adaptent parfaitement à la représentation du signal acoustique, qui est traditionnellement tridimensionnel. Le système proposé se base sur des architectures modernes de réseaux neuronaux en utilisant exclusivement des quaternions à la place des nombres réels. Ainsi, la méthode proposée permet d’obtenir des résultats compétitifs tout en réduisant la taille des réseaux de neurones par 4 en comparaison de ceux basés sur l’algèbre des nombres réels et utilisés par l’état de l’art. Cette réduction a un impact direct sur l’empreinte mémoire de ces réseaux, permettant ainsi de les utiliser sur des systèmes embarqués qui en sont faiblement dotés.
Pour lire son article en entier, cliquez ici.
Vous avez des questions ? N’hésitez pas !