Séquençage phonétique


Explorer les séquences de phonèmes fréquents à l’aide de motifs séquentiels

La fouille de données est une technique d'extraction de motifs, c’est-à-dire de récurrences intéressantes, utiles et parfois inattendues dans les bases de données afin de mieux les comprendre et qui peuvent être utilisées pour prendre des décisions.

Et dans notre cas ?
Nous avons extrait un type particulier de sous-séquences appelés motifs séquentiels et définis par (Srikant et Agrawal 1996). Ces motifs permettent d'identifier des récurrences de séquences de phonèmes par enfant. Par exemple, les données nous indiquent qu'Antoine utilise souvent le phoneme « s » en début de mot a l'âge de 4 ans et 9 jours.
Nous avons considéré comme séquences les enregistrements par enfant et par âge. Cela pour extraire des sous-séquences de phonèmes fréquentes dans cet ensemble de séquences. Les sous-séquences ont été extraites en fonction de leur fréquence d'occurrence que nous avons fixé manuellement à 170 occurrences.
support

SRIKANT R., AGRAWAL R., « Mining Sequential Patterns: Generalizations and Per-formance Improvements », Proceedings of the 5th International Conference on ExtendingDatabase Technology (EDBT’96), Avignon, France, September 1996, p. 3-17

Guide d'utilisation et de lecture de la visualisation Sunburst:
Cette visualisation est interactive ! Pour voir les phonèmes séquentiels d’un enfant ou d'un âge en particulier, il suffit de cliquer sur la case en question et de cliquer au centre du Sunburst pour revenir au plan précédent. Lorsque l'on choisit l'option avec filtre, l'étude est recentrée sur les mots contenant des phonèmes d’intérêt de la liste ci-contre qui nous a été donnée par nos commanditaires.
En ce qui concerne l'interprétation de l’étiquette, le phonème correspond à la partie située avant le "_", la deuxième partie correspond à l'emplacement de ce phonème dans le mot au sein duquel il a été prononcé :

  • "d" le phonème est en début de mot,
  • "m" le phonème est en milieu de mot,
  • "f" le phonème est en fin de mot.


  • Phonemes ciblés avec le filtre
    'b', 'bR', 'd', 'dR', 'f', 'fR', 'g', 'gR',
    'k', 'kR', 'p', 'pR', 'R', 't', 'tR'

    Cette étude a été réalisée avec l'aide de M. Alatrista-Salas et de la librairie pymining écrite par M. Infobart

    Contacts: h.alatristas[at]up.edu.pe, barthelemy[at]infobart.com