Logo Logo
Help
Contact
Switch language to German
Relation between acoustic and articulatory dimensions of speech sounds
Relation between acoustic and articulatory dimensions of speech sounds
In their daily communication, speakers produce speech by pushing a controlled air stream past their vocal folds and through a vocal tract configuration formed by a set of articulators which ultimately results in a certain acoustic output. In this sense, speech and, specifically, speech sounds can be understood as a relation between articulatory and acoustic dimensions. This idea is supported by more recent neuroimaging results which suggest that sensory representations of speech sounds are stored across auditory and somatosensory cortices and are characterized by neural auditory-somatosensory mappings. The overall aim of the current dissertation is to improve our understanding of the functional nature of this relation. To this end, this thesis investigates the influence of a stronger linguo-palatal contact on speakers’ ability to employ multiple concurrent compensatory strategies during production of vowels and fricatives. During the data analysis, speakers’ individual as well as average compensatory behavior is investigated by means of generalized additive mixed models (GAMM) and a supervised classification algorithm (random forest). A framework is then developed that allows to estimate the extent of spectral adaptations in vowels and fricatives and to draw a direct comparison between these sounds. The experimental results are discussed in the context of current speech production theories and agree with the overall idea that speech sounds are perceptuo-motor units comprising of articulatory movements which are shaped by perceptual properties and selected for their functional value for communication., Sprecher produzieren Sprachlaute, indem sie einen kontrollierten Luftstrom vorbei an ihren Stimmlippen und durch eine artikulatorische Konfiguration führen, was letztendlich in einem bestimmten akustischen Ergebnis mündet. In diesem Sinne können Sprachlaute als Relationen zwischen der artikulatorischen und der akustischen Dimension verstanden werden. Diese allgemeine Vorstellung wird durch die Ergebnisse der Neuroforschung gestützt, die darauf hindeuten, dass sensorische Repräsentationen von Sprachlauten sowohl im auditiven als auch somatosensorischen Cortex gespeichert werden und sich durch neuronale auditiv-somatosensorische Zuordnungen auszeichnen. Das übergeordnete Ziel der vorliegenden Dissertation ist es, unser Verständnis von der Funktionsweise dieser Relationen zu verbessern. Dazu untersucht die Arbeit den Einfluss eines stärkeren linguo-palatalen Kontakts auf die Fähigkeit der Sprecher, mehrere Kompensationsstrategien bei der Produktion von Vokalen und Frikativen gleichzeitig anzuwenden. Bei der Datenanalyse wird sowohl das individuelle als auch das durchschnittliche Kompensationsverhalten der Sprecher mittels verallgemeinerter additiver gemischter Modelle (GAMM) sowie eines überwachten Klassifizierungsalgorithmus (Random Forest) untersucht. Dabei wird ein Rahmenwerk entwickelt, das erlaubt das Ausmaß der spektralen Anpassungen bei Vokalen und Frikativen zu untersuchen und miteinander zu vergleichen. Die experimentellen Ergebnisse werden im Rahmen aktueller Sprachproduktionstheorien diskutiert und stimmen insgesamt mit der Vorstellung überein, dass Sprachlaute perzeptuell-motorische Einheiten sind, denen Artikulationsbewegungen zu Grunde liegen, die durch perzeptuelle Eigenschaften beeinflusst und geformt werden.
auditory perturbation, articulatory-to-acoustic mapping, sound representations, vowels, fricatives
Klein, Eugen
2020
English
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Klein, Eugen (2020): Relation between acoustic and articulatory dimensions of speech sounds. Dissertation, LMU München: Faculty for Languages and Literatures
[img]
Preview
PDF
Klein_Eugen.pdf

3MB

Abstract

In their daily communication, speakers produce speech by pushing a controlled air stream past their vocal folds and through a vocal tract configuration formed by a set of articulators which ultimately results in a certain acoustic output. In this sense, speech and, specifically, speech sounds can be understood as a relation between articulatory and acoustic dimensions. This idea is supported by more recent neuroimaging results which suggest that sensory representations of speech sounds are stored across auditory and somatosensory cortices and are characterized by neural auditory-somatosensory mappings. The overall aim of the current dissertation is to improve our understanding of the functional nature of this relation. To this end, this thesis investigates the influence of a stronger linguo-palatal contact on speakers’ ability to employ multiple concurrent compensatory strategies during production of vowels and fricatives. During the data analysis, speakers’ individual as well as average compensatory behavior is investigated by means of generalized additive mixed models (GAMM) and a supervised classification algorithm (random forest). A framework is then developed that allows to estimate the extent of spectral adaptations in vowels and fricatives and to draw a direct comparison between these sounds. The experimental results are discussed in the context of current speech production theories and agree with the overall idea that speech sounds are perceptuo-motor units comprising of articulatory movements which are shaped by perceptual properties and selected for their functional value for communication.

Abstract

Sprecher produzieren Sprachlaute, indem sie einen kontrollierten Luftstrom vorbei an ihren Stimmlippen und durch eine artikulatorische Konfiguration führen, was letztendlich in einem bestimmten akustischen Ergebnis mündet. In diesem Sinne können Sprachlaute als Relationen zwischen der artikulatorischen und der akustischen Dimension verstanden werden. Diese allgemeine Vorstellung wird durch die Ergebnisse der Neuroforschung gestützt, die darauf hindeuten, dass sensorische Repräsentationen von Sprachlauten sowohl im auditiven als auch somatosensorischen Cortex gespeichert werden und sich durch neuronale auditiv-somatosensorische Zuordnungen auszeichnen. Das übergeordnete Ziel der vorliegenden Dissertation ist es, unser Verständnis von der Funktionsweise dieser Relationen zu verbessern. Dazu untersucht die Arbeit den Einfluss eines stärkeren linguo-palatalen Kontakts auf die Fähigkeit der Sprecher, mehrere Kompensationsstrategien bei der Produktion von Vokalen und Frikativen gleichzeitig anzuwenden. Bei der Datenanalyse wird sowohl das individuelle als auch das durchschnittliche Kompensationsverhalten der Sprecher mittels verallgemeinerter additiver gemischter Modelle (GAMM) sowie eines überwachten Klassifizierungsalgorithmus (Random Forest) untersucht. Dabei wird ein Rahmenwerk entwickelt, das erlaubt das Ausmaß der spektralen Anpassungen bei Vokalen und Frikativen zu untersuchen und miteinander zu vergleichen. Die experimentellen Ergebnisse werden im Rahmen aktueller Sprachproduktionstheorien diskutiert und stimmen insgesamt mit der Vorstellung überein, dass Sprachlaute perzeptuell-motorische Einheiten sind, denen Artikulationsbewegungen zu Grunde liegen, die durch perzeptuelle Eigenschaften beeinflusst und geformt werden.