Logo Logo
Help
Contact
Switch language to German
EMU Speech Database System. praxisorientierte Weiterentwicklung der Funktionalität, Benutzerfreundlichkeit und Interoperabilität sowie die Aufbereitung des Kiel Corpus als EMU-Sprachdatenbank
EMU Speech Database System. praxisorientierte Weiterentwicklung der Funktionalität, Benutzerfreundlichkeit und Interoperabilität sowie die Aufbereitung des Kiel Corpus als EMU-Sprachdatenbank
Gegenstand dieser Dissertation ist die Weiterentwicklung des bereits bestehenden EMU Speech Database Systems, das Forscher und Studierende der Phonetik und Linguistik beim Aufbau, der Etikettierung, der Abfrage sowie der Analyse von Sprachdatenbanken unterstützt. EMU kann akustische als auch artikulatorische Daten verarbeiten und sticht besonders durch die umfangreichen Strukturierungsmöglichkeiten für die Etikettierung, der darauf angepassten Abfragesprache, der Schnittstellte zu R und durch die zentrale Verwaltung der Daten gegenüber anderer vergleichbarer Software hervor. In Hinsicht auf die Benutzerfreundlichkeit wurden gänzlich fehlende oder lückenhafte Dokumentationen des Systems für interne als auch externe Strukturen erstellt. Für bereits vorhandene Funktionen, die nur textbasiert verwendet werden konnten, wurden grafische Benutzerschnittstellen implementiert und die Verwendung somit vereinfacht. Im Rahmen der Funktionalitätserweiterung wurden u. a. die Scripting-Möglichkeiten des Systems auf verschiedene Weisen erweitert und grundsätzlich neue Funktionen hinzugefügt. Die Erweiterung der Interoperabilität wurde durch eine Funktionalität zum Datenbankenimport und -export über indirekte und direkte Schnittstellen zu den Programmen Praat, WaveSurfer sowie Articulate Assistant realisiert. Weiterhin wurde das Kiel Corpus in eine EMU-Sprachdatenbank überführt. In dieser Form ist es nunmehr in einer hierarchischen Etikettierungsstruktur sehr gut darstellbar, benutzerfreundlich abfragbar und damit einhergehend analysierbar. Für die weitere Entwicklung des Systems wird die Überführung des EMU-Datenmodells in ein relationales vorgeschlagen, da bei geeigneter Modellierung nachweislich die Abfrage auf große Datenkorpora zeitlich effizienter wird und die Abfragemöglichkeiten erweitert werden. Die Weiterentwicklungen haben die Software für die Lehre und Forschung effizient einsetzbar gemacht. EMU kann damit für sehr viel mehr Anwender einen wichtigen Arbeitsschritt innerhalb des eigenen Arbeitsprozesses zur Lösung von Forschungsfragen darstellen.
EMU, Datenbank, Phonetik, Hierarchische Annotation, Kiel Corpus
John, Tina
2012
German
Universitätsbibliothek der Ludwig-Maximilians-Universität München
John, Tina (2012): EMU Speech Database System: praxisorientierte Weiterentwicklung der Funktionalität, Benutzerfreundlichkeit und Interoperabilität sowie die Aufbereitung des Kiel Corpus als EMU-Sprachdatenbank. Dissertation, LMU München: Faculty for Languages and Literatures
[thumbnail of John_Tina.pdf]
Preview
PDF
John_Tina.pdf

11MB

Abstract

Gegenstand dieser Dissertation ist die Weiterentwicklung des bereits bestehenden EMU Speech Database Systems, das Forscher und Studierende der Phonetik und Linguistik beim Aufbau, der Etikettierung, der Abfrage sowie der Analyse von Sprachdatenbanken unterstützt. EMU kann akustische als auch artikulatorische Daten verarbeiten und sticht besonders durch die umfangreichen Strukturierungsmöglichkeiten für die Etikettierung, der darauf angepassten Abfragesprache, der Schnittstellte zu R und durch die zentrale Verwaltung der Daten gegenüber anderer vergleichbarer Software hervor. In Hinsicht auf die Benutzerfreundlichkeit wurden gänzlich fehlende oder lückenhafte Dokumentationen des Systems für interne als auch externe Strukturen erstellt. Für bereits vorhandene Funktionen, die nur textbasiert verwendet werden konnten, wurden grafische Benutzerschnittstellen implementiert und die Verwendung somit vereinfacht. Im Rahmen der Funktionalitätserweiterung wurden u. a. die Scripting-Möglichkeiten des Systems auf verschiedene Weisen erweitert und grundsätzlich neue Funktionen hinzugefügt. Die Erweiterung der Interoperabilität wurde durch eine Funktionalität zum Datenbankenimport und -export über indirekte und direkte Schnittstellen zu den Programmen Praat, WaveSurfer sowie Articulate Assistant realisiert. Weiterhin wurde das Kiel Corpus in eine EMU-Sprachdatenbank überführt. In dieser Form ist es nunmehr in einer hierarchischen Etikettierungsstruktur sehr gut darstellbar, benutzerfreundlich abfragbar und damit einhergehend analysierbar. Für die weitere Entwicklung des Systems wird die Überführung des EMU-Datenmodells in ein relationales vorgeschlagen, da bei geeigneter Modellierung nachweislich die Abfrage auf große Datenkorpora zeitlich effizienter wird und die Abfragemöglichkeiten erweitert werden. Die Weiterentwicklungen haben die Software für die Lehre und Forschung effizient einsetzbar gemacht. EMU kann damit für sehr viel mehr Anwender einen wichtigen Arbeitsschritt innerhalb des eigenen Arbeitsprozesses zur Lösung von Forschungsfragen darstellen.