Aussprache deutscher Namen

in Auskunftssystemen

 

 

Andreas Mengel

Technische Universität Berlin, Institut für Fernmeldetechnik, Einsteinufer 25, 10587 Berlin, Tel.: ++49-30-314-24578, Fax: ++49-30-314-22514

E-mail: mengel@ftsu00.ee.tu-berlin.de

 

Zusammenfassung. Der vorliegende Artikel beschäftigt sich mit der Aussprache deutscher Namen in Auskunftssystemen. Auf der Grundlage statistischer Daten wird erstens für die Erstellung eines Lexikons und gegen die alleinige Verwendung eines Regelsystems argumentiert. Zweitens wird die Wichtigkeit der Berücksichtigung der Auftretensfrequenzen der Namenseinträge für die Reihenfolge der zu transkribierenden Namen und ihre Qualität hervorgehoben.

 

Abstract. The following article deals with the pronunciation of German names in information systems. On the basis of statistical data it is argued in favour of setting up a lexicon and against the use of a rule based system only. Stress is put on the importance of considering the frequencies of the name entries for the purpose of the procedure and the quality of transcription.

 

Schlüsselwörter. Sprachsynthese, Transkription, Namen

 

 

1. Auskunftssysteme

 

Die Akzeptanz von automatischen Auskunftssystemen hängt wesentlich von der Qualität der verwendeten Sprachausgabe ab, deren wichtigster Aspekt die Richtigkeit der Aussprache - Lautung und Intonation - ist. Bestehen die auszugebenen Texte aus einem vorher festgelegten Vokabular, kann das Auskunftssystem per Lautsprache-Wiedergabe - die verwendeten Wörter und Sätze werden gespeichert und bei Bedarf abgerufen - realisiert werden. Ist der auszugebende Text in Vokabular und Struktur nicht festgelegt, müssen die Einträge zunächst transkribiert werden. Um die zu orthographischen Wörtern zugehörige Lautschrift zu erhalten wird bei großem Vokabular aus Geschwindgkeitsgründen der regelbasierte Ansatz dem der lexikonbasierten Sprachsynthese vorgezogen: Während man beim Regelansatz für die Transkription einen Satz von Regeln und einen schnellen Rechner braucht, um theoretisch unendlich viele Wörter transkribieren zu können, benötigen lexikonbasierte Systeme große Speicherkapazitäten mit längeren Zugriffszeiten und begrenztem Vokabular (Fellbaum 1991). Von dieser Warte aus ist der regelbasierte Ansatz dem lexikonbasierten klar vorzuziehen.

2. Überlegenheit des Lexikonansatzes

 

Der Output regelbasierter Transkriptionssysteme wird immer eine gewisse Fehlerrate aufweisen: So berichten Rook (1987) und Wothke (1993), daß die Korrektheit der Transkriptionen ihrer Systeme für Wörter bei 92,9% bzw. 91,3% liegt und Belhoula (1993), daß sein System bei der Transkription Werte von 92% für Ortsnamen, 90% für Nachnamen und 88% für Vornamen aufweist.

Für den Einsatz von Synthesesystemen im Auskunftsbereich ist so eine Fehlerrate jedoch inakzeptabel: Die angeführten Fehlerraten berücksichtigen nicht die Auftretensfrequenz der - zu rund zehn Prozent falsch - transkribierten Einträge. Da sich demnach durchaus hochfrequente Wörter wie und, der, und ist unter den falsch transkribierten Wörtern befinden könnten und falsch ausgegeben werden würden, hätte dies für die Akzeptanz der Ausgabe ungünstige Konsequenzen. Hieraus folgt, daß die Qualität der Transkription hochfrequenter Wörter und Wortformen besser sein sollte als die des Durchschnitts der restlichen Wortformen. Andersherum könnte man zwar argumentieren, daß der Informationsgehalt (Shannon & Weaver 1949) genau dieser hochfrequenten Wörter und Wortformen so gering ist, daß Abweichungen in der phonetischen Realisierung für das Gesamtverständnis nicht so gravierend sind und über die Häufigkeit der Fehlaussprache eine Gewöhnung an das System erfolgt. Natürlicher indes wird das System durch diese Argumentation jedoch nicht.

Ein Lexikon, daß ohne Zweifel auch immer eine gewisse Fehlerrate aufweisen wird, kann tatsächlich verbessert werden, ohne daß sich neue Fehler ergeben; die Fehlerrate geht damit asymptotisch gegen Null. Die Verbesserung eines Regelwerkes hingegen garantiert dies selten, da nur schwer sichergestellt werden kann, daß die Verbesserung der Ergebnisse der Transkriptionen der einen Einträge nicht durch eine Verschlechterung bei anderen erkauft wird.

 

 

3. Praktische Anwendung auf Namen

 

Kann man bei Sätzen, in denen falsch transkribierten Wörter vorkommen, noch davon ausgehen, daß Unverständliches durch Kontextinformation aufgelöst wird, so ist dies bei falsch ausgesprochenen Namen kaum zu erwarten. Außer in dem Fall, in dem der Name dem Hörer von Anfang an bekannt ist, kann dieser normalerweise nicht durch Kontextinformation erschlossen werden. Darüberhinaus muß davon ausgegangen werden, daß Personen durch die falsche Aussprache ihres Namens unangenehm berührt sind, was die Akzeptabilität und den wirtschaftlichen Erfolg eines Auskunftssystems vermindert.

Ausgehend von der Annahme, daß es sich bei Namen aus Sicht der Satzgrammatik um eine Substantivklasse mit armem Flexionsparadigma handelt, können die folgenden Untersuchungen und Schlußfolgerungen für das Vorgehen bei der Transkription von in Deutschland vorkommenden Namen angestellt werden.

4. Statistische Überlegungen

 

In der CELEX Lexical Database (Baayen et. al 1993) handelt es sich bei 30.107 von 50.707 Grundformeinträgen um Substantive. Der aktive Wortschatz eines Deutschen wird auf 6.000-10.000 (Bußmann 1990), bzw. 8.000-10.000 Wörter (Glück 1993) geschätzt, der passive auf 75.000 Grundformen (Bußmann 1990, Glück 1993). Nimmt man an, daß es sich - wie in der CELEX Lexical Database - bei drei Fünftel dieses Wortschatzes um Substantive handelt, dann würde der aktive Substantivwortschatz bei höchstens 4.000, der passive bei 45.000 liegen.

Im Rahmen des von der EU geförderten LRE-Projektes ONOMASTICA wurden von der Deutschen Bundespost Telekom sämtliche Namenseinträge der Kunden getrennt nach Vorname, Nachname, Straßen- und Ortsname zur Verfügung gestellt. Von diesen Namenseinträgen fanden nur solche Einträge Berücksichtigung, die mindestens zweimal auftraten; d.h. wenigstens zwei der eingetragenen Kunden besitzen diesen Namen bzw. wohnen in einer Straße oder einem Ort gleichen Namens. Für eine bessere Vergleichbarkeit mit Substantiven wurden auch aus den Daten der CELEX Lexical Database nur diejenigen Substantiveinträge gewählt, die innerhalb eines sechs Millionen Wörter umfassenden Korpus des Instituts für Deutsche Sprache mindestens zweimal auftraten. Es ergeben sich die Eintragshäufigkeiten in Tabelle 1.

 

 

Vornamen

Nachnamen

Straßennamen

Ortsnamen

Substantive

119.682

615.142

505.857

27.021

16.896

 

 

 

Aus Tabelle 1 ist leicht ersichtlich, daß die Anzahl der in Deutschland auftretenden Vor-, Nach-, Straßen- und Ortsnamen die Anzahl der im deutschen Wortschatz enthaltenen Substantive bei weitem übersteigt. Umsomehr ist anzunehmen, daß Namen einen Bereich des Wortschatzes ausmachen, der größtenteils aus passiv bzw. überhaupt nicht beherrschtem Vokabular besteht.

Die Auftretensverhältnisse der einzelnen Namensarten sind jedoch durchaus unterschiedlich. Um dies zu veranschaulichen, dient Tabelle 2. In ihr wird die Reichweite pro Anteil der transkribierten Namen an allen Namen der jeweiligen Namensart bzw. Substantive dargestellt. Am stärksten differieren die Klassen Substantiv und Vorname voneinander: Unter den Vornamen sind einige so häufig vertreten, daß die Transkription der 22 Prozent am häufigsten in der Datenbasis auftretenden Namen genügt, um 99 Prozent der Namensträger zu erreichen.

 

 

Anteil der häufigsten Namenseinträge

Reich-weite

Vor-namen

Nach-namen

Straßen-namen

Orts-namen

Sub-stantive

90 %

0

20

20

8

26

91 %

0

22

23

9

28

92 %

0

24

25

9

31

93 %

0

27

28

10

34

94 %

1

31

31

11

37

95 %

1

36

34

13

42

96 %

2

42

39

14

47

97 %

3

49

45

17

54

98 %

7

61

52

20

62

99 %

22

75

64

26

75

100 %

100

100

100

100

100

 

 

 

Bedenkt man bezüglich der Namen, daß die Fehlerraten der Transkriptionsprogramme bei mindestens zehn Prozent liegt, so könnte es sich unter den ungünstigsten Umständen so verhalten, daß dies gerade die zehn Prozent häufigsten Namen betrifft, was bezüglich der Aussprache der Vornamen 98 Prozent, der Nachnamen 83 Prozent, der Straßennamen 82 Prozent und bezüglich der Ortsnamen 93 Prozent der Benutzer eines deutschen Auskunftsystems betreffen würde.

Abschließend kann also behauptet werden, daß insbesondere bei Namen die Anwendung eines auftretenshäufigkeitabhängigen Verfahrens bei der Erstellung eines Regelwerkes und/oder eines Lexikons für die Umsetzung ihrer orthographischen Repräsentation in ihre Aussprache unabdingbar ist.

 

 

Literatur

 

Baayen, R.H., Piepenbrock, R. & van Rijn,. H (1993): The CELEX Lexical Database (CD-ROM). Philadelphia, PA: Linguistic Data Consortium, University of Pennsylvania.

Belhoula, K. (1993): Rule-based grapheme-to-phoneme conversion of names. Eurospeech 1993, 2, 881-884.

Bußmann, H. (1990): Lexikon der Sprachwissenschaft. Stuttgart: Kröner.

Duden (1990): Dudenaussprachewörterbuch: Wörterbuch der deutschen Standardaussprache. Mannheim: Bibliographisches Institut.

Glück, H. (ed.) (1993): Lexikon Sprache. Stuttgart: Metzler.

Fellbaum, K. (1991): Elektronische Sprachverarbeitung: Verfahren, Anwendungen, Wirtschaftlichkeit. München: Franzis-Verlag.

Rook, J. (1987): Text-to-Speech synthesis based on Grapheme and Phoneme clusters. European conference on Speech Technology, Edinburgh.

Shannon, C. E. & Weaver, W. (1949): The mathematical theory of information. Urbana.

Wothke, K. (1993): Morphologically based automatic phonetic transcription. IBM Systems Journal, 32, 3, 486-510.