Auf lange Sicht

Weshalb wir das meiste mit kurzen Wörtern sagen

So unterschiedlich die Sprachen der Welt sind, so einig sind sie sich in einem Prinzip – im Hang zur Einsilbigkeit (geht das kürzer?).

Von Marie-José Kolly, 13.12.2021

Journalismus, der Ihnen hilft, Entscheidungen zu treffen. Und der das Gemeinsame stärkt: die Freiheit, den Rechtsstaat, die Demokratie. Lernen Sie uns jetzt 21 Tage lang kostenlos und unverbindlich kennen:

Ich erinnere mich gut daran, dass wir, die Kinder in dem Quartier, in dem ich aufgewachsen bin, ziemlich stolz waren auf ein Wort, das wir kannten: das längste Wort der französischen Sprache. Anticonstitutionnellement, das heisst «verfassungswidrig», wovon wir natürlich herzlich wenig verstanden – rannten wir doch mit Schaufel, Pfeil und Bogen in Wäldern und Maisfeldern herum.

Eines war aber klar: Es war plus chic, richtig lange Wörter zu kennen als kurze. Damit, das kürzeste Wort irgendeiner Sprache zu kennen, liessen sich ganz sicher keine Punkte holen.

Und, wenn die Erinnerung stimmt: Auch nicht damit, dass man das längste deutsche Wort kannte, trotz zweisprachigem Quartier in zweisprachiger Stadt.

Warum?

Deutsch und Französisch funktionieren in ihrer sogenannten Wortbildung ganz unterschiedlich. Da, wo im Französischen mehrere Wörter nacheinander verwendet werden, kann man sie im Deutschen nach Belieben zu einem einzigen Monsterwort zusammenbauen, ein bisschen so, wie man Legosteine aufeinandersteckt:

Nationalmannschafts­fussballspieler­tenue (Tenue des joueurs de football de l'équipe nationale).

Gymiprüfungsvorbereitungs­kursmaterial (Matériel du cours de préparation à l'examen pour accéder au gymnase).

Rindfleischetikettierungs­überwachungs­aufgabenübertragungs­gesetz (Loi sur le transfert des obligations de surveillance de l'étiquetage de la viande bovine).

Richtig lange Wörter sind also in der deutschen Sprache Teil des grammatischen Programms. Im Französischen dagegen sind sie tatsächlich etwas Besonderes.

So unterschiedlich ihre Strategie des Wörter­aneinander­reihens ist, so gemeinsam ist den beiden Sprachen aber eine grundsätzliche Präferenz für kurze Wörter. Zu den Ersten, die solche sprach­übergreifenden statistischen Muster nachwiesen, gehörte der amerikanische Linguist George Kingsley Zipf.

Eines der Zipfschen Gesetze besagt, dass Wörter umso seltener auftreten, je länger sie sind. Dass es also eine Beziehung gibt zwischen Wortlänge und Worthäufigkeit. Diese Beziehung gilt für die meisten Sprachen, und sie gilt in den einzelnen Sprachen auch für die meisten Texte.

So lässt sie sich anhand von ausgewählten Textsammlungen illustrieren, zum Beispiel für das Deutsche:

Längere Wörter sind seltener: In der Corona-Berichterstattung der Republik

Anzahl Wörter nach ihrer Länge, deutschsprachig, Journalismus

251015202530Buchstaben pro Wort040008000 Wörter

Quelle: Titel, Lead und Text der sechs grossen Coronavirus-Erklärartikel der Republik.

Auch wenn in diesen Texten naturgemäss immer wieder Begriffe wie «Coronavirus» oder «Kontakt­nachverfolgung» auftreten, sind die häufigsten Wörter kurze Wörter. Wörter, die Schreiberinnen und Sprecher in fast jedem Satz verwenden: die, der, und, das, in.

Die Kurve, welche die Daten zeichnen, fällt schnell ab: Wörter mit mehr als 10 Buchstaben sind schon ziemlich selten, das längste mit 31 Buchstaben – «Wahrscheinlichkeits­überlegungen» – tritt nur einmal auf. Dass die Kurve so schnell abfällt, liegt daran, dass etwa 60 Prozent dessen, was Menschen so schreiben, aus den 100 häufigsten Wörtern besteht. Egal, in welcher Sprache sie schreiben – oder sprechen. Denn das Zipfsche Gesetz lässt sich auch in mündlicher Sprache beobachten, hier für das Englische:

Noch kürzere Wörter: In Ansprachen amerikanischer Präsidenten

Anzahl Wörter nach ihrer Länge, englischsprachig, Reden zur Lage der Nation

151015202530Buchstaben pro Wort0200’000400’000 Wörter

Quelle: Verschriftlichung aller jährlichen «State of the Union»-Reden, von George Washington bis Joe Biden. Website des Weissen Hauses (2017–2020, 2021); Textsammlung der «Sotu»-Library in der Programmiersprache R (1790–2016).

Dass im Gegensatz zum Deutschen auch Wörter mit nur einem Buchstaben in die Statistik einfliessen, liegt natürlich erstens daran, dass es im Englischen solche überhaupt gibt: I («ich») oder a («ein»). Dass sie relativ häufig vorkommen, hängt auch mit der hier untersuchten gesprochenen Sprache zusammen: In ihren Reden verweisen die Präsidenten häufig auf sich selbst (I) und ihr Publikum (you).

Die zehn häufigsten Wörter im schriftlichen Englischen sind, gemäss einer Untersuchung von Zeitungstexten:

  1. the

  2. of

  3. to

  4. in

  5. and

  6. a

  7. for

  8. was

  9. is

  10. that

Im mündlichen Englischen dagegen, gemäss einem grossen Datensatz gesprochener Sprache, sprechen Sprecher häufig über sich selbst und über die angesprochenen Personen:

  1. the

  2. and

  3. I (dass das Pronomen «ich» hier so häufig auftritt, ist der Textform «mündliche Rede» geschuldet)

  4. to

  5. of

  6. a

  7. you

  8. that

  9. in

  10. it

Das Muster, das George Kingsley Zipf beschrieb, lässt sich auch im Französischen nachweisen, etwa im Werk des Autors Victor Hugo. Und zwar egal, welchen seiner Romane man durch die Wörter­zählmaschine laufen lässt.

Häufige Wörter sind kurze Wörter: In verschiedenen Romanen von Victor Hugo

Anzahl Wörter nach ihrer Länge, französischsprachig, Romane

«Les Misérables»151015202530Buchstaben pro Wort020’00040’000 Wörter«Notre-Dame de Paris»151015202530Buchstaben pro Wort020’00040’000 Wörter

Quelle: Volltext der Romane «Les Misérables – Première Partie» und «Notre-Dame de Paris» von Victor Hugo.

Zu Daten und Methode

Auswahl der Texte: Die Daten­basis für die Textanalysen umfasst beispielhaft ausgewählte Texte der Republik und des französischen Autors Victor Hugo sowie alle Reden zur Lage der Nation (State of the Union), die jeweils der amerikanische Präsident vor dem Kongress hält.

Die Texte können vereinzelt auch Wörter aus anderen Sprachen enthalten (in den Romanen von Victor Hugo etwa griechische oder spanische Begriffe). Wegen deren geringer Menge haben wir auch diese mitgezählt, Zahlen und Satzzeichen dagegen ausgeschlossen.

Textanalyse: Wir haben in den Text­sammlungen automatisch die Frequenz jedes vorkommenden Wortes gezählt, die Wörter nach Wortlänge in Anzahl Buchstaben geordnet und die Frequenzen pro Wortlänge summiert. So ergibt sich die Zahl aller Wörter à 1, 2, 3 … Buchstaben im Text.

Wie die Grafiken zeigen, kennt das Französische proportional noch mehr 1-buchstabige Wörter als das gesprochene Englische. Natürlich kommen Dinge wie à oder y in dieser Sprache häufig vor, zudem werden aber le und la und viele andere sowieso schon kurze Wörtchen vor folgendem Vokal noch kürzer: la vache, aber: l’oiseau.

Wir könnten die Liste noch lange weiterführen: In russischsprachigen Kurzgeschichten treten etwa die Wörter i, v und ne am häufigsten auf.

Und die meistverwendeten Wörter verschiedenster Sprachen haben lediglich eine Silbe. In einer Untersuchung englischer Telefongespräche fanden Forschende unter den 800 häufigsten Wörtern zum Beispiel nur wenige mit 3 oder mehr Silben.

Diese Präferenz zeigt sich übrigens auch in unserer Tendenz, mehrsilbige Wörter abzukürzen:

Mikrofon: Mik

Lokomotive: Lok

Hauptbahnhof: HB

United States of America: USA

Kindertagesstätte: Kita

Schiedsrichter: Schiri

Und kürzlich fiel in einer Sitzung der Republik-Redaktion das Wort Kapa. Es stand für: Kapazität.

Woher diese Präferenz vermutlich kommt

Die prominenteste These: Das Gesetz der häufigen kurzen Wörter bedient Effizienz als kommunikatives Prinzip. Der Linguist Zipf ging davon aus, dass Menschen grundsätzlich nicht härter arbeiten wollen als nötig, um ihre Ziele zu erreichen. So heisst eines seiner Bücher auch «Menschliches Verhalten und das Prinzip der geringsten Anstrengung».

Wenn gängige Wörter kurz sind und seltene lang, muss man als Sprecherin weniger reden, um zu sagen, was man sagen will. Und man muss als Hörer weniger zuhören, um das Gesagte zu verstehen. Zipf verstand Wörter primär als Werkzeuge: Menschen verwenden sie, um Bedeutung zu transportieren, womit sie bestimmte Ziele erreichen wollen.

(Natürlich erfüllt Sprache je nach Situation auch ganz andere Funktionen als jene, sich möglichst effizient mitzuteilen. Manchmal sprechen Menschen vor allem, um den Kontakt zu einem Mitmenschen aufrecht­zuerhalten. Manchmal, um ihre Wortgewandtheit zu demonstrieren, oder ihre Macht. Und manchmal, weil sie etwas von sich selbst preisgeben möchten, auch wenn sie das nicht explizit so benennen.)

Sprachökonomische Prinzipien lassen sich auch innerhalb von Wörtern beobachten, wenn etwa Laute aufeinanderfolgen, die an derselben Stelle artikuliert werden: Für den Übergang von «n» zu «d» im Wort «Hand» braucht sich zum Beispiel die Zunge kaum zu bewegen. Und beim schnellen Sprechen passiert es immer wieder, dass wir derartige Übergänge produzieren, die so (noch) nicht im Lexikon stehen: Etwa wenn wir «Semf» sagen statt «Senf», die oberen Schneidezähne sich also schon nach dem «e» auf die Unterlippe legen.

Sprache wandelt sich, und auch dabei treten ökonomische Entwicklungen zutage: Verwenden Sprecherinnen einen Laut oder ein Wort häufiger, so wird seine Form typischerweise leichter auszusprechen. So, wie die Ecken eines Legosteins, der durch viele Kinderhände ging, runder werden.

Als etwa das englische Wort master im Laufe der Sprachgeschichte zur oft verwendeten Anredeform wurde, schliff sich sein «a» zu einem schwachen «i» ab: mister. In der weniger häufigen Verwendung als he is my master blieb der Vokal aber ein volles, betontes «a».

So werden Laute Schritt für Schritt unauffälliger und Wörter kürzer.

Solche Spielchen kann man als Sprecherin oder als Sprecher­gemeinschaft über mehrere Generationen hinweg eine Zeitlang treiben – gerade so lange, dass die Hörerschaft einen noch versteht. Wir seien zwar in einer gewissen Weise frei, zu sagen, was immer wir wollen, schreibt der britische Linguist David Crystal in seiner «Cambridge Encyclopedia of Language». «Aber in der Praxis bleibt unser sprachliches Verhalten nahe an den statistischen Erwartungen.» Die sprachlichen Zeichen, die uns zur Verfügung stehen – Wörter, die mit bestimmten Bedeutungen verknüpft sind –, beruhen auf Konvention. Einer Konvention, die für das gegenseitige Verständnis von Sprecherin und Hörer notwendig ist.

Zum Buch «Auf lange Sicht»

Sie brauchen Lesestoff für die Festtage? Oder ein Geschenk für Ihre Liebsten? «Auf lange Sicht» gibt es jetzt auch als Buch. In 26 ausgewählten Beiträgen geht es um den Klima­wandel, das Frauen­stimm­recht oder die Frage, wie man wo in der Schweiz sagt: «Chrischt­baum», «Wiehnachts­boum» oder ganz einfach nur «Tanne».

Rund 29’000 Menschen machen die Republik heute schon möglich. Lernen Sie uns jetzt auch kennen – 21 Tage lang, kostenlos und unverbindlich: