Alle Sprachen übertragen Informationen mit 39 Bits pro Sekunde

5. September 2019 11:43 | #Sprache #Wissenschaft

Wissenschaftler haben die Datenübertragungsraten von Sprachen untersucht und eine linguistische Bitrate-Konstante von 39bps gemessen, ungefähr doppelt so schnell wie Morse-Code und etwa ein Drittel der Geschwindigkeit des ersten Modems von 1959. Es ist dabei anscheinend egal, wie schnell unterschiedliche Sprachen gesprochen werden – Italienisch etwa wird schneller gesprochen mit mehr Silben pro Sekunde, als Deutsch, überträgt dafür aber weniger Information pro Silbe –, die Geschwindigkeit, mit der die Informationen übertragen werden, bleibt dieselbe.

Sie haben nicht untersucht, an welcher Stelle der menschlichen Kommunikation diese Geschwindigkeit gedrosselt wird. Das menschliche Gehirn sollte in der Lage sein, sehr viel mehr rein gedankliche Information pro Sekunde zu verarbeiten (ich könnte mich aber auch täuschen). Ich vermute, diese Geschwindigkeit wird durch die Formulierung des gesprochenen Worts und der Umsetzung in die körperliche Motorik bestimmt, auch die Selektion der Formulierung dürfte die „Bitrate der Sprache“ weiter drosseln. Was auch immer die Geschwindigkeit der menschlichen Informationsübertragung bestimmt, sie scheint konstant zu sein über mehrere und möglicherweise alle Sprachen hinweg.

Science: Human speech may have a universal transmission rate: 39 bits per second
Paper: Different languages, similar encoding efficiency: Comparable information rates across the human communicative niche

Scientists started with written texts from 17 languages, including English, Italian, Japanese, and Vietnamese. They calculated the information density of each language in bits—the same unit that describes how quickly your cellphone, laptop, or computer modem transmits information. They found that Japanese, which has only 643 syllables, had an information density of about 5 bits per syllable, whereas English, with its 6949 syllables, had a density of just over 7 bits per syllable. Vietnamese, with its complex system of six tones (each of which can further differentiate a syllable), topped the charts at 8 bits per syllable.

Next, the researchers spent 3 years recruiting and recording 10 speakers—five men and five women—from 14 of their 17 languages. (They used previous recordings for the other three languages.) Each participant read aloud 15 identical passages that had been translated into their mother tongue. After noting how long the speakers took to get through their readings, the researchers calculated an average speech rate per language, measured in syllables/second.

In comparison, the world’s first computer modem (which came out in 1959) had a transfer rate of 110 bits per second, and the average home internet connection today has a transfer rate of 100 megabits per second (or 100 million bits).

Jetzt Nerdcore unterstützen!

Nerdcore veröffentlicht seit mehr als 12 Jahren Analysen und Dokumentationen zu Memetik, Netz-Soziologie und digitalen Subkulturen, garniert mit jeder Menge Kunst, Entertainment und Unfug. Nerdcore prägte die deutsche Netzkultur maßgeblich, initiierte die erste deutsche Meme, ging Frau Merkel mit Flashmobs auf die Nerven und manche Menschen behaupten, ich würde ab und zu gute Arbeit abliefern.

Die Website ist seit 2017 werbefrei und wird aus Spenden und Abonnements finanziert. Um den Betrieb der Seite und meine Vollzeitstelle zu sichern, könnt ihr gerne ein Abonnement auf Patreon oder Steady abschließen oder mir eine einmalige Spende oder einen Dauerauftrag per Paypal oder auf mein Konto (IBAN DE05100100100921631121) zukommen lassen.

Vielen Dank an alle Leser und Unterstützer dieses Blogs.

Neu auf Nerdcore:

Nerdcore auf Twitter

100k AI-Stockphotos

Eine Fotostudie der Tafeln von Mathematikern

Wolleschmittjunior über Rambo

Neuer Teaser zum Breaking Bad-Film El Camino

Truthähne latschen seit zweieinhalb Jahren um eine tote Katze

6 Kommentare zu “Alle Sprachen übertragen Informationen mit 39 Bits pro Sekunde”

  1. Hm, ich weiß ja nicht. Unabhängig davon wie schnell man redet, beinhalten ja Wörter in unterschiedlichen Sprachen die gleiche Information in anderer Wortlänge. “Car” im Englishen vermittelt die Information in 1 Silber weniger als im deutschen “Auto”. Im Allgemeinen sind Wörter im Englischen kürzer und bestehen aus weniger Silben, liegt es da nicht nahe zu vermuten, die englische Sprache hat eine höhere “Bitrate” als die deutsche?

    1. Dafür kennt das Englische zum Beispiel kein Geschlecht, wo also „the car“ im Englischen nur „Auto“ und Artikel transportiert, kennt das Deutsche noch eine grammatikalische Geschlechtsinformation, wofür auch immer die gut sein soll. Das Englische transportiert also in 2 Silben 2 Infos (Subjekt, Artikel), das Deutsche in 3 Silben 3 Informationen (Subjekt, Artikel, Geschlecht), hat also dieselbe „Bitrate“.

      1. Aber das Geschlecht von Auto bleibt immer konstant, ist also redundante Information, welche nicht in den Shannoninformationsgehalt eingerechnet wird.
        Außerdem, wenn ich die Einleitung des Papers richtig verstanden habe, meinen sie mit den 39bit/s den syntaktischen Informationsgehalt. Heißt, wieviele unterschiedliche Silben gibt es in der Sprache und wie schnell werden diese gesprochen. Nicht, welche Bedeutungen und Konzepte hat der Text transportiert. Das wäre eine Stufe höher.

        Ich glaube, das Problem dieser Studie ist, dass sie anscheinend Übersetzungen des selben Textes in 17 verschiedene Sprachen gemacht haben und dann der Text vorgelesen wurde. Das ist dann natürlich weit von im Moment gesprochener Sprache entfernt. Andererseits wird es bei einem anderen Ansatz wahrscheinlich schwieriger die Ergebnisse überhaupt zu vergleichen.

        Auf jeden Fall spannend.

        1. >Nicht, welche Bedeutungen und Konzepte hat der Text transportiert.

          Dann hab ich das Paper falsch verstanden, ich ging von Textbedeutung aus, nicht von rein grammatikalischer Information. Aber dennoch spannend, indeed, weil es darauf hindeutet, dass bei der Vorstufe der Entwicklung der Sprachen im Hirn (also der Entwicklung abstrakter Gedanken in Worten und so weiter) und der anschließenden Umsetzung in Sprachmotorik universelle Faktoren gibt. Chomsky und seine Universal-Grammatik dürfte die Studie sehr interessieren, denke ich.

  2. Was ist Information? Wenn sowas wie Text gemeint ist, hört sich das plausibel an, aber beim Sprechen läuft doch enorm viel Subkontext mit (Schulz von Thun)…
    Ich kann mir vorstellen dass sich diese Information, weil sie u.a. auch mit unserem Weltbild und damit auch dem Ast auf dem wir intellektuell sitzen zu tun hat, nicht ganz so einfach messen lässt.

    1. Siehe Comment von Tokage, ich hatte „Information“ anscheinend falsch als „Textbedeutung“ interpretiert, geht aber anscheinend um grammatikalische Information.

Kommentare sind geschlossen.

Jetzt Nerdcore unterstützen!


Patreon
Steady
Paypal
IBAN DE05100100100921631121

Dankeschön!


NC-Shirts

Kontakt

Newsletter

Bücherstapel
Identität: Wie der Verlust der Würde unsere Demokratie gefährdet (Francis Fukuyama)

New York 2140 (Kim Stanley Robinson)

Das kulturelle Gedächtnis: Schrift, Erinnerung und politische Identität in frühen Hochkulturen (Jan Assmann)

Beschleunigung und Entfremdung: Entwurf einer kritischen Theorie spätmoderner Zeitlichkeit (Hartmut Rosa)

Die siebte Sprachfunktion (Laurent Binet)