Autor-Identifikation anhand der Sequenz ihrer Satzzeichen

In einem neuen Paper identifizieren Wissenschaftler Autoren anhand der Interpunktions-Sequenzen, also die Reihenfolge, Menge und Konstellation von Satzzeichen. Es gibt auch ein nettes Tool zum Abgleich eigener Texte. Ich habe dort mal einen alten, sehr (sehr!) bösen Text über ein paar bestimmte Leute eingefügt und ich kann mit dem Ergebnis sehr gut leben, denn ich setze meine Satzzeichen wie Oscar Wilde. Ich interpretiere das als Zustimmung zum Text-Inhalt. Danke, Interpunktion! I know I’m right.

Alexandra Darmon: Pull out all the stops: Textual analysis via punctuation sequences

Whether enjoying the lucid prose of a favorite author or slogging through some other writer’s cumbersome, heavy-set prattle (full of parentheses, em-dashes, compound adjectives, and Oxford commas), readers will notice stylistic signatures not only in word choice and grammar, but also in punctuation itself. Indeed, visual sequences of punctuation from different authors produce marvelously different (and visually striking) sequences. Punctuation is a largely overlooked stylistic feature in “stylometry”, the quantitative analysis of written text.

In this paper, we examine punctuation sequences in a corpus of literary documents and ask the following questions: Are the properties of such sequences a distinctive feature of different authors? Is it possible to distinguish literary genres based on their punctuation sequences? Do the punctuation styles of authors evolve over time? Are we on to something interesting in trying to do stylometry without words, or are we full of sound and fury (signifying nothing)?

Nerdcore veröffentlicht seit mehr als 12 Jahren Analysen und Dokumentationen zu Memetik, Netz-Soziologie und digitalen Subkulturen, garniert mit jeder Menge Kunst, Entertainment und Unfug. Nerdcore prägte die deutsche Netzkultur maßgeblich, initiierte die erste deutsche Meme, ging Frau Merkel mit Flashmobs auf die Nerven und manche Menschen behaupten, ich würde ab und zu gute Arbeit abliefern.

Die Website ist seit 2017 werbefrei und wird aus Spenden und Abonnements finanziert. Um den Betrieb der Seite und meine Vollzeitstelle zu sichern, könnt ihr gerne ein Abonnement auf Patreon oder Steady abschließen oder mir eine einmalige Spende oder einen Dauerauftrag per Paypal oder auf mein Konto (IBAN DE05100100100921631121) zukommen lassen.

Vielen Dank an alle Leser und Unterstützer dieses Blogs.

Neu auf Nerdcore:

Im Staub des Planeten: Der Horror der Philosophie mit Eugene Thacker

Neal Stephenson über Soziale Medien: „We’re actually living through the worst-case scenario right now“

[Klimalinks 19.7.2019] Eat the Rich; Weniger CO₂-Budget als gedacht; erstes #FridaysForFuture-Bußgeld zurückgezogen; Klimawandel beschleunigt Gentrifizierung

Musikvideos: Brittany Howard, Red Hearse, Deutsche Laichen, Dälek, Yeule, Grün Wasser, Twin Peaks, Ceremony, Blis, Molly Sarlé, Cherry Pickles, Little Scream, Shannon Lay, Sleater-Kinney, Jade Imagine, The Sonder Bombs, Speelburg, The Struts

Top Gun 2 – Trailer


NC-Shirts

Jetzt Nerdcore unterstützen!


Patreon
Steady
Paypal
Donorbox
IBAN DE05100100100921631121

Dankeschön!

Kontakt

Newsletter

Bücherstapel
Was für Lebewesen sind wir? (Noam Chomsky)

Der Tyrann: Shakespeares Machtkunde für das 21. Jahrhundert (Stephen Greenblatt)

Stan (John Connolly)

Die geheime Welt der Bauwerke (Roma Agrawal)

Verzeichnis einiger Verluste (Judith Schalansky)