Digitale Stilometrie (Sommersemester 2025)
Das Seminar läuft vom 17. April 2025 bis 17. Juli 2025 an der Freien Universität Berlin. Der hier veröffentlichte Seminarplan ist als Dokumentation gedacht.
Ort: JK 31/124 (Habelschwerdter Allee 45)
Zeit: Do 14:00–16:00
Veranstaltungsbeschreibung
Die digitale Stilometrie gehört zu den etablierten Praktiken des Distant Reading. Mit ihrer Hilfe können große Textmengen auf statistisch auffällige Stilmerkmale hin befragt werden. Sie hilft bei der Autor*innenschaftsattribution, wenn anonym publizierte Texte oder eine nicht gesicherte Verfasserschaft vorliegen. Auch bei der Stilanalyse einzelner Autor*innen oder innerhalb bestimmter Genres oder Epochen kommt sie zum Einsatz. Nach der Vermittlung der zugrundeliegenden Algorithmen liegt der Schwerpunkt der Veranstaltung auf dem praktischen Einsatz stilometrischer Tools anhand vorgegebener oder eigener literaturwissenschaftlicher Szenarios. Dabei werden auch Grundlagen der Datenaufbereitung vermittelt, die zum Handwerkszeug gehören, wenn mit digitalen Objekten gearbeitet wird.
Verantwortlich
Organisatorisches
Übersicht
1. Sitzung: Was ist Stilometrie? (17.04.2025)
- Orga
- Vorstellungsrunde
- Name
- Fach, Bachelor oder Master, Modul
- Erfahrungen mit Stilometrie?
- Anwesenheitsliste
- Bedingungen für die Bestätigung der aktiven Teilnahme
- jeweils ein Referat zu einem selbstgewählten Stilometrie-Paper
- Arbeit an einem Semesterprojekt eigener Wahl
- Voraussetzungen für eine Hausarbeit
- genuine Forschungsfrage, die gern aus dem Semesterprojekt erwachsen kann
- vor Beginn der Arbeit bitte das Thema absprechen und Gliederung vorschlagen
- Abgabetermin: 30.09.2025
- Bookmarks
- Blackboard (Uni-Mails regelmäßig abrufen!)
- diese Seite (Seminarplan), wird regelmäßig aktualisiert
- Vorstellungsrunde
- Präsentation zur Einführung (Folien)
- Besprechung des Seminarplans
- Deadline für die Themenfindung zu den Semesterprojekten: 22.05.2025
- Quellen für die Kurzreferate
- Stylometry Bibliography von Christof Schöch
- Index of DH Conferences
- Google: “stylometry term1 term2 …”
2. Sitzung: Voyant (24.04.2025)
- Anwesenheitsliste
- Verteilung der Referate
- Intro
- Screencast zu stilometrischer Untersuchung der Gilmore Girls-Skripte (20 Min., mit Dank an Rebecca White!)
- gute Quellen für Volltexte
- Project Gutenberg
- Projekt Gutenberg-DE
- TextGrid Repository (Texte können direkt zu Voyant geschickt werden)
- DraCor (dito)
- Wortwolken und Stoppwörter
- Voyant
- Marie Flüh: Tooleintrag ›Voyant‹ (in: forTEXT. Literatur digital erforschen, 2018)
- Übersicht über alle Voyant-Tools
- Mareike Schumacher: Tutorial: Voyant-Tools zur Textvisualisierung nutzen (YouTube-Video, 2019, 8 Min.)
- Hands-on mit Voyant entlang der Lerneinheit
- Marie Flüh: Textvisualisierung mit Voyant
- Hausaufgabe
- AntConc installieren (Version 4!)
3. Sitzung: AntConc (15.05.2025)
- Anwesenheitsliste
- Verteilung der Referate
- AntConc
- Katrin Droste, Berenike Herrmann: AntConc (in: Literatur rechnen. Ein Wiki zur digitalen Textanalyse, 2012–2013, ausführliche Toolbeschreibung zur Version 3)
- Christian Schneijderberg: Einführung und Anleitung zu AntConc mit Beispielen (in: Sozialwissenschaftliche Methodenberatung, 2022)
- Hands-on mit AntConc
- Beispielkorpus
- Märchen der Brüder Grimm in allen sieben Auflagen zu Lebzeiten (ZIP-Datei)
- AntConc und Stoppwortlisten
- Stoppwortfunktion wurde aufgrund der Nachfrage nachträglich in AntConc 4 eingebaut, vgl. das Announcement von Laurence Anthony vom 9. Juni 2022: »The latest version of AntConc 4 now has the ability to add a stop list. You will find the function in the Global Settings under ›Tool filters‹, where you can use or hide words from a list across a variety of tools.«
- Beispiel für eine deutsche Stoppwortliste: https://github.com/solariz/german_stopwords
- Keyness mit Vergleichskorpora
- n-Gramme in Christian Krachts »Eurotrash«
- Beispielkorpus
- Hausaufgaben
- Jan Horstmann: Tooleintrag ›Stylo‹ (in: forTEXT. Literatur digital erforschen, 2019)
- Stylo installieren (Schritt-für-Schritt-Anleitung)
4. Sitzung: Stylo I (22.05.2025)
- Anwesenheitsliste
- Stylo
- Stylo-Installation erfolgreich?
- Recap: Stylo installieren (Schritt-für-Schritt-Anleitung)
- Übungen mit Stylo
- Übungskorpora
- guess-the-author
- 68-german-novels
- weitere Korpora
- Übersicht 1 (lehkost.github.io)
- Übersicht 2 (computationalstylistics.github.io)
- Deadline für die Themenfindung zu den Semesterprojekten
- Stylo-Installation erfolgreich?
5. Sitzung: Textkorpora und Präprozessierung (05.06.2025)
- Anwesenheitsliste
- Referat
- Maciej Eder: Boosting Word Frequencies in Authorship Attribution. In: Proceedings of the Computational Humanities Research Conference 2022 (CHR 2022). 12–14 December 2022. Antwerp, Belgium. Book of Abstracts, pp. 387–397.
- Texteditor installieren, der reguläre Ausdrücke beherrscht
- z. B. Visual Studio Code (VS Code), kostenlos
- Alternative ohne Tracking/Telemetrie: VSCodium
- Beispiel zur Motivation
- Bereinigung eines gescannten Textes mit RegExp
- Korpusarbeit
- Plain-Text- (TXT) und andere Formate (etwa XML, HTML)
- Goethes »Faust I«
- im XML-Format
- im TXT-Format (nur Sprechtext)
- Goethes »Faust I«
- Hermann Hesses »Unterm Rad«
- im HTML-Format
- im TXT-Format
- Konvertierungen
- im TXT-Format aus Microsoft Word, LibreOffice usw. speichern
- Konvertierung von E-Books: calibre
- Plain-Text- (TXT) und andere Formate (etwa XML, HTML)
- Reguläre Ausdrücke (Regex, RegExp)
- OCR
- Transkribus
- eScriptorium
- OCR4all
- Regulärer Ausdruck zur Beseitigung von Trennungen in OCR-Scans
find: ([a-zäöüß])¬\n([a-zäöüß]+[\.\?!;,]*)
replace: $1$2\n
6. Sitzung: Stylo II (12.06.2025)
- Anwesenheitsliste
- Referat
- Gabriela Rotari, Melina Jander, Jan Rybicki: The Grimm Brothers: A stylometric network analysis. In: Digital Scholarship in the Humanities. Vol. 36, Heft 1 (April 2021), S. 172–186. (doi:10.1093/llc/fqz088)
- correspSearch: Briefeditionen durchsuchen und vernetzen
- Recap zu letzter Woche
- Praxis: Herunterladen von Untertiteln aus YouTube
- Fortsetzung des Hands-on mit Stylo anhand der gewählten Semesterprojekte
7. Sitzung: Gephi (19.06.2025)
- Anwesenheitsliste
- Referat
- Jan Luhmann, Manuel Burghardt, Jochen Tiepmar: SubRosa – Multi-Feature-Ähnlichkeitsvergleiche von Untertiteln. In: DHd2020: »Spielräume«. 2.–6. März 2020. Book of Abstracts. Universität Paderborn, S. 215–219. (doi:10.5281/zenodo.4621824)
- Repositorium: github.com/bbrause/subrosa
- Gephi
- Gephi installieren
- forTEXT:
- Mareike Schumacher: Tooleintrag ›Gephi‹ (in: forTEXT. Literatur digital erforschen, 2019)
- Beispieldatei für die Einübung: dracor.org/ger/schiller-die-jungfrau-von-orleans#downloads
- Beispiele
- für stilometrische Netzwerkdiagramme
- einige Übungskorpora siehe 4. Sitzung
8. Sitzung: Stylo III (26.06.2025)
- Anwesenheitsliste
- Referat
- Lee Suddaby, Gordon J Ross: Did Mary Shelley write Frankenstein? A stylometric analysis. In: Digital Scholarship in the Humanities. Vol. 38, Heft 2 (Juni 2023), S. 750–765. (doi:10.1093/llc/fqac061)
- Fortsetzung des Hands-on mit Stylo anhand der gewählten Semesterprojekte
9. Sitzung: Stylo IV (03.07.2025)
- Anwesenheitsliste
- Referat
- Jonathan Pearce Reeve: Does «Late Style» Exist? New Stylometric Approaches to Variation in Single-Author Corpora. In: DH2018: »Puentes/Bridges«. 26.–29. Juni 2018. Book of Abstracts / Libro de resúmenes. Mexico: Red de Humanidades Digitales A. C.
- Fortsetzung des Hands-on mit Stylo anhand der gewählten Semesterprojekte
10. Sitzung: Arbeit an den Semesterprojekten (10.07.2025)
- Blick in aktuelle Forschungsbeiträge
- YouTube-Videos zu Stilometrie-Vorträgen von der internationalen Digital-Humanities-Konferenz DH2023 in Graz
- Simone Rebora: Short texts with fewer authors. Revisiting the boundaries of stylometry (8 Min.)
- Jan Rybicki: Can Machine Translation of Literary Texts Fool Stylometry? (16 Min.)
- Benedetta Salvati, Jean-Baptiste Camps: On Burgundian (di)vine orators and other impostors: Stylometry of Late Medieval Rhetoricians (13 Min.)
- YouTube-Videos zu Stilometrie-Vorträgen von der internationalen Digital-Humanities-Konferenz DH2023 in Graz