Digitale Stilometrie (Sommersemester 2025)
Das Seminar läuft vom 17. April 2025 bis 17. Juli 2025 an der Freien Universität Berlin. Der hier veröffentlichte Seminarplan ist als Dokumentation gedacht.
Ort: JK 31/124 (Habelschwerdter Allee 45)
Zeit: Do 14:00–16:00
Veranstaltungsbeschreibung
Die digitale Stilometrie gehört zu den etablierten Praktiken des Distant Reading. Mit ihrer Hilfe können große Textmengen auf statistisch auffällige Stilmerkmale hin befragt werden. Sie hilft bei der Autor*innenschaftsattribution, wenn anonym publizierte Texte oder eine nicht gesicherte Verfasserschaft vorliegen. Auch bei der Stilanalyse einzelner Autor*innen oder innerhalb bestimmter Genres oder Epochen kommt sie zum Einsatz. Nach der Vermittlung der zugrundeliegenden Algorithmen liegt der Schwerpunkt der Veranstaltung auf dem praktischen Einsatz stilometrischer Tools anhand vorgegebener oder eigener literaturwissenschaftlicher Szenarios. Dabei werden auch Grundlagen der Datenaufbereitung vermittelt, die zum Handwerkszeug gehören, wenn mit digitalen Objekten gearbeitet wird.
Verantwortlich
Organisatorisches
Übersicht
1. Sitzung: Was ist Stilometrie? (17.04.2025)
- Orga
- Vorstellungsrunde
- Name
- Fach, Bachelor oder Master, Modul
- Erfahrungen mit Stilometrie?
- Anwesenheitsliste
- Bedingungen für die Bestätigung der aktiven Teilnahme
- jeweils ein Referat zu einem selbstgewählten Stilometrie-Paper
- Arbeit an einem Semesterprojekt eigener Wahl
- Voraussetzungen für eine Hausarbeit
- genuine Forschungsfrage, die gern aus dem Semesterprojekt erwachsen kann
- vor Beginn der Arbeit bitte das Thema absprechen und Gliederung vorschlagen
- Abgabetermin: 30.09.2025
- Bookmarks
- Blackboard (Uni-Mails regelmäßig abrufen!)
- diese Seite (Seminarplan), wird regelmäßig aktualisiert
- Vorstellungsrunde
- Präsentation zur Einführung (Folien)
- Besprechung des Seminarplans
- Deadline für die Themenfindung zu den Semesterprojekten: 22.05.2025
- Quellen für die Kurzreferate
- Stylometry Bibliography von Christof Schöch
- Index of DH Conferences
- Google: “stylometry term1 term2 …”
2. Sitzung: Voyant (24.04.2025)
- Anwesenheitsliste
- Verteilung der Referate
- Intro
- Screencast zu stilometrischer Untersuchung der Gilmore Girls-Skripte (20 Min., mit Dank an Rebecca White!)
- gute Quellen für Volltexte
- Project Gutenberg
- Projekt Gutenberg-DE
- TextGrid Repository (Texte können direkt zu Voyant geschickt werden)
- DraCor (dito)
- Wortwolken und Stoppwörter
- Voyant
- Marie Flüh: Tooleintrag ›Voyant‹ (in: forTEXT. Literatur digital erforschen, 2018)
- Übersicht über alle Voyant-Tools
- Mareike Schumacher: Tutorial: Voyant-Tools zur Textvisualisierung nutzen (YouTube-Video, 2019, 8 Min.)
- Hands-on mit Voyant entlang der Lerneinheit
- Marie Flüh: Textvisualisierung mit Voyant
- Hausaufgabe
- AntConc installieren (Version 4!)
3. Sitzung: AntConc (15.05.2025)
- Anwesenheitsliste
- Verteilung der Referate
- AntConc
- Katrin Droste, Berenike Herrmann: AntConc (in: Literatur rechnen. Ein Wiki zur digitalen Textanalyse, 2012–2013, ausführliche Toolbeschreibung zur Version 3)
- Christian Schneijderberg: Einführung und Anleitung zu AntConc mit Beispielen (in: Sozialwissenschaftliche Methodenberatung, 2022)
- Hands-on mit AntConc
- Beispielkorpus
- Märchen der Brüder Grimm in allen sieben Auflagen zu Lebzeiten (ZIP-Datei)
- AntConc und Stoppwortlisten
- Stoppwortfunktion wurde aufgrund der Nachfrage nachträglich in AntConc 4 eingebaut, vgl. das Announcement von Laurence Anthony vom 9. Juni 2022: »The latest version of AntConc 4 now has the ability to add a stop list. You will find the function in the Global Settings under ›Tool filters‹, where you can use or hide words from a list across a variety of tools.«
- Beispiel für eine deutsche Stoppwortliste: https://github.com/solariz/german_stopwords
- Keyness mit Vergleichskorpora
- n-Gramme in Christian Krachts »Eurotrash«
- Beispielkorpus
- Hausaufgaben
- Jan Horstmann: Tooleintrag ›Stylo‹ (in: forTEXT. Literatur digital erforschen, 2019)
- Stylo installieren (Schritt-für-Schritt-Anleitung)
4. Sitzung: Stylo I (22.05.2025)
- Anwesenheitsliste
- Stylo
- Stylo-Installation erfolgreich?
- Recap: Stylo installieren (Schritt-für-Schritt-Anleitung)
- Übungen mit Stylo
- Übungskorpora
- Deadline für die Themenfindung zu den Semesterprojekten
- Stylo-Installation erfolgreich?
5. Sitzung: Textkorpora und Präprozessierung (05.06.2025)
- Anwesenheitsliste
- Texteditor installieren, der reguläre Ausdrücke beherrscht
- z. B. Visual Studio Code (VS Code), kostenlos
- Alternative ohne Tracking/Telemetrie: VSCodium
- Beispiel zur Motivation
- Bereinigung eines gescannten Textes mit RegExp
- Korpusarbeit
- Plain-Text- (TXT) und andere Formate (etwa XML, HTML)
- Goethes »Faust I«
- im XML-Format
- im TXT-Format (nur Sprechtext)
- Goethes »Faust I«
- Hermann Hesses »Unterm Rad«
- im HTML-Format
- im TXT-Format
- Konvertierungen
- im TXT-Format aus Microsoft Word, LibreOffice usw. speichern
- Konvertierung von E-Books: calibre
- Plain-Text- (TXT) und andere Formate (etwa XML, HTML)
- Reguläre Ausdrücke (Regex, RegExp)
- Kurzdefinition in einfacher Sprache (via ChatGPT)
- Häufig verwendete Symbole und Syntax
- zum Üben: regex101.com
- Beispiel für copy & paste:
[2019-14-14 12:39] Sam: hallo
[2019-14-14 15:34] Ben: klalaaalalaalala
[2019-14-14 16:49] Sam: hallo.
- OCR
- Transkribus
- eScriptorium
- OCR4all
6. Sitzung: Stylo II (12.06.2025)
- Anwesenheitsliste
- Referat?
- Recap zu letzter Woche
- Fortsetzung des Hands-on mit Stylo anhand der gewählten Semesterprojekte
7. Sitzung: Gephi (19.06.2025)
- Anwesenheitsliste
- Gephi
- Gephi installieren
- forTEXT:
- Mareike Schumacher: Tooleintrag ›Gephi‹ (in: forTEXT. Literatur digital erforschen, 2019)
- Mareike Schumacher: Lerneinheit ›Netzwerkanalyse mit Gephi‹ (in: forTEXT. Literatur digital erforschen, 2020)
- Beispieldatei für die Einübung: dracor.org/ger/schiller-die-jungfrau-von-orleans#downloads
- Beispiele
- für stilometrische Netzwerkdiagramme
- einige Übungskorpora siehe 4. Sitzung
8. Sitzung: Autor*innenschaft und Gattungszugehörigkeit (26.06.2025)
- Anwesenheitsliste
- Referat?
- Besprechung der Lektüre
- Christof Schöch: Corneille, Molière et les autres. Stilometrische Analysen zu Autorschaft und Gattungszugehörigkeit im französischen Theater der Klassik. In: Philologie im Netz (PhiN). Beiheft 7/2014: Literaturwissenschaft im digitalen Medienwandel. Hrsg. von Christof Schöch und Lars Schneider. S. 130–157.
- Welche beiden Methoden zur Ergebnisverbesserung werden beschrieben?
- Inwiefern haben unterschiedliche Distanzmaße ein jeweils anderes Gewicht?
- Worin unterscheiden sich Cluster Analysis/Dendrogramm und Bootstrapping?
9. Sitzung: »Delta« in der stilometrischen Autor*innenschaftsattribution (03.07.2025)
- Anwesenheitsliste
- Referat?
- Besprechung der Lektüre
- Andreas Büttner, Friedrich Michael Dimpel, Stefan Evert, Fotis Jannidis, Steffen Pielström, Thomas Proisl, Isabella Reger: »Delta« in der stilometrischen Autorschaftsattribution. In: Zeitschrift für digitale Geisteswissenschaften. 2017. (doi:10.17175/2017_006)
- Regulärer Ausdruck zur Beseitigung von Trennungen in OCR-Scans
find: ([a-zäöüß])¬\n([a-zäöüß]+[\.\?!;,]*)
replace: $1$2\n
10. Sitzung: Arbeit an den Semesterprojekten (10.07.2025)
- YouTube-Videos zu Stilometrie-Vorträgen von der internationalen Digital-Humanities-Konferenz DH2023 in Graz