Abstract: Analysen der Computational Literary Studies (CLS) vorverarbeiten ihre Untersuchungsgegenstände typischerweise mit Tools des Natural Language Processing (NLP). Dabei weichen literarische Texte aufgrund ihrer historischen und/oder ästhetischen Eigenart teils eklatant von den Daten ab, auf deren Grundlage die Models der NLP-Tools erstellt wurden, entsprechend sinkt die Accuracy der Tools. Für die CLS könnte die 'Fehlerhaftigkeit' der Tools im Sinne devianzpoetischer Positionen die Möglichkeit bieten, ein computationelles Verständnis vom spezifischen Abweichungscharakter literarischer Texte zu auszubilden. Für den Beitrag haben wir eine Pipeline zur Verarbeitung von Lyrik entwickelt, die potenzielle 'Fehler' von NLP-Tools sammelt und diese 'Fehler' regelbasiert typologisiert. Die Ergebnisse eines ersten Experiments mit dieser Pipeline werden im Beitrag vorgestellt. Damit möchten wir für die CLS auch exemplarisch den Ansatz des "Tool Misuse" profilieren, bei dem die Erzeugung von 'fehlerhaftem' Output computationeller Tools Grundlage für Erkenntnisse über Literatur wird. Ein Beitrag zur 8. Tagung des Verbands "Digital Humanities im deutschsprachigen Raum" - DHd 2022 Kulturen des digitalen Gedächtnisses.
No Comments.