Forschungsprojekte

d-Prose

„d-Prose 1870-1920” ist ein Korpus, das 2.511 deutschsprachige, literarische Prosatexte mit einem Mindestumfang von 1.000 Wörtern umfasst, die zwischen 1870 und 1920 publiziert wurden. Die enthaltenen Erzähltexte aus Trivial- und Hochliteratur wurden sowohl manuell als auch halbautomatisch ausgewählt.

→ Zum Korpus: d-Prose

EvENT

In Kooperation mit der Language Technology Group an der Universität Hamburg (Prof. Dr. Chris Biemann) entwickeln wir im EvENT-Projekt („Evaluating Events in Narrative Theory”) einen Ansatz zur Formalisierung und Analyse von Ereignissen und Ereignishaftigkeit in Erzählungen. Dafür greifen wir auf Methoden des Natural Language Processing (NLP) und auf narratologische Konzepte der Literaturwissenschaft zurück.

EvENT

In Kooperation

→ Zur Language Technology Group

KatKit

Ziel von KatKit (KATegories toolKIT) ist es, das geisteswissenschaftliche Denken durch mathematisch fundierte Methoden zu unterstützen, um das Risiko unbeabsichtigter Inkonsistenzen und inkonsistenter Modelle zu verringern und die Operationalisierung geisteswissenschaftlicher Konzepte zu erleichtern.
Für das Toolkit werden Methoden der angewandten Kategorientheorie für den Einsatz in den Digital Humanities adaptiert und weiterentwickelt. Der dabei verfolgte interdisziplinäre Ansatz verbindet geisteswissenschaftliches Denken, Informatik und Wissenschaftstheorie, deren gemeinsame Berührungspunkte kategorientheoretisch beschreibbare Strukturen und Muster sind. Letztlich sollen die Ergebnisse in bestehende Werkzeugketten und Workflows der Digital Humanities integriert und mit vorhandener Software (z.B. der Annotationssoftware CATMA) genutzt werden können.

→ Mehr zu KatKit

Konflikte

In der Literaturwissenschaft wird der Konfliktbegriff in unterschiedlichen Zusammenhängen verwendet, von der Analyse von Konflikten zwischen Figuren über die Beschreibung von Epochen im Hinblick auf ihren Umgang mit Konflikten in der Gesellschaft bis hin zur Diskussion poetologischer Fragestellungen. Die Forschung im fortext lab dazu beschäftigt sich daher einerseits mit der Operationalisierung von Konflikttypen mit einem kategorientheoretischen Ansatz und andererseits mit Heuristiken zur Messung von Konflikten über z.B. adaptierte Verfahren der Word Embedding-basierten Sentiment Analyse.

PLANS

PLANS („Unitizing Plot to Advance Analysis of Narrative Structure”) ist die Fortsetzung des EvENT-Projektes („Evaluating Events in Narrative Theory”), wobei der Fokus des Folgeprojektes auf der Erforschung und Modellierung von Handlungskonzepten in der Erzähltheorie liegt. Für die Analyse von Handlungen werden Handlungseinheiten aufgrundlage von sprachtechnologischen und narratologischen Ansätzen modelliert. Diese ermöglichen eine Annäherung an die Erzählstruktur und narrative Konstruktion von Texten.

→ Mehr zu PLANS

Szenen

„Szenen” ist ein Gemeinschaftsprojekt mit Forschenden der Universitäten Würzburg und Köln. Ziel der Projektarbeit ist die automatische Erkennung von Szenen in narrativen Texten. Basierend auf unserer Definition von Szenen (Gius et al. 2019) haben wir Annotationsrichtlinien formuliert und eine manuelle Szenenannotation von mehreren erzählenden Texten der Hoch- und Trivialliteratur durchgeführt. Außerdem organisierten wir 2021 eine Shared Task zur Szenenerkennung, bei der die Teilnehmenden aufgefordert waren, Modelle zur automatischen Szenensegmentierung zu entwickeln.

→ Zur Shared Task



Software

CATMA

CATMA (Computer Assisted Text Markup and Analysis) ist eine kostenlose, englischsprachige Open-Source-Webanwendung zur Annotation und Analyse von digitalisierten Texten. Neben der Erstellung von manuellen Annotationen bietet das Tool ein flexibles System für die Entwicklung von Annotationskategorien, eine eingebaute Abfragesprache zur Text- und Metadatenanalyse, sowie interaktive Visualisierungen. CATMA-Daten sind leicht zugänglich und exportierbar, weshalb sie sich zur Weiterverarbeitung mit anderen Tools und Methoden besonders eignen. CATMA wird seit 2008 kontinuierlich weiterentwickelt und findet seine Anwendung in vielen verschiedenen Fachgebieten, insbesondere aber in den Digital Humanities.

GitMA

GitMA ist ein Python-Paket, dass Sie verwenden können, um ihre CATMA-Annotationen über Git zu verarbeiten, zu analysieren und zu manipulieren. → Für mehr Informationen, schauen sie sich das GitHub repository und die documentation an.



Disseminationen & Publikationsreihen

forTEXT Portal

In forTEXT erarbeiten wir einsteigerfreundlich aufbereitete Methodenbeschreibungen, Textsammlungen und Tools – von der Digitalisierung über die digitale Annotation zur digital unterstützten Interpretation und Visualisierung von Literatur. Wir stellen Materialien zum Selbstlernen und zum Lehren der digitalen Textanalysemethoden an Uni und Schule bereit. Alle Inhalte stellen wir auf fortext.net frei zugänglich zur Verfügung.

forTEXT Hefte

In den forTEXT-Heften veröffentlichen wir die Webseiteninhalte von unserem Portal fortext.net als Open-Access-Zeitschrift. Methodenbeschreibungen, Lerneinheiten, Lehrmodule und Tooleinträge werden (so) thematisch gebündelt bereitgestellt. Außerdem sollen die forTEXT-Hefte zukünftig als Plattform für andere Wissenschaftler:innen dienen, um Inhalte zu Digital Humanities-Methoden, -Ressourcen und -Tools zu publizieren.

JCLS

Das Journal of Computational Literary Studies (JCLS) ist eine internationale, frei zugängliche Online-Zeitschrift, die von Evelyn Gius, Christof Schöch und Peer Trilcke herausgegeben wird und redaktionell vom fortext lab unterstützt wird. Die Zeitschrift bietet eine Publikationsplattform für Arbeiten zur Entwicklung, Anwendung und Kritik computergestützter Ansätze in den Literaturwissenschaften.