Digital Humanities: Forschung in den digitalen Geisteswissenschaften

Donnerstag, 21. März 2019 um 10:36 Uhr

Am Zentrum für Digitalen Wandel in Hildesheim bauen Wissenschaftlerinnen und Wissenschaftler die Forschung in den digitalen Geisteswissenschaften aus. Mithilfe computerlinguistischer Methoden können sie große Datenmengen analysieren. Aktuelle Ergebnisse stellten sie beim Workshop „Computational Linguistics and Digital Humanities“ vor, einer Kooperation zwischen den Universitäten Hildesheim und Göttingen.

Ulrich Heid forscht und lehrt als Professor für Sprachtechnologie und Computerlinguistik am Institut für Informationswissenschaft und Sprachtechnologie der Universität Hildesheim. Gemeinsam mit Professorin Caroline Sporleder, Direktorin des Göttingen Centre for Digital Humanities , lädt der Computerlnguist regelmäßig zu Arbeitstagungen ein.

Alle sechs Monate kommen Forscherinnen und Forscher beim Workshop „Computational Linguistics and Digital Humanities“ zusammen, im Frühjahr in Göttingen, im Herbst in Hildesheim. Ende Februar 2019 fand die Arbeitstagung zum Thema „Digital Methods in Political Science“ in Göttingen statt.

Die Workshops dienen dazu, dass beide Standorte einander über laufende Projekte, Methoden und Verfahren informiert halten. Regelmäßig werden europäische oder nationale Gäste eingeladen.

Interaktion zwischen politikwissenschaftlicher Theoribildung und computerlinguistischer Textanalyse

„Einige der prominenteren Vertreter computerlinguistisch arbeitender Politikwissenschaft Deutschlands kamen diesmal zusammen“, sagt Ulrich Heid. „Wir wollen gemeinsam verstehen, wie die Interaktion zwischen politikwissenschaftlicher Theoriebildung und computerlinguistischer Textanalyse aussehen kann. Zwar ist der Einsatz von Werkzeugen zur Extraktion von Wörtern und Wortsequenzen und von Zählverfahren und statistischen Tools sehr ‚en vogue‘ in der Politikwissenschaft, aber das eigentliche Ziel sollte es sein, klarer zu verstehen, welche Arten von Werkzeugen welche Arten von theoriegeleiteten Fragenstellungen gut unterstützen.“

Ein thematischer Schwerpunkt ist das vieldiskutierte Problem „Hate Speech“. „Wir bringen Wissenschaftlerinnen und Wissenschaftler zusammen, die sich Gedanken dazu machen, was eigentlich alles als Hate Speech gelten soll, aber auch solche, die Werkzeuge oder Daten für Training und Test von Werkzeugen entwickeln.“

Computerlinguistische Techniken in den Geisteswissenschaften

Die Verwendung und die Menge verschiedener computerlinguistischer Techniken hat für die textbasierten Geisteswissenschaften in der letzten Zeit enorm zugenommen, sagt Heid. Mit den Nachbarn in Göttingen hat er die idealen Kooperationspartner gefunden. Beide Universitäten haben eine geistes-, kultur- und sozialwissenschaftliche Ausrichtung, forschen sowohl grundlagen- als auch anwendungsorientiert. In Göttingen wurde Caroline Sporleder als Professorin für digitale Geisteswissenschaften im Fachbereich Informatik berufen. „Wir halten uns auf dem Laufenden, wie die Geisteswissenschaften auf die Digitalisierung reagieren“, sagt Ulrich Heid, der in Hildesheim gemeinsam mit dem Wirtschaftsinformatiker Professor Ralf Knackstedt und der Politikwissenschaftlerin Professorin Marianne Kneuer seit Ende 2018 am „Zentrum für Digitalen Wandel – Center for Digital Change“ mitarbeitet.

Program of the 7th. Göttingen/Hildesheim-Workshop
on Computer Linguistic and Digital Humanities

Im Folgenden geben einige der am Workshop beteiligten Wissenschaftlerinnen und Wissenschaftler aus Hildesheim Einblicke in ihre Forschung:

Analyse von Diskursen über Solidarität

Computerlinguist Prof. Dr. Ulrich Heid

Prof. Dr. Ulrich Heid ist ordentlicher Professor für Sprachtechnologie / Computerlinguistik in Hildesheim und Mitbegründer der Workshop-Serie „Computational Linguistics and Digital Humanities“. Ulrich Heid ist selbst Geisteswissenschaftler, hat Sprachwissenschaft und Geschichte studiert und sich dann auf Computerlinguistik und Sprachtechnologie spezialisiert.

Herr Professor Heid, an welchem Forschungsthema arbeiten Sie zurzeit?

Zusammen mit Prof. Dr. Marianne Kneuer präsentiere ich Pläne für das neue, vom Land Niedersachsen finanzierte Projekt SOLDISK, also erst einmal nur Ziele und angestrebte Methoden, noch keine Ergebnisse. Professorin Marianne Kneuer koordiniert das Projekt, das am 1. März 2019 beginnt und Politologen und Computerlinguisten zusammenbringt. Wir analysieren Diskurse über Solidarität, wie sie in online-Quellen vorliegen. Beispiele sind offizielle Texte der Regierung, aber auch Statements auf Internetseiten zivilgesellschaftlicher Akteure (Kirchen, Vereine, Bürgerinitiativen usw.) oder von Individuen. Wir wollen für den Zeitraum 2012 bis 2016 und die beiden Einwanderungsereignisse in Deutschland (Rumänen und Bulgaren, 2012 bis 2014; sogenannte „Flüchtlingskrise“ 2014 bis 2016) ein Textkorpus sammeln, analysieren und im Hinblick darauf untersuchen, wie über Solidarität (zum Beispiel mit den Flüchtlingen) geschrieben wird.

Warum ist diese Forschung wichtig?

Es heißt, Solidarität sei in der Krise; speziell in Zeiten, die als Krisenzeiten wahrgenommen werden, wie etwa den von Migrationsereignissen gekennzeichneten Jahren 2012 - 2016. Solidarisches Handeln in großem Stil zu erfassen ist sehr schwer; aber Diskurse über Solidarität das heißt das, was Akteure im Gemeinwesen darüber schreiben oder sagen, lässt sich sammeln, über die Zeit hinweg analysieren und interpretieren. Uns interessiert, ob und wie sich die oben genannten drei Gruppen in ihren Solidaritätsdiskursen unterschieden, ob generell oder gruppenweise Soldidarisierungs- bzw. Desolidarisierungsentwicklungen feststellbar sind, und ob Diskurse einer Akteursgruppe auf die anderen Gruppen "abfärben". Schließlich auch, wie argumentiert wird: mit wirtschaftlichen Argumenten, mit Fremdheit, oder mit Sicherheitsargumenten? Die Ergebnisse sind langfristig auch für die Politikberatung relevant.

„Practices of Commenting in Digital Public Spheres”

Soziologe Prof. Dr. Michael Corsten

Prof. Dr. Michael Corsten ist Professor für Soziologie und Dekan des Fachbereichs Erziehungs- und Sozialwissenschaften in Hildesheim. Im Rahmen des DFG-Projekts „Digitale Verbreitungsmedien, Kommunikationsmacht und Generation“ hat Corsten mehrere Doktorarbeiten und eine Habilitation begleitet.

Herr Professor Corsten, welches Forschungsergebnis stellen Sie vor?

Es geht um ein Ergebnis aus dem DFG-Projekt „Digitale Verbreitungsmedien, Kommunikationsmacht und Generation“, die exemplarische Auswertung der 432 Beiträge im Zeit-Online-Kommentarbeich zum Artikel „schlecht, schlechter, Geschlecht“ von Harald Martenstein.

Warum ist diese Forschung wichtig?

Bemerkenswert ist oberflächlich betrachtet zunächst der Befund, dass auch in dem Online-Forum eines anerkannten Mediums des Qualitätsjournalismus eine Vielzahl von Beiträgen zu finden sind, in denen Personen und/oder Positionen in abwertender bis diskriminierender Form behandelt werden. Trotzdem zeigt sich an dem untersuchten Beispiel, dass sich innerhalb solcher Online-Leser-Kommentarforen Debatten zwischen kleineren Gruppen von Leserinnen und Lesern entfalten können. Wichtig ist die Untersuchung speziell dieser Bereiche nicht zuletzt deshalb, weil sich daran eine Kombination von One-To-Many- und Many-To-Many-Kommunikation zeigt.

„Who polluted the debate in the German federal election campaign 2017? Analysis and automatic detection of hate speech on social media”

Politikwissenschaftler Prof. Dr. Wolf Schünemann

Prof. Dr. Wolf J. Schünemann forscht und lehrt als Juniorprofessor für Politikwissenschaft mit dem Schwerpunkt Politik und Internet in Hildesheim.

Herr Professor Schünemann, welches Forschungsergebnis stellen Sie vor?

Wir stellen zentrale Ergebnisse aus dem Projekt „Wahlkampf in (a)sozialen Netzwerken“ (WasN) vor und zwar aus dem Teilprojekt 1, in dem wir einen großen Datensatz digitaler Kommunikationsdaten (insgesamt 2,9 Mio. Facebook-Beiträge) automatisiert ausgewertet haben. Wichtige Ergebnisse sind bislang, dass wir die viel beschworenen Echokammern, insbesondere im Hinblick auf die populistische Rechte, im deutschen Facebook-Wahlkampf nicht nachweisen können, zumindest nicht, wenn wir uns anschauen, auf welche Medieninhalte in den Posts und Kommentaren verwiesen wird. Hier zeigen alle Parteien einschließlich der AfD große Überschneidungen. Dennoch finden wir Muster thematischer und formaler Polarisierung, auf die wir eingehen. Zudem wird der Datensatz auch für die Forschung zu offensiver Sprache oder Hate Speech im Facebook-Wahlkampf verwendet. Hier leistet die Sylvia Jaki die wesentliche Forschungsarbeit und wird auch erste Ergebnisse präsentieren. 

Warum ist diese Forschung wichtig?

Die Bundestagswahl 2017 war einschneidend, sowohl im Hinblick auf das Ergebnis der Wahl (insbesondere der Erfolg der Rechtspopulisten) als auch den Online-Wahlkampf. Es gilt gerade im Vorfeld weiterer Wahlkämpfe (Länder/Europa) Lehren daraus zu ziehen und viel diskutierte Tendenzen der politischen Kommunikation und angenommene Gefahren für die Demokratie an der Realität zu überprüfen.

„Echo chambers and polarisation in the German federal election 2017”

Fritz Kliche, Stefan Steiger und Prof. Dr. Wolf Schünemann forschen zu Echokammern in sozialen Medien. Der Computerlinguist Fritz Kliche forscht in der Arbeitsgruppe von Professor Ulrich Heid.

Mich interessieren besonders die „Digital Humanities“ – also die Zusammenarbeit von Informatikern oder in unserem Fall Computerlinguisten mit Forscherinnen und Forschern aus den Geistes- oder Sozialwissenschaften, sagt Fritz Kliche. Mit seiner Arbeit möchte er dazu beitragen, dass Forschung in den digitalen Geisteswissenschaften in Hildesheim ausgebaut werden und in der interdisziplinären Zusammenarbeit weitere wichtige Forschungserkenntnisse erarbeitet werden können.

Automatic detection of hate speech on social media

Medienlinguistin Dr. Sylvia Jaki

Dr. Sylvia Jaki ist Lehrkraft für besondere Aufgaben am Institut für Übersetzungswissenschaft und Fachkommunikation in Hildesheim und forscht im Bereich der Medienlinguistik. Mit Kollegen der Universität Antwerpen hat sie ein Computerprogramm entwickelt, das in der Lage ist, automatisiert hetzerische Wörter und Wortkombination in Tweets aufzuspüren. Sie befasst sich mit sprachlichen Charakteristika der Medien und arbeitet an ihrer Habilitation.

Frau Dr. Jaki, welches Forschungsergebnis stellen Sie vor?

Für die Facebook-Daten des Projekts „Wahlkampf in (a)sozialen Netzwerken“ (WasN) von Wolf Schünemann konnten wir zeigen, dass die Facebook-Profile von Parteien und Politikerinnen und Politikern an den politischen Rändern während der letzten Bundestagswahl tendenziell mehr Hate Speech aufwiesen als bei den Parteien der politischen Mitte. Dies heißt aber nicht unbedingt, dass sich die Hate Speech GEGEN die Partei beziehungsweise den Politiker oder die Politikerin richtet. Unsere Analysemethode demonstriert überdies, dass lexikonbasierte Ansätze zu transparenteren Systemen bei der Erkennung von Hate Speech beitragen können.

Warum ist diese Forschung wichtig?

Hate Speech hat sich zu einem omnipräsenten Phänomen in den Medien entwickelt. Wie aber wollen wir damit umgehen – automatisiert entfernen, akzeptieren oder dagegen andiskutieren? Dies ist eine Frage, die vielerorts diskutiert wird und auch unbedingt diskutiert werden sollte. Aufgrund der Schwächen, die Detektionssoftware derzeit noch aufweist, ist es wichtig, Detektionssysteme zu schaffen, die einen Einblick in die Klassifikationsmechanismen geben, um die oftmals als Black Box bezeichnete Künstliche Intelligenz transparenter zu machen.

Die Fragen stellte Isa Lange.


Professor Ulrich Heid forscht und lehrt am Institut für Informationswissenschaft und Sprachtechnologie der Universität Hildesheim und kooperiert mit Forschungsgruppen in den Sozialwissenschaften und in der Politikwissenschaft. Foto: Daniel Kunzfeld