Das Computerlinguistische Teilprojekt von SOLDISK zielt auf die Operationalisierung von Annahmen zu Solidaritäts- bzw. Entsolidarisierungsdiskursen, wie sie von den Sozialwissenschaften aufgrund theoretischer Beschreibung und anhand von Detailanalysen von Texten aufgestellt werden. Ziel ist es, von den Einzelanalysen hin zur automatischen Analyse größerer Datenmengen zu generalisieren.

Dazu werden verschiedene computerlinguistische Methoden und Verfahren wie z. B. Part-of-Speech-Tagging, Parsing und Methoden der Distributionellen Semantik benutzt. Ein Beispiel ist die Suche nach textuellen und/oder strukturellen Indikatoren für solidarische bzw. entsolidarisierte Sichtweisen auf die Migrationsdebatte, sowie für Begründungen für die jeweils vertretenen Positionen. Darauf aufsetzend benutzen wir Ansätze des maschinellen Lernens (=ML), die eine Generalisierung von Beispielfällen auf große Datenmengen erlauben sollen.

Genuin computerlinguistisch ist dabei die Frage nach geeigneten ML-Verfahren, oder auch das Problem, dass wir alle Schritte des Forschungsprozesses, komputationelle ebenso wie manuelle, ausführlich dokumentieren wollen, idealerweise durch Prozessmetadaten.
Daneben wird die infrastrukturelle Aufgabe der Beschaffung, linguistischen Annotationen und Aufbereitung von Textdaten als Korpora realisiert.

 

Kontakt:

Dipl.- Ling. Max Kisselew, Prof. Dr. Ulrich Heid
IwiSt – Sprachtechnologie/ Computerlinguistik
Universität Hildesheim
Universitätsplatz 1
Raum LN 128
31141 Hildesheim
Tel.: 05121/ 88330-310, Fax -305
E-Mail: Bitte verwenden Sie das folgende Kontaktformular: