Kompost



Laufzeit

In welchem Zeitraum wurden die Korpusdaten erhoben?

November 2009–Oktober 2012


Leitung/Kooperationspartner

Unter der Leitung welcher Organisation wurde das Korpus angelegt? Welche Kooperationspartner waren beteiligt?

Humboldt-Universität zu Berlin; Projektleiterin: Prof. Dr. Anke Lüdeling Promovierende: Jasmine Bennöhr


Forschungsprojekt

Im Rahmen welches Forschungsprojektes wurde das Korpus angelegt?

„Ermittlung von Indikatoren für die Kompetenzeinschätzung von Schülertexten mittels computerlinguistischer Methoden und dialogische Entwicklung eines Prototyps für die computergestützte Analyse von Aufsätzen“


Forschungsfragen/Ziele

Für die Beantwortung welcher Fragen/mit welchem Ziel wurde das Korpus angelegt?

Der Einsatz computerlinguistischer Methoden soll Abhilfe bei der Aufsatzbewertung schaffen und belastbare, differenzierte Indikatoren für die Qualität von Schülertexten für die deutsche Sprache ermitteln und untersuchen. Die in diesem Projekt ermittelten Indikatoren, die auf eine besonders gute oder schlechte sprachliche Kompetenz hinweisen, sollen Eingang in eine Analysesoftware finden.


Gesamtgröße des Korpus

Den Kern der Untersuchung bilden 8000 Aufsätze aus der 4., sowie 1000 Aufsätze aus der 8. Klasse (KESS).


Subkorpora

KESS 4/ KESS 7/ KESS 8/ KESS 10


Fokus L1-/L2-Lerner

Gibt es einen Fokus auf L1- oder L2-Lernende des Deutschen? Wenn ja, welchen?

Kein Fokus.


Datengrundlage

Woher stammen die Korpusdaten?

Als Datenbasis standen für dieses Projekt viele Tausend Aufsätze, Testergebnisse und Hintergrundinformationen von Schülern aus der Hamburger Längsschnittuntersuchung "Kompetenzen und Einstellungen von Schülerinnen und Schülern" (KESS) zur Verfügung (BMBF 2019).


Metadaten zur Lernerpopulation

Welche Metadaten sind zu Lernerpopulation gegeben und in welcher Form sind sie gegeben?

Bildungsspezifische Angaben:

Sprachbiographische Angaben:
Familiensprache (Deutsch/andere)/ Muttersprache (Deutsch/andere) in KESS 10/11

Schulform:
Primarstufe/ Haupt- und Realschulen/ Gymnasien/ IGS/ KGS/ Oberstufe

Klassenstufe:
4./ 7./ 8./ 10. Klasse

Schulische Lernbedingungen/Unterrichtsmerkmale:
Maßnahmen zur Leseförderung/ Zusatzangebote für bestimmte Schülergruppen/ Ganztagsangebote/ Fördermaßnahmen/ Lehrerkooperation/ Einstellungen der Schulleitung zu Schulerfolg und -misserfolg/ Nachhilfeunterricht (KESS 7)


Datenerhebung

Mit welchen Methoden und unter welchen Umständen wurden die Daten erhoben?

Untersuchungsdesign:

Längsschnitt

Zusätzliche Messinstrumente:

in unterschiedlicher Ausprägung in den verschiedenen KESS-Erhebungen: C-/ Grammatik-/ Wortschatztests/ KFT/ Rechtschreibung/ Leseverständnistest

Zusätzliche Informationen zu der Texterhebung

Schreibthema:

Thematische Streuung


Datenaufbereitung

Wie wurden die Daten aufbereitet/angereichert?

Originaltext:

Sind die Originaltexte der Lernenden zugänglich?
k.A. aber digitalisierte Rohdaten als Analysegrundlage

Glättung der Originaltexte/Fehlerannotation:

Wie wurden die Originaldaten (z.B. für maschinelle Lasbarkeit) manipuliert?
Hinweise auf manuelle Digitalisierung der Schülertexte (und Operationsalisierung des Interpretationsspielraums)


Elektronische Abfrageoberfläche

Eine elektronische, durchsuchbare Abfrageoberfläche ist nicht vorhanden.


Linguistische Annotationen

Welche linguistischen Annotationen wurden an den Korpusdaten vorgenommen?

Morphosyntax/Wortarten

Scheinbar automatische Annotation der Wortarten mittels Treetagger

Statische Merkmale

Wortlänge/ Kommata/ Satzlänge/ Großbuchstaben/ Formel (enthält Wortlänge, Satzlänge und einen Konjunktionsquotienten)/ Demonstrativa/ Verwendung verschiedener Affixe


Dokumentationsformen

Formate/Downloadmöglichkeiten:

Können Suchergebnisse/Korpusdaten heruntergeladen werden?
Hinweise auf Ablage der Testergebnisse in einer SPSS-Datei

Korpusnutzung/Zugang:

Es besteht kein öffentlicher Korpuszugang.


Quellen

Informationen entnommen aus verschiedenen Posterpräsentationen/ Projektbeschreibungen: hier; hier; zusätzlich Informationen aus Berichten zu KESS 7 und 10/11: hier und hier