Kompost
Laufzeit
In welchem Zeitraum wurden die Korpusdaten erhoben?
November 2009–Oktober 2012
Leitung/Kooperationspartner
Unter der Leitung welcher Organisation wurde das Korpus angelegt? Welche Kooperationspartner waren beteiligt?
Humboldt-Universität zu Berlin; Projektleiterin: Prof. Dr. Anke Lüdeling Promovierende: Jasmine Bennöhr
Forschungsprojekt
Im Rahmen welches Forschungsprojektes wurde das Korpus angelegt?
„Ermittlung von Indikatoren für die Kompetenzeinschätzung von Schülertexten mittels computerlinguistischer Methoden und dialogische Entwicklung eines Prototyps für die computergestützte Analyse von Aufsätzen“
Forschungsfragen/Ziele
Für die Beantwortung welcher Fragen/mit welchem Ziel wurde das Korpus angelegt?
Der Einsatz computerlinguistischer Methoden soll Abhilfe bei der Aufsatzbewertung schaffen und belastbare, differenzierte Indikatoren für die Qualität von Schülertexten für die deutsche Sprache ermitteln und untersuchen. Die in diesem Projekt ermittelten Indikatoren, die auf eine besonders gute oder schlechte sprachliche Kompetenz hinweisen, sollen Eingang in eine Analysesoftware finden.
Gesamtgröße des Korpus
Den Kern der Untersuchung bilden 8000 Aufsätze aus der 4., sowie 1000 Aufsätze aus der 8. Klasse (KESS).
Subkorpora
KESS 4/ KESS 7/ KESS 8/ KESS 10
Fokus L1-/L2-Lerner
Gibt es einen Fokus auf L1- oder L2-Lernende des Deutschen? Wenn ja, welchen?
Kein Fokus.
Datengrundlage
Woher stammen die Korpusdaten?
Als Datenbasis standen für dieses Projekt viele Tausend Aufsätze, Testergebnisse und Hintergrundinformationen von Schülern aus der Hamburger Längsschnittuntersuchung "Kompetenzen und Einstellungen von Schülerinnen und Schülern" (KESS) zur Verfügung (BMBF 2019).
Metadaten zur Lernerpopulation
Welche Metadaten sind zu Lernerpopulation gegeben und in welcher Form sind sie gegeben?
Bildungsspezifische Angaben:
Sprachbiographische Angaben:
Familiensprache (Deutsch/andere)/ Muttersprache (Deutsch/andere) in KESS 10/11
Schulform:
Primarstufe/ Haupt- und Realschulen/ Gymnasien/ IGS/ KGS/ Oberstufe
Klassenstufe:
4./ 7./ 8./ 10. Klasse
Schulische Lernbedingungen/Unterrichtsmerkmale:
Maßnahmen zur Leseförderung/ Zusatzangebote für bestimmte Schülergruppen/ Ganztagsangebote/ Fördermaßnahmen/ Lehrerkooperation/ Einstellungen der Schulleitung zu Schulerfolg und -misserfolg/ Nachhilfeunterricht (KESS 7)
Datenerhebung
Mit welchen Methoden und unter welchen Umständen wurden die Daten erhoben?
Untersuchungsdesign:
Längsschnitt
Zusätzliche Messinstrumente:
in unterschiedlicher Ausprägung in den verschiedenen KESS-Erhebungen: C-/ Grammatik-/ Wortschatztests/ KFT/ Rechtschreibung/ Leseverständnistest
Zusätzliche Informationen zu der Texterhebung
Schreibthema:
Thematische Streuung
Datenaufbereitung
Wie wurden die Daten aufbereitet/angereichert?
Originaltext:
Sind die Originaltexte der Lernenden zugänglich?
k.A. aber digitalisierte Rohdaten als Analysegrundlage
Glättung der Originaltexte/Fehlerannotation:
Wie wurden die Originaldaten (z.B. für maschinelle Lasbarkeit) manipuliert?
Hinweise auf manuelle Digitalisierung der Schülertexte (und Operationsalisierung des Interpretationsspielraums)
Elektronische Abfrageoberfläche
Eine elektronische, durchsuchbare Abfrageoberfläche ist nicht vorhanden.
Linguistische Annotationen
Welche linguistischen Annotationen wurden an den Korpusdaten vorgenommen?
Morphosyntax/Wortarten
Scheinbar automatische Annotation der Wortarten mittels Treetagger
Statische Merkmale
Wortlänge/ Kommata/ Satzlänge/ Großbuchstaben/ Formel (enthält Wortlänge, Satzlänge und einen Konjunktionsquotienten)/ Demonstrativa/ Verwendung verschiedener Affixe
Dokumentationsformen
Formate/Downloadmöglichkeiten:
Können Suchergebnisse/Korpusdaten heruntergeladen werden?
Hinweise auf Ablage der Testergebnisse in einer SPSS-Datei
Korpusnutzung/Zugang:
Es besteht kein öffentlicher Korpuszugang.