Logo
Logo

Korpora im Syntagmatikon

Das am IDS beheimatete Deutsche Referenzkorpus (DeReKo) ist die empirische Grundlage für nahezu alle Ressourcen des Syntagmatikons. Bei DeReKo handelt es sich um die „[...] weltweit größte Sammlung deutschsprachiger Korpora als empirische Basis für die linguistische Forschung“ (57,6 Mrd. Wörter; Stand 09.01.2024). Den einzelnen Ressourcen liegen unterschiedliche nicht-annotierte und annotierte Teilkorpora zugrunde:


Tagged-T (DeReKo-Teilkorpus)

Webkorpora esTenTen18 und skTenTen11; Slowakisches Nationalkorpus SNK

Alle anderen Ressourcen basieren unterschiedlichen Ausgaben der DeReKo-W-Archive.

Für die Auswertung kamen quantitative Methoden wie Frequenzzählungen, iterative Suchen nach Textbelegen, statistische Kookkurrenzanalysen sowie Slot-Füller-Analysen zum Einsatz.