Logo Syntagmatikon
Logo IDS

Korpora im Syntagmatikon

Das am IDS beheimatete Deutsche Referenzkorpus (DeReKo) ist die empirische Grundlage für nahezu alle Ressourcen des Syntagmatikons. Bei DeReKo handelt es sich um die „[...] weltweit größte Sammlung deutschsprachiger Korpora als empirische Basis für die linguistische Forschung“ (57,6 Mrd. Wörter; Stand 09.01.2024). Den einzelnen Ressourcen liegen unterschiedliche nicht-annotierte und annotierte Teilkorpora zugrunde:


Tagged-T (DeReKo-Teilkorpus)

Webkorpora esTenTen18 und skTenTen11; Slowakisches Nationalkorpus SNK

Alle anderen Ressourcen basieren unterschiedlichen Ausgaben der DeReKo-W-Archive.

Für die Auswertung kamen quantitative Methoden wie Frequenzzählungen, iterative Suchen nach Textbelegen, statistische Kookkurrenzanalysen sowie Slot-Füller-Analysen zum Einsatz.