Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik Seminar: Slawische Korpuslinguistik SS 2006 O. Prof. Dr. Branko Tošović.

Презентация:



Advertisements
Похожие презентации
Französisch-Slawische Korpuslinguistik Французско- славянская корпусная лингвистика Aigner Ruth Prenn Linde SE Korpuslinguistik O. Univ.-Prof. Dr. Branko.
Advertisements

(Schloss Charlottenburg ) Schloss Charlottenburg ist eines der meistbesuchten Orte in Berlin. Es war die erste Königin von Preußen, Sophie Charlotte.
Wie heisst diese Stadt? Tschigulbaewa Venera. Diese Stadt ist Hauptstadt des Landes Bayern. Die Stadt zählt heute uber 1,2 Millionen Einwohner. Nach dem.
Das Schulsystem in Deutschland und Ukraine. Die Kinder gehen in die Grundschule mit 6 Jahren.
Berlin Die Hauptstadt Deutschlands ist Berlin. Das ist eine alte Stadt.Sie liegt an der Spree.
Hochschulwesen in Deutschland.
Berlin Выполнил: Михайленко Сергей. Berlin wurde im 13. Jahrhundert gegründet.1237 wird Berlin das erste Mal in einer Urkunde erwähnt, und von daher errechnen.
Medien. Zeitungen und Zeitschriften. Der deutsche Zeitungsmarkt ist durch eine kleine Zahl von überregionalen Tageszeitungen und einer gut entwickelten.
MŰNCHEN München ist Hauptstadt des Landes Bayern München ist Hauptstadt des Landes Bayern. Das 1158 gegrundete München entwickelte sich sehr schnell durch.
,,Einstein in der Wissenschaft und Politik. Zeit (wann?)Ort (wo?)Geschehen (was?) Ulm Einstein wurde geboren. Ab 1885MünchenEinstein besuchte.
Путешествие по городам г ермании Deutschland. DRESDEN LEIPZIG DIE BERUHMTE DEUTSCHE STADTE: Koln Hamburg Berlin Erfurt Leipzig Dresden BERLIN.
Massenmedien. Ist es wirklich die vierte Macht?. Задачи урока Ознакомление с новой лексикой. Знакоство со СМИ Германии и России.
Die Geschichte der Entwicklung der Informations-Technologie.
Frankfurt am Main. Frankfurt am Main ist mit über Einwohnern die größte Stadt Hessens und nach Berlin, Hamburg, München und Köln die fünftgrößte.
Frankfurt am Main. Frankfurt am Main ist mit über Einwohnern die größte Stadt Hessens und nach Berlin, Hamburg, München und Köln die fünftgrößte.
Wir wollten das Problem studieren. Warum studieren die Menschen in 21. Jahrhundert die Fremdsprache?
1.Mein Metaprojekt heiBt « Eine alte deutsche Stadt»
ПОДГОТОВИЛА УЧЕНИЦА 8 КЛАССА МОРОЗОВА ЮЛИЯ Meine Schule.
МОУ «ООШ с. Малое Перекопное» Саратовской области Учитель немецкого языка Потапова Марина Ивановна.
Berlin Museumsinsel Berlin verfügt über eine Vielzahl von Museen. Im Jahr 1841 bestimmte eine königliche Order, die von Spree und Kupfergraben umflossene.
Транксрипт:

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik Seminar: Slawische Korpuslinguistik SS 2006 O. Prof. Dr. Branko Tošović Erstellt von Karin Markut немецкие одноязычные корпуса Deutsche einsprachige Korpora

немецкие одноязычные корпуса Institut für Slawistik BAS Bayerisches Archiv für Sprachsignale 1995 gegründet Korpora mit gelesener Sprache Korpora mit spontaner Sprache Korpora mit akzentuierter/dialektaler Sprache Korpora mit Telefon-Sprache Korpora mit hoher technischer Qualität (Studio) BAS DSAv DWDS

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik Korpus Besteht aus Tokens ( Sätzen) deutscher Zeitungstexte aus der Frankfurter Rundschau Die Texte sind der CD "Multilingual Corpus 1" der European Corpus Initiative entnommen und wurden erweitert. Lizenz für wissenschaftliche Nutzung frei Eine Volllizenz kostet 4000 EURO, und eine Upgradelizenz 1500 EURO. BAS DSAv DWDS

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik DSAv Deutsches Spracharchiv 28 aufbereitete Korpora Tonaufnahmen und Transkripte : -Binnendeutsche Umgangssprachen / Standardsprache -Auslandsdeutsche Varietäten -verbale Interaktionen: Sprechen im sozialen Kontext (z.B. Beratungsgespräche) // Spracherwerb / Sprachentwicklung BAS DSAv DWDS

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik DWDS Digitale Wörterbuch der deutschen Sprache des 20. Jh. Wörterbuch Korpora -DWDS-Kernkorpus -ZEIT-Korpus -Berliner Tagesspiegel, PNN -DDR-Corpus -Corpus jüdischer Periodika -Demonstrationskorpus zur Anonymisierung von Eigennamen BAS DSAv DWDS

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik DWDS – Kernkorpus: 100 Mill. laufende Textwörter von Anzahl der Dokumente: Textsorten: Schöne Literatur (ca. 26%) Journalistische Prosa (ca. 27%) Fachprosa (ca. 22%) Gebrauchstexte (ca. 20%) (Transkribierte) Texte gesprochener Sprache (ca. 5%) BAS DSAv DWDS

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik ZEIT-Korpus: Umfang: 45 Mill. Tokens in Artikeln Textgrundlage: alle ZEIT-Ausgaben von Das ZEIT-Corpus wird täglich aktualisiert. Berliner Tagesspiegel und Potsdamer Neuesten Nachrichten: Umfang: 170 Mill. Tokens ( Artikel) bzw. 15 Mill. Tokens Textgrundlage: alle online erschienenen Artikel zw und Juni BAS DSAv DWDS

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik DDR-Korpus: umfasst 1150 Dokumente von Jüdische Periodika - 8 Zeitschriften (26 Mill. Tokens) bis 1938 Alle Korpora = lemmatisiert und mit Wortartinformationen versehen BAS DSAv DWDS Projektrealisierung in drei Etappen Textkorpuserstellung Computerlinguistische Erschließung Lexikographische Arbeit

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik Digitalisierung - Von der Textvorlage zur XML-Datei Kernkorpus: über 40 Mill. Textwörter digitalisiert in XML-Dateien aufbereitet [~ DIN A 4 Seiten] BAS DSAv DWDS

Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik BAS DSAv DWDS Online-Recherche mit Anmeldung: Textkorpus 102 Mio. Wörter, ohne Anmeldung: Textkorpus 22 Mio. Wörter,