Slowakisches Nationalkorpus Slovenský národný korpus Tschechisches Nationalkorpus Česky národní korpus erstellt von: Rita Plos Seminar: Slawische Korpuslinguistik.

Презентация:



Advertisements
Похожие презентации
Deutsche einsprachige Korpora немецкие одноязычные корпуса Institut für Slawistik Seminar: Slawische Korpuslinguistik SS 2006 O. Prof. Dr. Branko Tošović.
Advertisements

Berlin Shilina Rita.. Оглавление: Географическое положение Берлина Географическое положение Берлина Историческая справка Историческая справка.
Französisch-Slawische Korpuslinguistik Французско- славянская корпусная лингвистика Aigner Ruth Prenn Linde SE Korpuslinguistik O. Univ.-Prof. Dr. Branko.
Heilige Nacht Weihnacht heißt eigentlich Heilige Nacht. Gemeint ist die Nacht vom 24 auf den 25 Dezember. Mit dieser Heiligen Nacht wird alle Jahre wieder.
Sankt-Petersburg Владелин Тимур Ученик 7в класса Гимназия 524. Санкт-Петербург Учитель: Владелина Г.А.
Heute ist der 19. November. Montag. Man reist nach Osten, Man reist nach Westen, Aber zu Hause ist es am besten.
Reise nach Berlin. Оглавление: Географическое положение Берлина Географическое положение Берлина Историческая справка Историческая справка.
Berlin. Die Hauptstadt Deutschlands Berlin liegt an den beiden Ufern der Spree. Diese Stadt wurde im Jahre 1237 gegründet. Auf dem Wappen Berlins steht.
Reise nach Berlin Презентация для проведения урока немецкого языка в 6 классе по теме «Достопримечательности Берлина.» Автор – учитель МОУ ООШ с. Пичевки.
Die BRD liegt in Mitteleuropa. Sie betsteht aus 16 Bundeslandern. Sie grenzt an Polen, Tschechien…. Die Staatsfarben sind schwarz-rot- gold Das Staatswappen.
Учитель немецкого языка 1 категории Кошелева Наталья Валентиновна Ростовская область Муниципальное бюджетное общеобразовательное учреждение Матвеево-Курганская.
In Lachlauter an der Immer Steht die Welt glatt auf dem Kopf. In dem Schreibtisch steht ein Zimmer. In der Suppe kocht der Topf.
Überall in Deutschland ist der Advent die stimmungsvollste Zeit des Jahres bis zum Heiligen Abend am 24. Dezember. An diesem Tag feiern die Christen die.
AUS DEUTSCHER KLASSIK. Johann Wolfgang von Goethe.
Работу выполнела ученица 8 класса Миронова виктория.
Russische Korpuslinguistik im Internet Ру́́́́сская корпусная лингвистика Erstellt durch: Doris Weißenböck Andreas Konrad Sprachwissenschaftliches Seminar.
31 P e r m Willkommen in Perm ! Заварзина Галина Васильевна, Заварзина Галина Васильевна, МОУ «Пантелеевская основная МОУ «Пантелеевская основная общеобразовательная.
Маршрутный лист «Числа до 100» ? ? ?
Spielzeug aus Dymkowo Sloboda Dymkowo wurde 15. Jahrhundert gegrundet. Das war ein kleines Dorf nicht weit von Wjatka. Meisterinnen der Volkskunst formen.
1.Mein Metaprojekt heiBt « Eine alte deutsche Stadt»
Транксрипт:

Slowakisches Nationalkorpus Slovenský národný korpus Tschechisches Nationalkorpus Česky národní korpus erstellt von: Rita Plos Seminar: Slawische Korpuslinguistik SS 2006 O. Prof. Dr. Branko Tošović Graz, am

Slowakisches Nationalkorpus Slovenský národný korpus Leitung: PhDr. Mária Šimková Institut: Ľ. Štúr-Institut f. Linguistik Slowakische Akademie der Wissenschaften, Bratislava Jazykovedný ústav Ľ. Štúra Slovenská Akadémia Vied, Bratislava Verfügbarkeit:Internet - Sprachen: Slowakisch/Englisch 2 SE: Slawische Korpuslinguistik, SS 2006

Struktur des SNK Štruktúra SNK Allgemeines (primäres) Korpus Všeobecný (primárny) korpus Linguistische Quellen Lingvistické zdroje Parallelkorpus Paralelné korpusy 3 SE: Slawische Korpuslinguistik, SS 2006

Allgemeines (primäres) Korpus Všeobecný (primárny) korpus Die derzeitige Version dieses Korpus heißt prim-2.1: prim-2.1-public-all – enthält alle Texte: token prim-2.1-public-inf – enthält nur journalistische Texte: token prim-2.1-public-prf – enthält nur Wissenschafts- & Fachtexte: token prim-2.1-public-img – enthält nur Belletristik: token 4 SE: Slawische Korpuslinguistik, SS 2006

Allgemeines (primäres) Korpus Všeobecný (primárny) korpus prim-2.1-public-sane – durchgesehenes Korpus, enthält nur nicht-linguistische Texte mit Standardqualität (richtige diakritische Zeichen, Standard der slowakischen Gegenswartssprache): token prim-2.1-public-skimg – enthält nur original slowakische Belletristik: token prim-2.1-vyv – ausgeglichenes Korpus (60% journalitische Texte, 20% Belletristik, 20% Fachtexte): token 5 SE: Slawische Korpuslinguistik, SS 2006

Allgemeines (primäres) Korpus Všeobecný (primárny) korpus Außerdem gibt es ein spezielles Subkorpus: r-mak händisch morphologisch annotiertes Korpus: token 6 SE: Slawische Korpuslinguistik, SS 2006

Linguistische Quellen Lingvistické zdroje Slowakische Sprachwissenschaftler 1976 – 2000 Slovenskí jazykovedci Kleines Wörterbuch der Slowakischen Sprache Krátky slovník slovenskeho jazyka Volltext Datenbank mit ausgewählten Exemplaren des Kultúra slova Magazins Vybrané čísla časopisu Kultúra slova 7 SE: Slawische Korpuslinguistik, SS 2006

Parallelkorpus Paralelné korpusy Parallelkorpus f. Computer-Fachausdrücke - Sprachen: alle slawischen Sprachen, alle romanischen Sprachen, Deutsch, Englisch, Chinesisch etc. 8 SE: Slawische Korpuslinguistik, SS 2006

Tschechisches Nationalkorpus Česky národní korpus Leitung: Prof. PhDr. František Čermák, DrSc. Institut: Institut des ČNK, Karlsuniversität, Prag Ústav Českého národního korpusu,Univerzita Karlova, Praha Verfügbarkeit:Internet - Sprachen: Tschechisch / Englisch Gegründet: SE: Slawische Korpuslinguistik, SS 2006

Struktur des ČNK Struktura ČNK Synchroner Teil / Synchronní část : 1. Geschriebenes Korpus / Psané korpusy 2.Gesprochenes Korpus / Mluvené korpusy 3. Parallelkorpora / Paralelní korpusy Diachroner Teil / Diachronní část : 1. Diachrones Korpus / Diachronní korpus 10 SE: Slawische Korpuslinguistik, SS 2006

Geschriebenes Korpus Psané korpusy SYN2000 – enthält zeitgenössische, tschechische Texte: Wörter SYN2005 – enthält zeitgenössische, tschechische Texte: Wörter 11 SE: Slawische Korpuslinguistik, SS 2006 SYN 2000SYN2005 Publizistik publicistika 60%33% Fachliteratur odborná lit. 15%40% Belletristik beletrie 25%27%

Geschriebenes Korpus Psané korpusy PUBLIC – reduzierte Version v. SYN2000 (ohne Passwort): Wörter - 60% Publizistik / publicistika - 25% Fachliteratur / odborná literatura - 15% Belletristik / beletrie 12 SE: Slawische Korpuslinguistik, SS 2006

Geschriebenes Korpus Psané korpusy Weiters: FSC2000 SYNEC LITERA ORWELL DB – unterstützende Datenbanken und elektr. Wörterbücher 13 SE: Slawische Korpuslinguistik, SS 2006

Geschriebenes Korpus Psané korpusy ČNKSYN-Archiv – enthält elektr.Texte in rohen Dateiformaten (MS Word, Ventura etc.), meist nur als Sicherungskopie ČNKSYN-Bank – enthält die an das Korpusformat (SGML), angepassten Texte. Leider ist es nicht möglich die ČNKSYN als ein großes Korpus anzubieten. 14 SE: Slawische Korpuslinguistik, SS 2006

Gesprochenes Korpus Mluvené korpusy Prager gesprochenes Korpus Pražský mluvený korpus Brünner gesprochenes Korpus Brněnský mluvený korpus 15 SE: Slawische Korpuslinguistik, SS 2006

Parallelkorpora Paralelní korpusy 16 SE: Slawische Korpuslinguistik, SS 2006 InterCorp – Projekt (keine näheren Angaben)

DIAKORP – Auswahl alter, tschechischer Texte (13.Jh.) bis heute: ~ Wörter DB – Datenbanken & Wörterbücher auf Alt-Tschechisch ČNKDIA-Archiv – enthält gescannte Texte des Alt- Tschechischen Diachrones Korpus Diachronní korpus SE: Slawische Korpuslinguistik, SS

Diachrones Korpus Diachronní korpus ČNKDIA-Bank – enthält: - transkribierte Texte ( Wörter), - transliterierte Texte ( Wörter) - Dialekt-Texte ( Wörter) DIAL – geplantes Dialektkorpus 18 SE: Slawische Korpuslinguistik, SS 2006

Literatur und Quellen Literatúra a prameňe / Literatura a prameny Slowakisch / Slovenský Jarošová 1993: Jarošová, A. Korpus textov slovenského jazyka. – In: Slovenská reč. – Bratislava, – Ročník 58, číslo 2. – S Гарабик 2004: Гарабик, Р. Словацкий национальный корпус. – In: Труды международной конференции Корпусная лингвистика – – Санкт-Петербург: Изд-во Санкт- Петербургского ун-та. – С SE: Slawische Korpuslinguistik, SS 2006

Literatur und Quellen Literatúra a prameňe / Literatura a prameny Tschechisch/ Český Petkevič 2004: Petkevič, V. Rule-Based Part-of-Speech and Morphological Disambiguation of the Czech National Corpus. – In: Труды международной конференции Корпусная лингвистика – – Санкт - Петербург : Изд - во Санкт - Петербургского ун - та. – С Rychly/Smrz 2004: Rychly, P.; Smrz, P. Manatee, Bonito and Word Sketches for Czech. – In: Труды международной конференции Корпусная лингвистика – – Санкт - Петербург : Изд - во Санкт - Петербургского ун - та. – С SE: Slawische Korpuslinguistik, SS 2006

Literatur und Quellen Literatúra a prameňe / Literatura a prameny Копршивова 2004: Копршивова, М. К некоторым вопросам, связанным с лемматизацией корпуса чешских текстов. – In: Труды международной конференции Корпусная лингвистика – – Санкт-Петербург: Изд-во Санкт-Петербургского ун-та. – С SE: Slawische Korpuslinguistik, SS 2006