Korpus C4

Header:
MdCreator:ICLTT, Vienna
MdCreationDate:2014-03-20
MdProfile:clarin.eu:cr1:p_1290431694580
MdCollectionDisplayName:CLARIN Centre Vienna / Language Resources Portal
TextCorpusProfile:
GeneralInfo:
ResourceName:Korpus C4
ResourceTitle:Korpus C4
ResourceClass:Corpus
LifeCycleStatus:released
StartYear:2003
CompletionYear:2008
PublicationDate:2008
TimeCoverage:20th century
TimeCoverage:20. Jh.
Location:
Address:Basel, Berlin, Bozen, Wien
Region:German speaking countries in Central Europe
Country:
CountryName:Austria, Germany, Switzerland, South Tirol/Italy
CountryCoding:DE
Descriptions:
Description:The corpus is a sample of four standard varieties of German (Austria, Germany, Switzerland and South Tirol) over the whole 20th century
Description:Das Korpus bietet eine Auswahl an Texten aus den Varietäten des Deutschen (Deutschland, Österreich, Schweiz, Südtirol) möglichst breit gestreute über den Zeitraum 1900-2000 und bezüglich der Textsorten
Project:
ProjectName:Korpus C4
ProjectTitle:Korpus C4
Cooperations:
Descriptions:
Description:Ein gemeinsames Projekt des Digitalen Wörterbuchs der deutschen Sprache des 20. Jahrhunderts (DWDS), des Austrian Academy Corpus (AAC), des Korpus Südtirol und des SCHWEIZER TEXT KORPUS (CHTK) mit dem Ziel, die deutsche Standardsprache des 20. Jahrhunderts möglichst ausgewogen zu erfassen und online zugänglich zu machen.
Cooperation:
CooperationPartner:Digitale Wörterbuch der deutschen Sprache des 20. Jahrhunderts (DWDS)
Organisation:BBAW, Berlin
Cooperation:
CooperationPartner:Austrian Academy Corpus (AAC) (jetzt ICLTT)
Organisation:Austrian Academy of Sciences, Wien
Cooperation:
CooperationPartner:Korpus Südtirol
Organisation:EURAC Research, Bozen
Cooperation:
CooperationPartner:Schweizer Textkorpus (CHTK)
Organisation:Universität Basel
Duration:
StartYear:2003
CompletionYear:2008
CorpusContext:
CorpusType:general corpus
TemporalClassification:diachronic
Descriptions:
Description:The corpus is a sample of four standard varieties of German (Austria, Germany, Switzerland and South Tirol) over the whole 20th century
Description:Das Korpus bietet eine Auswahl an Texten aus den Varietäten des Deutschen (Deutschland, Österreich, Schweiz, Südtirol) möglichst breit gestreute über den Zeitraum 1900-2000 und bezüglich der Textsorten
Creation:
Annotation:
AnnotationMode:mixed (primarily automatic)
AnnotationStandoff:inline
SegmentationUnits:
SegmentationUnit:paragraph
SegmentationUnit:orthographic sentence
SegmentationUnit:lexeme
AnnotationTypes:
AnnotationType:
AnnotationLevelType:lemma
AnnotationType:
AnnotationLevelType:part of speech
TagsetInfo:
Tagset:STTS
AnnotationToolInfo:
AnnotationTool:TreeTagger
Access:
Availability:The corpus can be accessed freely via a online search interface
DistributionMedium:online web application
Contact:
Person:Matej Durco
Role:Technical Contact
Address:Sonnenfelsgasse 19, 1010 Vienna
Email:matej.durco@oeaw.ac.at
Department:Institut für Corpus Linguistik und Texttechnologie
Organisation:Austrian Academy of Sciences
SubjectLanguages:
NoLanguages:monolingual
Descriptions:
Description:written German language of the 20th century
Description:geschriebene Deutsche Sprache des 20. Jarhhunderts
SubjectLanguage:
Language:
LanguageName:German
LanguageName:Deutsch
ISO639:
iso-639-3-code:deu
SizeInfo:
TotalSize:
Size:50000000
SizeUnit:tokens
Descriptions:
Description:approx. 50 Mio. tokens
ModalityInfo:
Modalities:written
TextTechnical:
CharacterEncoding:UTF-8
MimeTypes:
MimeType:text/xml