Piwik tracking image

Please wait... 

Deutsches Textarchiv (DTA) und CLARIN-D 

Resource tools

File information File size Options

Original PDF File

1.9 MB Download

Low resolution print

1415 × 2000 pixels (2.83 MP)

12 cm × 16.9 cm @ 300 PPI

576 KB Download

Screen

566 × 800 pixels (0.45 MP)

4.8 cm × 6.8 cm @ 300 PPI

119 KB Download

Preview

Full screen preview

119 KB View

How do you rate this resource?
0 ratings
Resource details

Resource ID

25

Access

Open

Contributed by

Kerstin Helbig

Date

24 October 2016

Usage terms

Creative Commons Attribution 4.0 International (CC BY 4.0)

Credit

Matthias Boenig; Alexander Geyken; Jörg Fischer; Susanne Haaf; Bryan Jurish; Christian Thomas; Frank Wiegand; Kai Zimmer

Abstract

Das von der Deutschen Forschungsgemeinschaft (DFG) geförderte Projekt Deutsches Textarchiv (DTA, www.deutschestextarchiv.de) der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) stellt einen disziplinen-übergreifenden Kernbestand deutschsprachiger Texte aus dem Zeitraum von ca. 1600 bis ca. 1900 bereit. Mit Stand vom September 2016 sind mehr als 3000 historische Textdokumente im DTA verfügbar, die in Übereinstimmung mit der Open-Access-Politik der BBAW unter einer Creative-Commons-Lizenz bereitgestellt werden.

Sämtliche Texte des DTA-Korpus sind entsprechend den Empfehlungen der Text Encoding Initiative (TEI) annotiert, um deren plattformunabhängige und interoperable Nutzbarkeit sicherzustellen. Darüber hinaus erfolgt eine automatisierte linguistische Analyse des Textmaterials, einschließlich der Tokenisierung, Lemmatisierung, Wortartenbestimmung (POS-Tagging) und der orthographischen Normierung historischer Schreibweisen. Das DTA-Korpus ist somit für sprachgeschichtliche Untersuchungen, literaturwissenschaftliche, historische und soziologische Fragestellungen nutzbar.

Die Dokumente und Metadaten des DTA-Korpus werden parallel zu deren Veröffentlichung in die web- und zentrenbasierte Infrastruktur des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projekts CLARIN-D (www.clarin-d.net) integriert. Innerhalb dieser Forschungsdateninfrastruktur für die Geistes- und Sozialwissenschaften findet die weitere Dissemination der Forschungsdaten statt und stehen zahlreiche Tools und Webservices für deren Nutzung und Analyse zur Verfügung. Über das zertifizierte CLARIN-Repositorium der BBAW (http://clarin.bbaw.de/) sind die Daten persistent adressierbar, werden regelmäßig versioniert sowie nachhaltig verfügbar gehalten.

Metadata report
Related featured and public collections
 Public : Open in Action 2016
Search for similar resources

Remove