Matomo tracking image

Skip to main content

Processing

Open-Access-Week
Account Menu
  • Log in
  • Contact us
  •  Dash
  •  Featured collections
  •  Recent
  • Media
  •  Help & Support
Search
Browse
By date

 Geographic search

 Advanced search

%BROWSE_INDENT% %BROWSE_EXPAND% %BROWSE_TEXT% %BROWSE_REFRESH%
Browse by tag
Featured collections

Deutsches Textarchiv (DTA) und CLARIN-D  

Full screen preview
Resource tools

Original PDF File

2.0 MB Download

View directly in browser

2.0 MB View in browser
  •  Share

How do you rate this resource?
X  
0 ratings
Resource details

Resource ID

25

Access

Open

Contributed by

Kerstin Helbig

Date

24 October 2016

Usage terms

Creative Commons logo with terms by
Creative Commons Attribution 4.0 International (CC BY 4.0)

Credit

Matthias Boenig; Alexander Geyken; Jörg Fischer; Susanne Haaf; Bryan Jurish; Christian Thomas; Frank Wiegand; Kai Zimmer

License url

Creative Commons logo with terms by

DOI

10.5281/zenodo.438619

Abstract

Das von der Deutschen Forschungsgemeinschaft (DFG) geförderte Projekt Deutsches Textarchiv (DTA, www.deutschestextarchiv.de) der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) stellt einen disziplinenübergreifenden Kernbestand deutschsprachiger Texte aus dem Zeitraum von ca. 1600 bis ca. 1900 bereit. Mit Stand vom September 2016 sind mehr als 3000 historische Textdokumente im DTA verfügbar, die in Übereinstimmung mit der Open-Access-Politik der BBAW unter einer Creative-Commons-Lizenz bereitgestellt werden.

Sämtliche Texte des DTA-Korpus sind entsprechend den Empfehlungen der Text Encoding Initiative (TEI) annotiert, um deren plattformunabhängige und interoperable Nutzbarkeit sicherzustellen. Darüber hinaus erfolgt eine automatisierte linguistische Analyse des Textmaterials, einschließlich der Tokenisierung, Lemmatisierung, Wortartenbestimmung (POS-Tagging) und der orthographischen Normierung historischer Schreibweisen. Das DTA-Korpus ist somit für sprachgeschichtliche Untersuchungen, literaturwissenschaftliche, historische und soziologische Fragestellungen nutzbar.

Die Dokumente und Metadaten des DTA-Korpus werden parallel zu deren Veröffentlichung in die web- und zentrenbasierte Infrastruktur des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projekts CLARIN-D (www.clarin-d.net) integriert. Innerhalb dieser Forschungsdateninfrastruktur für die Geistes- und Sozialwissenschaften findet die weitere Dissemination der Forschungsdaten statt und stehen zahlreiche Tools und Webservices für deren Nutzung und Analyse zur Verfügung. Über das zertifizierte CLARIN-Repositorium der BBAW (http://clarin.bbaw.de/) sind die Daten persistent adressierbar, werden regelmäßig versioniert sowie nachhaltig verfügbar gehalten.

Metadata report

Related resources
Related featured and public collections
  Public: Open in Action 2016
Search for similar resources

View full site
Language: American English
    Web Analytics
  • Home
  • Imprint
  • Data Privacy Statement
The Media Repository is powered by CMS and ResourceSpace