Gegenwartssprachliche Corpora

In der Linguistik und anderen Geisteswissenschaften (z.B. Literaturwissenschaft, Philosophie) gehören neben den Werken selbst die Prozesse „Produktion“ und „Rezeption“ mit zum erweiterten Untersuchungsgegenstand. Untersucht werden beispielsweise Fragen des Autorenstils, insbesondere bei mutmaßlich von mehreren Autoren erzeugten Werken (z.B. Bibel, Werke von Shakespeare) oder Fragen der Rezeptionsgeschichte, etwa die Übernahme von Stilmitteln durch nachfolgende Autoren. Die Rezeption bzw. Interpretation von Texten wird beispielsweise im Zusammenhang mit dem konstruktiven Verstehen thematisiert. Hierbei lösen sich die klassischen Rollen von Autor und Leser teilweise auf, indem der Leser bei der Rezeption Gegenwartsbezug herstellt und damit Teil des Interpretationsprozesses (und folglich der Bedeutung des Werkes) wird (vgl. 3). Im sogenannten „Web 2.0“ (auch: „Soziales Web“, „Mitmach-Web“) ermöglichen neue Infrastrukturen die Kollaboration an Texten. Durch die niedrige Publikationsschwelle sind hierbei die oben angedeuteten Phänomene (Mehrautorenschaft, Änderung/Übernahme von Text(teil)en, Verschmelzen von Autor/Leser etc.) eher der Regelfall als die Ausnahme. Als Corpus ist das Web 2.0 für linguistische Untersuchungen auch deshalb so interessant, weil der Entstehensprozess einzelner Einheiten i.S.v. Metadaten dokumentiert ist, was bei praktisch allen anderen im beantragten Schwerpunkt untersuchten Texten nicht der Fall ist. Die o.g. Phänomene wie auch die oft erwähnte „wisdom-of-the-crowds“ sind bislang kaum erforscht und verstanden. Vereinzelte Ansätze finden sich z.B. in Beißwenger und Storrer (2008), einen Überblick gibt Medelyan (2009). Zentral ist hierbei die Untersuchung der neuen Diskurstypen Chat, Blog, Wiki, Twitter etc. Eine der derzeit interessantesten Instanzen der Web 2.0-Diskurse ist die in diesem Zusammenhang noch kaum erforschte Wikipedia. Aufgrund ihrer Größe, der Anzahl der (größtenteils anonymen) Autoren und der praktisch lückenlosen Dokumentation des Entstehungsprozesses als Revisionsgeschichte stellt Wikipedia ein einzigartiges Corpus für linguistische Forschung dar, für das es noch keinen Präzedenzfall in der Corpuslinguistik gab. An der Revisionsgeschichte von Wikipedia-Artikeln kann man zum Beispiel ein Stück weit den konstruktiven Interpretationsprozess der Rezipienten nachvollziehen, insofern er sich darin niederschlägt. Ein wiederkehrendes Thema, das hier intensiv bearbeitet werden soll, ist die Textqualität, insbesondere in Bezug auf die Entwicklung über die Zeit und die Korrelation mit Merkmalen der Produktionssituation, wie etwa der Anzahl der beteiligten Autoren.

II.3 Text als Prozess – Linguistische Eigenschaften von kollaborativ erstellten Texten im Web 2.0 (2011-2013)