Navigation auf uzh.ch

Suche

Deutsches Seminar Zukoko

Module

Allgemeine Informationen

Die ZuKoKo gliedert sich in vier Module. Je nach Interesse und Bedürfnis können in den Modulen andere Kurse belegt werden. Orientieren Sie sich an den Kursbeschreibungen, um bei der Anmeldung Ihre Prioritäten anzugeben. Wir versuchen bei der finalen Zuteilung möglichst die in der Bewerbung geschilderten Interessen und die Ausrichtung Ihrer Forschungsprojekte zu berücksichtigen.

Modul A – Grundlagen

Die Zürcher Korpuslinguistik und Korpuspragmatik (ZuKoKo) steht nicht nur für die Nutzung computerbasierter Methoden in der Sprachgebrauchsanalyse, sondern bezieht sich auf bestimmte theoretische Grundlagen, die wiederum bestimmte methodische Implikationen mit sich bringen. Diese sind Gegenstand des Grundlagenmoduls. Darüber hinaus wird in ein zentrales Werkzeug der Korpuspragmatik eingeführt: Python. Die beiden folgenden Kurse werden von allen Teilnehmer:innen besucht:

A1: Grundlagen der Zürcher Korpuslinguistik und Korpuspragmatik

Korpuslinguistik als empirische Methode zur Erforschung von Sprachgebrauchsmustern ist aus dem linguistischen Alltag nicht mehr wegzudenken. Doch was genau sind Korpora? Welche Daten können wie aufbereitet werden? Wie können Forschungsfragen operationalisiert werden? Was sind Sprachgebrauchsmuster? Wie hängen Sprachgebrauch und Kultur/Gesellschaft zusammen? Diesen und ähnlichen Fragen gehen wir im Kurs aus einer theoretisch-methodologischen Perspektive auf den Grund. Sie erhalten dabei einen Einblick in die Geschichte von Korpusanalysen, diskutieren mit uns theoretische Prämissen für die Korpusarbeit und lernen so konkret die Grundannahmen der Zürcher Korpuspragmatik und deren Operationalisierung kennen.

  • Dozenten: Prof. Dr. Noah Bubenhofer & Daniel Knuchel

A2: Python für Korpuslinguistik

Gegenstand dieses Kurses sind die Grundlagen der Programmiersprache Python. Es werden keinerlei Vorkenntnisse im Programmieren vorausgesetzt. Wir erproben gemeinsam, wie man Skripte schreibt und ausführt, numerische Datentypen, Strings und Listen nutzt und den Programmablauf strukturiert. Am Ende des Kurses beherrschen die Teilnehmenden einfache Workflows wie z. B.: einen Text einlesen, alle Wörter zählen und nach Frequenz sortieren, das Ergebnis in eine neue Datei schreiben. Dieser Kurs bereitet insbesondere die Module B & C vor, in denen teilweise mit bestehenden Python-Scripts gearbeitet wird.

  • Dozentin: Dr. Melanie Andresen

Modul B – Korpusressourcen

Damit korpuspragmatisch oder korpuslinguistisch geforscht werden kann, müssen entsprechende Ressourcen bereit stehen. Viele Fragestellungen erlauben dabei, bereits bestehende Ressourcen wie das Deutsche Referenzkorpus (DeReKo), das Digitale Wörterbuch der deutschen Sprache (DWDS) oder das Deutsche Textarchiv (DTA) zu nutzen. Für andere Fragestellungen müssen aber eigene Korpora erstellt werden. Im Modul B Korpusressourcen stehen diese beiden Zugänge im Zentrum, dabei wird einer der beiden folgenden Kurse gewählt:

B1: Bestehende Ressourcen nutzen

Viele Fragestellungen der Linguistik können mit bestehenden Ressourcen wie zum Beispiel dem Deutschen Referenzkorpus (= DeReKo), dem Digitalen Wörterbuch der Deutschen Sprache (=DWDS) oder dem Deutschen Textarchiv (= DTA) bearbeitet werden. Im Kurs werden verschiedene dieser Ressourcen vorgestellt. Ziel ist es hierbei einerseits einen Überblick über die unterschiedlichen bestehenden Ressourcen zu erhalten und andererseits auch die Konzeption dieser Ressourcen – also Potentiale und Grenzen für die eigene Forschung – zu verstehen.

  • Dozent:innen: Susanne Haaf & Dr. Sandra Hansen & Marco Gierke

B2: Eigene Ressourcen aufbauen

Für gewisse Fragestellungen ist es wichtig eigene Ressourcen aufzubauen. Dies kann auf unterschiedliche Weise geschehen. Einerseits gibt es Techniken, um Web- und Social-Media-Daten zu crawlen (KF Crawling) oder Datenbanken wie Lexis, Swissdox oder Parlamentsprotokolle zur Datengewinnung zu nutzen (KF Datenbanken), andererseits kann es aber auch notwendig sein, bestehende Daten mit Annotationen aufgrund semantischer resp. grammatischer Kategorien zu versehen (KF Annotation), die vor der Datenverarbeitung festgelegt werden müssen. Wenn der Schritt der Datengewinnung und/oder der Konzeption eines passenden Annotationsschemas erfolgt ist, müssen die Daten korpuslinguistisch aufbereitet werden: von den Rohdaten zum Korpus.

Sie wählen einen der drei folgenden Kursfokusse aus:

  • Dozent Kursfokus Crawling: Dr. Adrien Barbaresi
  • Dozentin Kursfokus Datenbanken: Daniel Knuchel
  • Dozentin Kursfokus Annotation: Dr. Melanie Andresen
  • Dozenten für den Plenumsteil: Niclas Bodenmann

Modul C – Korpusanalysen

Im Modul Korpusanalysen wird die Auseinandersetzung mit Methoden im Vordergrund stehen. Dabei sollen sowohl das Verständnis für die Funktionsweise der Tools als auch die statistischen Grundlagen dahinter reflektiert werden. Zentral ist zudem das eigene Erproben der Tools: In Gruppen werden konkrete Analysen durchgeführt, so dass das Potential der Tools – aber auch deren Grenzen – ausgelotet werden kann. Sie müssen sich für einen der Parallelkurse entscheiden:

C1: DeReKo

Im Kurs C1 steht die Arbeit mit dem DeReKo im Zentrum. Gemeinsam werden Sie Fragestellungen und deren Operationalisierung erarbeiten und mithilfe von COSMAS II Analysen durchführen. Ziel ist es hierbei, dass Sie unterschiedliche Funktionalitäten des Tools kennenlernen und selbst ausprobieren können. Zudem wird Ihnen vermittelt wie sie Schnittstellen zum DeReKo nutzen können, um mit Python oder R weitere Analysen anzuschliessen. Nach dem Kurs können Sie das DeReKo für Ihre eigenen Interessen produktiv einsetzen.

  • Dozent:innen: Marco Gierke & Dr. Sandra Hansen

C2: DWDS/DTA

Im Kurs C2 steht die Arbeit mit dem DWDS / DTA im Zentrum. Gemeinsam werden Sie Fragestellungen und deren Operationalisierung erarbeiten und auf Basis von DWDS und DTA eigene Analysen durchführen. Ziel ist es hierbei, dass Sie unterschiedliche Funktionalitäten des Tools kennenlernen und ausprobieren können. Nach dem Kurs können Sie das DWDS / DTA auch für Ihre eigenen Interessen produktiv einsetzen.

  • Dozentin: Susanne Haaf

C3: Korpuspragmatische Klassiker

Im Kurs C3 werden wir uns mit Frequenzen, Keyness, Dispersion, Kollokationen und N-Gramms auseinandersetzen. Ziel ist es hierbei, dass Sie sowohl die konzeptionellen Überlegungen und statistische Operationalisierung dieser Analysemöglichkeiten kennenlernen als auch im Sinne eines Hands-On-Learning eigene Analysen durchführen. Gemeinsam werden wir einen Datensatz aufbereiten und anhand einer gemeinsam festgelegten Forschungsfrage die unterschiedlichen korpuspragmatischen Klassiker durchspielen und immer auch diskutieren, wo die Grenzen von Keywords, Kollokationen und N-Gramms liegen. Dabei werden Sie sowohl Software wie CQPWeb als auch Analysemöglichkeiten mit Python kennenlernen.

  • Dozent:innen: Daniel Knuchel & Livia Sutter

C4: Topic Modeling

Topic Modeling ist ein Text-mining-Tool, das auf Basis von NLP und Machine Learning rekurrente Strukturen berechnet und diese als sogenannten "Topics" lesbar macht. Die Topics – die keine Themen im klassischen Sinn sind – werden als Gruppen von Wörtern modelliert. Es ist eine der gängigen Methoden in den Digital Humanities, bei der Prinzipien der distributionellen Semantik Anwendung finden. Im Kurs C4 werden Sie hierbei sowohl die Grundidee und statistische Überlegungen dazu kennenlernen, als auch konkrete Analysen am Material durchführen. Sie werden dazu Ihre im Grundlagenmodul erworbenen Python-Kompetenzen stärken und gemeinsam erarbeitete Forschungsfragen operationaliseren. Ziel ist er hierbei, dass Sie nach dem Kurs mit beliebigen Daten ein Topic Modeling durchführen können. 

Dozent:innen: Dr. Julia Krasselt & Sonja Huber

C5: Distributionelle Semantik

Im Kurs C5 werden Sie avanciertere Methoden der Korpuspragmatik aus dem Umfeld der distributionellen Semantik kennenlernen. Im Workshop werden zuerst theoretische Prämissen erarbeitet. Im Anschluss werden unterschiedliche Analysen mit sogenannten Word Embeddings durchgeführt. Dabei geht es einerseits um die Modellierung semantischer Räume mithilfe von Machine Learning und andererseits sollen vektorgeometrische Berechnungen helfen, um diskursiv-semantische resp. funktionale Äquivalenzen zu ergründen. Am Schluss des Kurses können Sie eigene WE-Modelle rechnen und sind mit Kompetenzen ausgerüstet, um eigene Daten fundiert zu analysieren.

  • Dozenten: Prof. Dr. Noah Bubenhofer & Tim Feldmüller

Modul D: Künstliche Intelligenz und Sprache

Im Modul "Künstliche Intelligenz und Sprache" stehen grosse Sprachmodelle (LLM) – wie sie z.B. mit ChatGPT gegenwärtig breit diskutiert werden – im Zentrum. Es wird gezeigt und diskutiert, was die theoretischen Grundlagen, Anwendungsmöglichkeiten und Konsequenzen in Wissenschaft und Gesellschaft sind und welche Zusammenhänge mit der Korpuslinguistik bestehen und wie KI korpuslinguistisch genutzt werden kann. Das Modul besteht aus einem Kurs und einer Podiumsdiskussion, die Teil der Tagung "Digitalität | Sprache | Kultur – theoretische Modellierung und empirische Annäherung" ist. Beide Angebote sind für alle Teilnehmer:innen offen.

D1: Sprachmodelle (LLM) und Korpuslinguistik

Im Kurs wird grundsätzlich erklärt, was Sprachmodelle sind und auf welchen theoretischen Prämissen sie basieren. Dabei zeigen sich die Gemeinsamkeiten mit korpuslinguistischen Methoden nicht nur auf theoretischer, sondern auch methodologischer Ebene. Weiter wird gezeigt, wie Sprachmodelle in der Korpuslinguistik eingesetzt werden können: Als Programmierunterstützung, als Ressource selber und als Tool für die Datenaufbereitung.

D2: Podiumsdiskussion Digitale Gesellschaft

Als Auftakt der Tagung "Digitalität | Sprache | Kultur", die im Anschluss an die ZuKoKo stattfindet, weitet eine Podiumsdiskussion den Blick: Welche Implikationen haben digitale Tools, auch KI-Tools, auf Schreib- und Leseprozesse in der Gesellschaft? Das Podium wird mit Personen aus Praxis und Forschung besetzt und versucht, theoretische Konzepte vor dem Hintergrund kultureller Praktiken zu diskutieren.

Weitere Veranstaltungen

Neben den drei Modulen finden auch ergänzende Veranstaltungen statt, die die Sommerschule abrunden und erlauben die behandelten Inhalte zu vertiefen und weiter zu diskutieren. Im Kontext der Sommerschule findet zudem eine Tagung zum Themenblock "Digitalität | Sprache | Kultur" statt, zu derem Eröffnungstag alle herzlich eingeladen sind.

ZuKoKo-Hackerspace

Der ZuKoKo-Hackerspace dient dazu, die neu erworbenen Kenntnisse zu festigen und diese für die eigene Arbeit auszuprobieren. Einzelne Dozierende sind vor Ort mit dabei und unterstützen Sie. Es werden Getränke und Snacks serviert. Der Hackerspace ist ein niederschwelliges Angebot, um im informellen Rahmen über Python und Korpuspragmatik zu diskutieren und gemeinsam Dinge auszuprobieren. Es handelt sich um ein freiwilliges Angebot, eine Teilnahme ist aber sehr erwünscht und wird empfohlen.

ZuKoKo-Posterapéro

Am ZuKoKo-Posterapéro haben alle Teilnehmer:innen die Möglichkeit, ein laufendes oder geplantes Forschungsprojekt vorzustellen. Mit einem Glas Wein und Fingerfood kommen Sie dabei mit den Dozent:innen der Sommerschule, weiteren Mitarbeiter:innen des Deutschen Seminars der Universität Zürich und auch miteinander ins Gespräch. Ziel ist, dass Sie offene Fragen zum Projekt diskutieren können und von erfahrenen Korpuslinguist:innen Input erhalten. Die Postermesse bildet das Bindeglied zwischen den Kursen und der ZuKoKo-Guest-Lecture. Die Präsentation eines Posters ist freiwillig, wird aber sehr von uns empfohlen.

ZuKoKo-Guest-Lecture

Die ZuKoKo-Guest-Lecture wird 2023 von Ass. Prof. Mag. Dr. Claudia Posch gehalten. Claudia Posch forscht und lehrt am Institut für Sprachwissenschaft an der Universität Innsbruck. Ihre Forschungsschwerpunkte liegen in der Korpuslinguistik, Feministischen Diskursanalyse und der Onomastik. Zur konkreten Ausgestaltung Ihrer Vorlesung wird zu gegebener Zeit hier informiert.

ZuKoKo Stadtführung (fakultativ)

Als Abschluss der Sommerschule besteht die Möglichkeit, an einer Stadtführung durch das historische Zentrum Zürichs teilzunehmen. An mehreren Stationen erfahren Sie etwas über die Geschichte Zürichs, über die intellektuellen Figuren, die in Zürich auf Besuch waren, sowie über den Dadaismus sowie die Geschichte des Schauspielhauses, die prägend für das kulturelle Selbstverständnis Zürichs sind. Der Spaziergang wird mit einem Rundumblick über Zürich beim Mittagessen abgeschlossen. Für die ZuKoKo-Stadtführung erheben wir einen Unkostenbeitrag (siehe Anmeldung).

Tagung: Digitalität | Sprache | Kultur – theoretische Modellierung und empirische Annäherung

Direkt im Anschluss an die Sommerschule wird eine kleine Tagung zum Themenbereich Digitalität und Kulturlinguistik stattfinden. An dieser werden Fragen zur theoretischen Modellierung von Digitalität, des Sprachgebrauchs in digitalen Settings und auch Fragen zur Zukunft von Digitalität, Tools und sprachlichem Handeln diskutiert. Alle Teilnehmer:innen der Sommerschule sind herzlich eingeladen, am ersten Tag dem Eröffungsvortrag von Prof. Dr. Noah Bubenhofer & Daniel Knuchel, den beiden Keynote-Vorträge von Prof. Dr. Andreas Hepp (Medienwissenschaft in Bremen) und Prof. Dr. Konstanze Marx (Germanistik in Greifswald) sowie einer Podiumsdiskussion zum Thema A.I. und der Zukunft des Schreibens beizuwohnen.

Mehr Informationen unter folgendem Link: https://korpuspragmatik.ds.uzh.ch/digitalitaet