„Erkennung sprachlicher Imitations- und Verschleierungsstrategien“ Projekt im Rahmen des NRW-Graduiertenkollegs „SecHuman: Sicherheit von Menschen im Cyberspace“

Projektleiter: Prof. Dr.-Ing. Dorothea Kolossa, Dr. Kerstin Kucharczik-Kohrt, Prof. Dr. Karin Pittner

Im Rahmen dieses Projekts werden Erfahrungen aus der Linguistik mit technischen Methoden kombiniert, um Vortäuschungen von Identitäten zu erkennen. Die Vorarbeiten, bei denen authentisches und nachgeahmtes Ruhrdeutsch verglichen wurde, werden mit statistischen Mustererkennungsmethoden aus der Arbeitsgruppe für kognitive Signalverarbeitung verknüpft.

Bei der medialen Stilisierung von Varietäten oder Regiolekten werden bestimmte, als besonders charakteristisch empfundene Merkmale herausgegriffen und sehr häufig verwendet, andererseits treten nicht dazu passende Merkmale auf. Auch beim Internet-Betrug oder Erpresserbriefen sind entsprechende Verschleierungsstrategien zu beobachten, wenn z.B. augenfällige Merkmale von „Ausländerdeutsch“ auftreten und daneben Merkmale, die auf einen Muttersprachler schließen lassen. Untersucht werden soll, ob die Vortäuschung von falschen Identitäten im Internet (z.B. in Bezug auf Herkunft oder Alter) ebenso durch Häufungen charakteristischer Merkmale sowie durch nicht dazu passende Merkmale zu erkennen ist. Aus Sicht der Mustererkennung besteht die Aufgabe darin, Algorithmen zu entwickeln, die die von uns vermuteten strukturellen Merkmale mit hoher Zuverlässigkeit in Datenmaterial von inhärent großer Variabilität auffinden und Dokumente entsprechend klassifizieren können. Das Bundeskriminalamt stellt für das  Projekt ein umfassendes Korpus zur Verfügung, das Erpresserbriefe und weitere Schriftstücke mit kriminalistisch relevanten Inhalten enthält.

Mitarbeiter: Steffen Hessler, M.A., Benedikt Bönninghoff, M. Sc.

Projektlaufzeit: 2017-2019, 2021-2023

17.11.2017: 
Workshop Forensische Linguistik (RUB, Beckmanns Hof)

Zu den zentralen Themen der Forensischen Linguistik gehören die Autorerkennung und Autorprofilierung. Neben inkriminierten Textsorten wie Erpresserschreiben und Bekennerschreiben, bei denen die Identität des Schreibers oft verschleiert wird, stellt die Erkennung von Identitäten in den verschiedenen Formen der Internetkommunikation wie Beiträgen in Chatrooms oder Twitter Posts eine besondere Herausforderung dar. Der Workshop konzentriert sich auf die Frage, anhand welcher sprachlichen Merkmale ein Autor erkannt oder ein Profil von ihm erstellt werden kann. Dabei sollen auch die Möglichkeiten der automatischen Erkennung in den Blick genommen werden. Ein Fokus soll auch auf der Frage liegen, wie große Datenmengen automatisch verarbeitet werden können mit dem Ziel, potentielle Gefahren zu identifizieren. Von besonderem Interesse sind nachvollziehbare Methoden, die eine Aussage über den Grad der Gültigkeit der Ergebnisse ermöglichen.

Konferenzsprachen: Englisch und Deutsch
Der Workshop wird veranstaltet vom Projekt „Sprachliche Verschleierungs- und Imitationsstrategien“ im Rahmen des NRW-Fortschrittskollegs „Sicherheit für Menschen im Cyberspace (SecHuman)

Programm und Abstracts zum Download