Diversity-Aware NLP Intelligent Systems (DANIS) - Intelligente, auf Vielfalt bedachte Systeme
- Schwerpunkt des Projekts
-
Der immense Einfluss von NLP-Systemen auf das Leben der Menschen gibt zunehmend Anlass zur Besorgnis über den möglichen Schaden, den diese Werkzeuge anrichten können. Schädliche Verhaltensweisen solcher Systeme werden als Symptome ihrer Voreingenommenheit angesehen, d. h. der systematischen Bevorzugung oder Diskriminierung bestimmter Benutzergruppen. NLP-Tools werden in der Regel auf Textkorpora trainiert, die bereits auf der Ebene ihrer Autoren solche Vorurteile aufweisen. Wikipedia beispielsweise, eine der am häufigsten verwendeten Quellen für Trainingsdaten, wird von einer überwiegend weißen und männlichen Gruppe von Redakteuren erstellt. Ein solcher Mangel an Vielfalt unter den Autoren kann die Wirkung von Daten von Minderheiten verringern und infolgedessen zu NLP-Modellen führen, die die zugrunde liegenden demografischen Ungleichgewichte widerspiegeln. DANIS trägt zum Diskurs über Fairness in der KI bei, indem es die Entwicklung von intelligenten NLP-Systemen erleichtert. Die Eingaben von unterrepräsentierten Nutzergruppen sollen so besser erkannt und deren Rolle im Trainingsprozess gestärkt werden.
- Projektdauer
-
Januar 2023 - Dezember 2026
- Kooperation
-
SRF IRIS
- Finanzierung
-
Das Projekt wird vom Ministerium für Wissenschaft, Forschung und Kunst des Landes Baden-Württemberg gefördert.