Dieses Bild zeigt Lucas Florin

Lucas Florin

Herr M.Sc.

PhD student
Stuttgart Research Focus "Interchange Forum for Reflecting on Intelligent Systems"
IRIS3D / AI Safety / Investigating Dimensions of Deception Abilities in Language Models
[Bild: privat ]

Kontakt

Universitätsstraße 32
70569 Stuttgart
Raum: 00.118

Vaugrante, Laurène; Niepert, Mathias; Hagendorff, Thilo (2024): A Looming Replication Crisis in Evaluating Behavior in Language Models? Evidence and Solutions. In arXiv:2409.20303, pp. 1–23. (Link)

Vaugrante, Laurène; Carlon, Francesca; Menke, Maluna; Hagendorff, Thilo (2025): Compromising Honesty and Harmlessness in Language Models via Deception Attacks. In arXiv:2502.08301, pp. 1-14. (Link)

Lucas Florin ist ein Doktorand am IRIS3D. Sein Forschungsschwerpunkt ist gefährliches Verhalten und Fähigkeiten in LLMs nachzuweisen, insbesondere Täuschung in KI-Agenten. Er hat einen Master-Abschluss in Informatik mit Profil in Künstlicher Intelligenz vom KIT. Er war als Softwareentwickler und Data Scientist im Public-Health-Bereich tätig.

Zum Seitenanfang