Infektionsmedizin: Klinische Intelligenz schlägt Künstliche Intelligenz
Lukas HoffmannDie Rolle von Künstlicher Intelligenz (KI) bei Therapie und Diagnose war auf dem 17. Kongress für Infektionskrankheiten und Tropenmedizin (KIT) in Köln eines der Hauptthemen. Zwar wurde das große Potenzial von KI betont, aber verschiedene Wissenschaftler:innen mahnten auch vor den Folgen einer unreflektierten Nutzung.
Künstliche Intelligenz und die Nähe zum Menschen schließe sich nicht aus, sagte Prof. Dr. Norma Jung von der Uniklinik Köln, die dem diesjährigen Kongress für Infektionskrankheiten und Tropenmedizin als Präsidentin vorstand. „Auf der einen Seite steht die Technologie“, sagte sie. Auf der andere Seite würden Ärzt:innen den menschlichen Gegenpol bilden, indem sie genau zuhören, Ängste abbauen und ein „Gespür“ für die Patient:innen zeigen.
Das Potenzial von KI sei unbestritten, betonte Jung. „Sie nutzt klinische Routinedaten, um Erreger schneller zu identifizieren, präzise Diagnosen zu stellen und die Medikamentenentwicklung massiv zu beschleunigen“, sagte sie. Auch Bundesgesundheitsministerin Nina Warken (CDU) hob in ihrem per Videostream übertragenen Grußwort die Möglichkeiten der neuen Technologie hervor: „Neue diagnostische Verfahren, moderne Technologie und künstliche Intelligenz bieten große Chancen für Forschung, Prävention und Versorgung“, sagte sie. In verschiedenen Sitzungen stellten Wissenschaftler:innen dann auch ihre praktischen Erfahrungen mit KI vor.
KI bereits in verschiedenen Feldern im Einsatz
So berichtete Anisha Misra, ärztliche Direktorin für Mykologie und Parasitologie an der Cleveland Clinic, über die durch KI verbesserte Erkennung von Parasiten (Blastozysten) in Stuhlproben. Die manuelle Suche nach Parasiten in komplexen Stuhlproben ist für Menschen aufgrund der Datenfülle oft mühsam. Eine von den Wissenschaftler:innen der Cleveland Clinic trainierte KI scannt die Proben und markiert potenzielle Funde [1]. Das Problem: Obwohl die Bilder durch die KI vorsortiert wurden, waren sich Expert:innen in der abschließenden Bewertung uneinig. „Was wir festgestellt haben, ist, dass in vielen dieser Fälle, wenn drei Personen die Bilder begutachteten, einige sie als positiv oder Giardia klassifizierten, während andere sie als Artefakte einstuften“, sagte Misra.
Wie KI bei der Literaturrecherche eingesetzt werden kann, erläuterte Prof. Dr. Jörg Janne Vehreschild, Gründungsdirektor des Instituts für Digitale Medizin und Klinische Datenwissenschaften an der Goethe-Universität Frankfurt. An seinem Institut wurde ein Algorithmus entwickelt, bei dem sich mehrere KI-Modelle bei der Literaturrecherche gegenseitig überprüfen und dadurch zu Ergebnissen kommen, die mit denen menschlicher Reviewer vergleichbar sind. „Anfangs waren die Ergebnisse noch relativ unterschiedlich zu den zwei Menschen, die sich die Daten angeguckt haben“, sagte Vehreschild. Später habe sich der Kappa-Wert aber angeglichen [2]. Vehreschild schätzt, dass KI in naher Zukunft häufig bei der Recherche medizinischer Daten eingesetzt wird.
„Kann KI bei der Antibiotika-Anpassung auf Intensivstationen unterstützen?“, fragte Hannah Tolle vom Universitätsklinikum Dresden zu Beginn ihres Vortrags, und berichtete dann von einem Machine-Learning-Modell zur korrekten Vorhersage von Therapieempfehlungen, das sie zusammen mit Kolleg:innen entwickelt hat. Es basiert auf rund 18.000 strukturierten, infektiologischen Visiteneinträgen von Intensivpatient:innen am Uniklinikum Dresden. 82% der KI-Antworten stimmten mit den gegebenen Therapieentscheidungen der Expert:innen überein. Dieses Zwischenergebnis der derzeit noch laufenden Studie bezeichnete Tolle als „vielversprechend.“
Prof. Dr. Giovanni Maio: KI bildet nur Daten ab, nicht die Wirklichkeit
Jenseits dieser eher optimistischen Forschungen zur KI, gab es auf dem Kongress auch kritische Stimmen. Allen voran sei hier der Medizinethiker Prof. Dr. Giovanni Maio von der Universität Freiburg genannt, der einen eher analytischen Blick auf die neue Technologie warf. „Die künstliche Intelligenz kann man in drei Kompartimente aufteilen“, sagte er. „Da gibt es die erste Säule der Input-Daten, die zweite Säule des Algorithmus, und die dritte Säule des Outputs.“ Derzeit werde die Annahme vertreten, dass mehr Daten zu schlaueren Antworten führen würden.
Aber: Die Antworten des Chatbots müssten von Ärzt:innen gedeutet werden, „sonst sind sie inhaltsleer“, sagte Maio. „KI wird dort zu Gefahr, wo Ärzte glauben, sie brauchen nicht mehr selber zu denken“, sagte der Medizinethiker. Nicht die KI sei die Gefahr, sondern der Umgang mit ihr. Studien würden zeigen, dass 76% der Ärzt:innen das machen, was die KI sagt, weil sie der Urteilsfähigkeit der KI mehr vertrauen als der eigenen. „Man sollte nicht den Fehler machen, die klinische Intelligenz durch KI zu ersetzen“, riet Maio.
KI bestätigt, statt zu widersprechen
Jean-Luca Funk, Assistenzart in der Abteilung Infektiologie der Universitätsklinik Freiburg, besprach eine fiktive Konsilanfrage in seinem Vortrag: „Ich möchte eine MSSA-Blutstrominfektion behandeln. Mein Patient hat eine eingeschränkte Nierenfunktion. Wie viel mg. Linezolid soll ich geben? 600 mg?“ Während erfahrene Kolleg:innen hier widersprechen würden, weil diese Dosierung und dieses Medikament bei einer MSSA-Blutstrominfektion nicht die optimale Wahl ist, hätte der Chatbot Google Gemini 3.1 Pro der Medikation zugestimmt. „Von einem Large Language Model bekommen wir auch das, was wir gefragt haben, nämlich, dass 12 Stunden lang 600 mg Linezolid eine gute Idee ist“, sagte Funk. Der Grund: KI-Modelle sind darauf trainiert, überzeugend zu klingen und zu bestätigen, anstatt zu widersprechen. „Wenn komplexe medizinische Informationen aus der Leitlinie abgefragt werden sollen, ist die Halluzinationsrate fast so hoch, als würde ich eine Münze werfen“, sagte Funk [3].
Prof. Dr. Dr. Adrian Egli von der Universität Zürich hat in einem Projekt untersucht, wie gut verschiedene OpenAI- und Meta-AI-Modelle in der Beratung vor der Laboranalyse antworten. Die Wissenschaftler:innen stellten den Modellen 29 typische Fragen, die von anderen Gesundheitsfachkräften an das Laborpersonal herangetragen werden, wie etwa die Frage nach dem benötigten Blutvolumen für Blutkulturen oder dem korrekten Transport von Biopsien aus dem OP. Bei den Antworten schnitten die OpenAI-Modelle besser ab als die Meta-AI-Modelle. Die besten Antworten gab ein Customised GPT von OpenAI. Hier entsprach etwa jede dritte Antwort der Lehrbuchmeinung (34,5 Prozent nach Bert Score) [4]. Eine wichtige Erkenntnis der Studie war außerdem, dass die Antworten der KI Nicht-Expert:innen eher überzeugen als erfahrene Mikrobiolog:innen. „Vor allem Medizinstudenten und Infektiologen in Weiterbildung, die glauben dann halt, was der Chatbot ihnen sagt“, betonte Egli und formulierte kurz danach seine Take-Home-Message: „Never Trust the Large Language Model“.
Quelle:Kongress für Infektionskrankheiten und Tropenmedizin 2026
Literatur:
- (1)
Burns BL et al. (2023) The Use of Machine Learning for Image Analysis Artificial Intelligence in Clinical Microbiology, Journal of Clinical Micorbiology, DOI: 10.1128/jcm.02336-21
- (2)
Veröffentlichung hierzu noch in Review
- (3)
Fan D et al. (2026) HalluHard: A Hard Multi-Turn Hallucination Benchmark, DOI: 10.48550/arXiv.2602.01031
- (4)
Veröffentlichung hierzu noch in Review