Ein Forscherteam aus China hat ein Computerprogramm entwickelt, das lernt, Patientendaten auszuwerten, um Kinderkrankheiten von einer harmlosen Erkältung über Asthma bis zur lebensbedrohlichen Hirnhautentzündung zu erkennen. Das Programm könne eingesetzt werden, um in Notaufnahmen rasch dringende von weniger dringenden Fällen zu unterscheiden, Ärzte in der Ausbildung zu unterstützen oder bei der Diagnose von Krankheiten mit komplexen Symptomen zu helfen, schreiben die Forscher um Kang Zhang vom Zentrum für Kinder- und Frauenmedizin der Uniklinik in Guangzhou. Allerdings kritisieren Fachleute die Studie wegen diverser Mängel.

Für ihre Studie, die in der aktuellen Ausgabe des Wissenschaftsmagazins Nature Medicine (Liang et al., 2019) erscheint, fütterten die Forscher ein Computerprogramm zunächst mit einem Datensatz aus rund 800.000 elektronisch verfügbaren Patientenakten von Kindern. Dieser umfasste die medizinische Vorgeschichte, Laborergebnisse sowie Auffälligkeiten, die sich bei der Untersuchung durch einen Arzt gezeigt hatten – nicht jedoch die gestellte Diagnose. Als Nächstes wurden die Informationen aus den Krankenakten mithilfe einer Methode namens Natural Language Processing übersetzt. Diese Technik verarbeitet natürliche geschriebene oder gesprochene Sprache maschinell und bringt sie in eine strukturierte, für weitere Algorithmen verarbeitbare Form. In einem weiteren Schritt ordnete ein Algorithmus die Daten dann immer feiner werdenden Klassen zu: zunächst den betroffenen Organsystemen, dann Gruppen von verwandten Krankheiten bis hin zu einer endgültigen Diagnose.

Wie die Diagnose errechnet wurde, bleibt unklar

Anschließend verglichen die Wissenschaftlerinnen und Wissenschaftler die Treffsicherheit der computergestützten Diagnose mit der menschlicher Kinderärzte – dazu nutzten sie einen weiteren Satz aus etwa 400.000 Daten. Das Ergebnis klingt zunächst beeindruckend: Die vom Computer errechnete Diagnose stimmte je nach Krankheit in 79 bis 98 Prozent der Fälle mit der des behandelnden Arztes überein. Im Wettbewerb mit den Kinderärzten aus Fleisch und Blut war die künstliche Intelligenz Anfängern beim Stellen der korrekten Diagnose überlegen, während erfahrene Medizinerinnen und Mediziner besser abschnitten als das Computerprogramm.

Nach Fachmeinung weist das Programm jedoch zu große Mängel auf, um bereits in Kliniken oder Arztpraxen eingesetzt zu werden. Laut dem Medizininformatiker Thomas Neumuth von der Universität Leipzig sind die angewandten Algorithmen nicht rückverfolgbar. "Dadurch ist es nicht möglich, herauszufinden, wie die Entscheidung zustande kommt", sagte der Spezialist für computerbasierte Medizintechnik und Chirurgie Journalisten des deutschen Science Media Centers (SMC).

Der Biostatistiker Frank Klawonn vom Braunschweiger Helmholtz-Zentrum für Infektionsforschung kritisierte darüber hinaus, dass in der Studie nicht stehe, wie bestimmte Werte zum Nachweis von Krankheiten ausgerechnet wurden. Und er verweist auf einen klaren Fehler: In einer angehängten Tabelle sind andere Fallzahlen genannt als in der Studie selbst. Offenbar seien hier ein paar Spalten vertauscht worden. "Mit den Zahlen wurde so schludrig umgegangen, dass man dadurch der gesamten Studie nur sehr wenig Vertrauen schenken kann", sagte Klawonn dem SMC.

Mittlerweile arbeiten Teams weltweit an ähnlichen Diagnoseverfahren mithilfe von Algorithmen. So gibt es zum Beispiel Programme, die anhand von Computertomografien oder Röntgenaufnahmen auf vorliegende Krankheiten, etwa Hautkrebs, schließen können – und das ähnlich präzise wie erfahrene Medizinerinnen und Mediziner. Einige dieser Programme werden bereits als Assistenzsysteme eingesetzt. Zwar könnte mit dem Ansatz aus der aktuellen Studie Ähnliches gelingen, sagen Fachleute. Doch um zu beurteilen, wie weit das Team aus China dabei ist, enthalte deren Arbeit letztlich zu viele Mängel und sei zu intransparent. Vermutlich müsse das System noch deutlich ausgebaut werden.