Auf einem Röntgenbild Knoten erkennen, die Brustkrebs sein könnten, nach einer Magnetresonanztomografie (MRT) auf den Aufnahmen den gerissenen Meniskus im Knie entdecken oder auf Bildern der Schilddrüse die Auffälligkeiten richtig deuten – Ärztinnen und Ärzte arbeiten häufig mit bildgebenden Verfahren, bei denen die richtige Interpretation der Bilder für eine korrekte Diagnose entscheidend ist. 

Nun hat eine Metaanalyse – die Auswertung diverser Studien also – gezeigt: In dieser Disziplin ist künstliche Intelligenz (KI) womöglich genau so gut wie der Mensch. Das Team, das seine Studie jetzt im Medizinjournal Lancet Digital Health (Liu, Denniston et al., 2019) veröffentlicht hat, kam zu dem Schluss, dass Krankheiten bei der Auswertung von Röntgenbildern, MRTs und anderen bildgebenden Verfahren mittels KI in 87 Prozent der Fälle richtig erkannt werden, bei den Ärztinnen und Ärzten waren es 86 Prozent. Ein minimaler Unterschied, der bei weitem nicht reicht, um zu sagen, die KI sei überlegen.

Nur 14 Studien flossen in die Analyse ein

Außerdem taugt die Studie nicht, um eine allgemeingültige Aussage zu treffen – sie kann nur ein erster Hinweis sein, dass KI in der Diagnostik mit bildgebenden Verfahren sinnvoll eingesetzt werden kann. Denn obwohl die Autorinnen und Autoren der Arbeit Tausende Studien ausgewertet hatten, entpuppten sich am Ende nur 14 als brauchbar für eine vergleichenden Metastudie. Denn nur in diesen 14 Studien waren die Ergebnisse der Bilddiagnostik von Ärztinnen und Ärzten mit denen einer KI-Technologie verglichen worden. 

Wegen der geringen Zahl an für sie übrig gebliebenen Arbeiten fordern die Autoren einheitliche Studienstandards, um zukünftig bessere Analysen zu liefern. Zumindest schnitt nach der aktuellen Auswertung für die Bilddiagnostik die KI genauso gut ab wie die interpretierenden Ärzte. Umgekehrt konnten die maschinellen Analysen in 93 Prozent der ausgewerteten Fälle eine Erkrankung korrekt ausschließen, bei den Ärztinnen und Ärzten lag die Quote bei 91 Prozent. 

Immerhin hätten sie mit der Handvoll qualitativ guter Studien feststellen können, dass Krankheiten von Augenleiden bis hin zum Krebs mittels Deep Learning (dem komplexen maschinellen Lernen von Erfahrungswerten) so zuverlässig prognostiziert werden konnten wie von menschlichen Experten, sagte dazu einer der Studienautoren in einer Mitteilung von Lancet Digital Health. Nur wären die KI-Analysen eben auch nicht besser gewesen.

Die Hoffnungen, dass sich Bilddiagnostik mittels KI zukünftig bewährt, sind groß. Gerade in Ländern mit mittleren und niedrigen Einkommen gibt es zu wenig Spezialisten, um ärztliche Diagnosen durchzuführen. Denkbar ist auch, dass computergestützte Systeme eines Tages Details sehr viel genauer analysieren können als das menschliche Auge.