Zu Hauptinhalt springen
Branche

Machine Learning: Spannende Anwendungsfelder im Gesundheitswesen und darüber hinaus!

Künstliche Intelligenz (KI) und darauf gestützte Anwendungen werden in der medizinischen Praxis immer wichtiger. Und sie bieten unschlagbare Vorteile, beispielsweise in der Bildanalyse: Big-Data-Auswertungen und Massenverarbeitung von computergenerierten Dateien, Abgleich zwischen verschiedenen Datenbanken, Erkennung von Mustern und – fast noch wichtiger – von Abweichungen, Betrachtung von Entwicklungen im zeitlichen Verlauf, … die Liste der Anwendungsmöglichkeiten ist lang. Denn bei all diesen Aufgaben kann KI um ein Vielfaches effektiver und zuverlässiger „agieren“ als der Mensch.

Federated Learning in medizinischer Bildgebung (Quelle: Shutterstock)

Keine Ablenkung. Keine Ermüdung. Volle Konzentration. Ein Fall für KI!

Künstliche Intelligenz stellt eine ideale Ergänzung bei all jenen Aufgaben dar, die hohe Präzision und Effizienz erfordern. Gerade im Gesundheitswesen und insbesondere bei der Auswertung von bildgebenden Verfahren finden sich hier praktische Anwendungsszenarien en masse. Zudem ist künstliche Intelligenz bekanntlich trainierbar: Machine-Learning-Modelle erlauben es, große Datenvolumina in KI-Anwendungen einzuspeisen und diese entsprechend anzulernen, um zum gewünschten Abstraktionsniveau und damit zu belastbaren Ergebnissen zu kommen. Mit jedem neuen Datensatz wird die KI praktisch intelligenter und damit genauer.

Damit KI erfolgreich eingesetzt werden kann, braucht es umfangreiche und heterogene Trainingsdaten. Ein zuverlässiges Krebserkennungsmodell sollte beispielsweise auf der Grundlage von Tausenden von medizinischen Bildern trainiert werden, die gesundes Gewebe und Tumore im Vergleich aufzeigen können. Zugleich sollte das Modell auch die reale Bandbreite von Geschlecht, Alter und anderen demografischen Merkmalen der Patient*innen repräsentieren. Auch müssen visuelle Merkmale, die sich aus den verschiedenen Bildgebungstechniken ergeben, dargestellt werden.

In der Praxis bedeutet das jedoch, dass die erforderliche Vielfalt der Darstellung von einer einzigen Einrichtung – sei es ein Krankenhaus oder ein radiologisches Institut – gar nicht abgedeckt werden kann. Umso mehr gilt dies natürlich für seltene Krankheiten, für die überhaupt nur wenige Datenpunkte in einer Organisation oder Institution verfügbar sind.

Daher bietet sich eine kollaborative Machine-Learning-Entwicklung an, bei der verschiedene Krankenhäuser ihre eigenen Daten beisteuern, im Idealfall sogar weltweit. Doch es gibt eine wesentliche Einschränkung: den Datenschutz. Wie lässt sich sicherstellen, dass sensible Patienteninformationen mit der richtigen Sorgfalt behandelt und im Einklang mit den strengen Datenschutzgesetzen der jeweiligen Länder verarbeitet werden?

Mit Federated Learning in Microsoft Azure Machine Learning gibt es dafür eine zuverlässige Lösung, denn es ermöglicht ein kollaboratives Trainieren der KI ganz ohne gemeinsame Datennutzung.

Federated Learning: Was heißt das?

Beim Federated Learning können mehrere Akteure gemeinsam ein Machine-Learning-Modell trainieren, ohne dass dafür jedoch Daten ausgetauscht werden müssen.

Die folgende Abbildung illustriert die Vorgehensweise:

Das Hauptmerkmal von Federated Learning ist, dass die lokalen Daten der Teilnehmenden niemals weitergegeben werden. Jeder Akteur erhält regelmäßig eine Kopie des globalen Modells und führt ein lokales Training mit lokalen Daten durch. Die einzigen Informationen, die ausgetauscht werden, sind die aus dem Training gewonnenen „Erkenntnisse“, die sogenannten Aktualisierungen der Modellparameter.

Über den Server werden die Werte aller teilnehmenden Akteure zu einer neuen Modellversion zusammengefasst, und das aktualisierte Modell wird dann wieder an die Akteure verteilt, um die nächste kollaborative Trainingsrunde einzuleiten. Dieser Prozess wird so lange wiederholt, bis ein zufriedenstellendes Modell vorliegt, und kann ebenso für ein kontinuierliches Training genutzt werden, um das Modell durch neue Datenpunkte anzureichern und zu verfeinern.

The AI Show | Federated Learning with Azure Machine Learning können Sie sich hier im Video anschauen.

Gemeinsames „Lernen“ unter Einhaltung von Sicherheit, Datenschutz und Compliance

Je mehr Federated Learning an Bedeutung gewinnt, desto ausgefeilter werden die Ansätze zur Gewichtungsaggregation, um den Anforderungen der beteiligten Partner gerecht zu werden. Eine intuitive Aggregationsmethode wird als Federated Aggregation bezeichnet: Jeder Parameter wird nach der Anzahl der lokalen Datenpunkte gewichtet. Wenn beispielsweise die Aktualisierung von Krankenhaus A auf 100 Bildern basiert und von Krankenhaus B mit 200 Bildern trainiert wurde, dann ist der Beitrag von Krankenhaus B doppelt so hoch wie der von Krankenhaus A.

Es existieren mehrere Varianten der Federated Aggregation, um die Konvergenz bei abweichenden Verteilungen zu verbessern sowie um den Datenschutz und die Sicherheit zu optimieren. Eine wesentliche Erweiterung ist die Secure Aggregation, die die Kommunikation gegen Man-in-the-Middle-Angriffe schützt und den Server daran hindert, auf Aktualisierungen einzelner Clients im unverschlüsselten Klartext zuzugreifen. Sie basiert auf einem kryptographischen Protokoll, das sicherstellt, dass der Beitrag eines Clients als zufällige Zeichenfolgen wiedergegeben wird – außer die Daten werden mit denen der anderen Teilnehmer kombiniert.

Um außerdem das Risiko der Rekonstruktion einzelner Datenpunkte oder von Linkage-Angriffen zu verringern, bietet sich die Kombination mit Differential Privacy an. Auf diese Weise wird das resultierende Modell geschützt, indem eine definierte Menge an statistischem Rauschen während des Trainingsprozesses zugefügt wird.

Fazit: Hohe Bedeutung für den Schutz von Daten sowie von geistigem Eigentum – sowohl innerhalb als auch außerhalb des Gesundheitswesens

Wie in diesem Beitrag erläutert wurde, ist Federated Learning ein überzeugendes Konzept für die gemeinsame Entwicklung von ML-Lösungen, bei denen die Trainingsdaten aus Datenschutzgründen nicht in Klarform ausgetauscht werden können.

Ein weiteres Beispiel wie das MELLODY-Projekt für die Arzneimittelentwicklung zeigt, wie Unternehmen, die sogar miteinander im Wettbewerb stehen, dennoch ein gemeinsames Modell entwickeln, ohne befürchten zu müssen, dass ihr geistiges Eigentum hierdurch gefährdet wird.

Mit zunehmender Reife des Konzepts, einschließlich der Unterstützung für eine sichere und robuste föderierte Aggregation, wird sich das kollaborative Machine Learning in Unternehmen und Organisationen des öffentlichen Sektors mit ihren spezifischen Anforderungen immer mehr durchsetzen.

Jetzt im Detail informieren:

In diesem ausführlichen englischsprachigen Artikel erfahren Sie mehr über die Hintergründe und können sich anhand eines fiktiven Demoszenarios zur Erkennung von Lungenentzündungen in Röntgenbildern über die Vorteile informieren.

Außerdem empfehlen wir Ihnen einen Blick in dieses GitHub-Repository: Dort finden Sie weitere Ressourcen, um diesen Anwendungsfall oder weitere Szenarien zu testen und für Ihre eigenen Use-Cases anzupassen.