Data Science für aktive Betrugserkennung
Betrugsfälle in der Krankenversicherung zu erkennen, gewinnt zunehmend an Bedeutung. Ein zentraler Stellhebel zur Verbesserung der Betrugserkennung sind datengetriebene Maßnahmen.
In vielen verschiedenen Fällen, in denen eine ausreichend große und qualitativ gute Datenbasis vorliegt, zahlt sich der Einsatz von Data-Science-Methoden zur Betrugserkennung aus.
Zum Beispiel können die zahlreichen Rezepte, die von den Versicherten bei der Krankenversicherung eingereicht werden, mittels Bilderkennungsverfahren analysiert werden, um eine mögliche Manipulation zu erkennen. Eine weitere Möglichkeit ist die genaue Untersuchung von Abrechnungsdaten, um Fälle zu identifizieren, in denen beispielsweise der Arzt konsequent höhere Beträge abrechnet, als er geleistet hat.
Die Basis für die Untersuchungen mittels Machine-Learning-Verfahren bilden dabei interne Daten wie Abrechnungsdaten, historische Daten sowie Kundenstammdaten. Darüber hinaus werden externe Daten herangezogen wie beispielsweise ICD-Codes für Diagnosen, der Operationen- und Prozedurenschlüssel (OPS) sowie Gebührenordnungen der Ärzte.
Verschiedene Methoden
Auf Grundlage dieser Datenbestände können verschiedene Methoden zur datengetriebenen Erkennung von Betrugsfällen angewendet werden.
Zum einen werden statistische Verfahren verwendet, um die eingereichten Abrechnungen auf Plausibilität zu überprüfen. Zum anderen unterstützen Outlier Detection- und Vergleichsverfahren die Erkennung von Auffälligkeiten in den Abrechnungsdaten.
Sollten historische Daten in entsprechendem Umfang vorhanden sein, können auch moderne Methoden aus dem Bereich Supervised Machine Learning, wie zum Beispiel binäre Klassifikationsverfahren, verwendet werden, um mögliche Betrugsfälle zu identifizieren.
Worauf es ankommt
Entscheidend ist eine umfangreiche Datenbasis, idealerweise auch mit historischen Daten. Auch Daten, welche nicht für die Rechnungsprüfung relevant sind, können zur Aufdeckung von Betrugsfällen entscheidend sein und sind strukturiert zu erfassen.
Zudem kann aus bekannten Betrugsfällen der Vergangenheit gelernt und die zugehörigen Daten können zur Validierung der Machine-Learning-Verfahren herangezogen werden.
Bei Implementierung und Anwendung ist eine Integration in die Systemlandschaft und Leistungsprüfungsprozesse erforderlich. Eine Aussteuerung aus der Dunkelverarbeitung an ein spezialisiertes Team von Experten ermöglicht eine manuelle Prüfung auffälliger Belege und reichert so die Qualität der Analytics-Ergebnisse weiter an.
Auf diese Weise führen datengetriebene Methoden zu einer deutlichen Erhöhung der Aufdeckungsrate von Betrugsfällen.
Wie die Einführung gelingt
Erste Ergebnisse können rasch und mit wenig Ressourcenaufwand durch die Implementierung eines Minimum Viable Products (MVP) erzielt werden. Auf Basis der Ergebnisse eines ersten Proof of Concept (PoC) werden anschließend weitere Schritte wie Modellverfeinerung, Parametertuning, Performancemessung sowie die Integration in die Systemlandschaft vorgenommen.
Lesen Sie mehr zur Bedeutung der Erkennung von Betrugsfällen in der Krankenversicherung im ersten Teil dieser Artikel-Serie.