Wie Socure Betrug mit maschinellem Lernen bekämpft
„Weights & Biases gab unserem Team ein umfassendes Verständnis der Herkunft unseres Modells, von Datensätzen über Training bis hin zu Produktionsartefakten.“

Edward Li
Leiter der Computer Vision-Forschung
Über Socure
Betrug liebt Technologie. Ob es sich nun um die Vielzahl von Spam-Anrufen und -SMS, allgegenwärtige Spam-E-Mails oder NFT-Betrug handelt, unsere Vernetzung macht Betrugsversuche bei großen Zielgruppen viel günstiger. Sobald einige Schutzmaßnahmen eingerichtet sind – Filter zum Abfangen von Spam-E-Mails oder CAPCHAs zum Herausfiltern von Bots – kann man davon ausgehen, dass Betrüger bereits hart arbeiten und nach einer Hintertür oder einem Exploit suchen. Betrug liebt nicht nur Technologie, sondern ist auch schnell.
Das bedeutet, dass man zur Betrugsbekämpfung schnell reagieren und die richtige Technologie einsetzen muss. Und genau das tut das Team von Socure .
Socure ist ein innovatives, faszinierendes Unternehmen, das eine Vielzahl von Produkten anbietet, die die Identität und Informationen von Käufern intelligent und präzise verifizieren. Dazu gehört auch ein Produkt, über das wir heute sprechen werden: Predictive DocV (das „V“ steht hier für Verification). Predictive DocV ist auf die Verifizierung der Identität von Benutzern mit behördlich ausgestellten Ausweisdokumenten und Selfies spezialisiert, indem mehrdimensionale, vielschichtige Identitätsinformationen genutzt werden. Das bedeutet, dass Daten aus Socures ständig wachsender proprietärer Datenbank mit branchenübergreifenden Kundenfeedbackdaten zu 800 Millionen bekannten guten und schlechten Identitäten analysiert und korreliert werden und modernste Computer-Vision-Techniken angewendet werden. Das Ziel? Eine zuverlässige Vorhersage innerhalb von Sekunden.
Und es funktioniert. Socure wird von Institutionen wie Capital One, Chime, Poshmark und Wells Fargo verwendet. Die Frage, die wir heute beantworten möchten, ist, wie das Team von Socure selbst daran arbeitet, uns vor den Betrügern vor unserer Haustür zu schützen.

Einführung
Wir werden uns auf die Computervision-Komponente von Predictive DocV konzentrieren. Das liegt daran, dass es sich tatsächlich um eine neuere Komponente in Socures ganzheitlichem Ansatz zur Betrugserkennung handelt. Das Team selbst ist etwas mehr als ein Jahr alt.
Es versteht sich von selbst, dass man ein großartiges Team mit intelligenten, agilen Praktikern aufbauen muss, um ein Problem wie dieses zu lösen. Socure bietet genau das. Aber das maschinelle Lernen ist immer noch ein sich schnell entwickelndes Feld und mit unterschiedlichen Hintergründen gehen unterschiedliche Tools und Bibliotheken einher, was Inkonsistenzen bei der Nutzung von ML-Workflows in diesen unterschiedlichen Teams und Praktikern mit sich bringt. Die Standardisierung hatte hohe Priorität, um die Effizienz des Teams zu verbessern und sicherzustellen, dass ihre Modelle reproduzierbar waren.
Hier kommt Edward Li ins Spiel, Leiter der Computer Vision-Forschung bei Socure.
„Unsere Philosophie ist, dass Sie Code für andere Leute schreiben“, sagte Edward. „Das bedeutet nicht nur, dass Sie Produktionscode schreiben, um unseren Kunden zu helfen, Betrug besser zu verhindern, sondern auch, dass Sie Code für Ihre Teamkollegen und Partner schreiben, damit das Lesen und Verstehen Ihres Codes so einfach ist wie das Lesen eines Artikels in ihrer Muttersprache.“
Sie taten, was jedes gewissenhafte Team tun würde: Sie testeten Tools und Frameworks, verglichen und kontrastierten. Letztendlich einigte sich das Team auf zwei Prioritäten: Standardisierung rund um PyTorch und Weights & Biases. Beides im gesamten Team zu verankern, bedeutete schnellere Codeüberprüfungen, schnelleres Modelltraining und vor allem eine schnellere Produktionszeit. Und in einem Bereich wie der Betrugserkennung ist diese Zeit wirklich wichtig.
Warum Socure sich für Weights & Biases entschieden hat
Socure iteriert viel. Sie trainieren ständig Modelle mit maschinellem Lernen und probieren neuartige Computer-Vision-Ansätze zur Betrugsaufklärung aus. Aber vor der Einführung war der Vergleich von Modellen mühsam. Es dauerte lange und es war schwieriger, völlig sicher zu sein, dass sie Äpfel mit Äpfeln verglichen. Als sie zu Weights & Biases wechselten, änderte sich das alles. Das Team passte sich schnell an und plötzlich kamen sie schneller voran, trainierten mehr Modelle und verglichen mehr Experimente. Alle waren auf dem gleichen Stand.
Und sie sahen sofort Dividenden. Weights & Biases war pythonisch. Modelle waren einfach zu überprüfen. Die Leistung war leichter zu verstehen und elegant visualisiert. Weights & Biases-Komponenten wie Artifacts konnten im gesamten Team für unzählige Zwecke wiederverwendet werden. Edward vergleicht diese Komponenten mit Legosteinen, die es einfach machen, die Modellleistung zu verstehen und zu debuggen. Parallel dazu, dass das Team PyTorch einführte, waren Lesbarkeit und Überprüfungen viel schneller. Sie stützten sich auf die inhärente Anpassbarkeit von Weights & Biases und entwickelten die spezifischen Workflows und Dashboards, die für ihr spezifisches Problem geeignet waren. Außerdem funktionierte Weights & Biases gut mit Hydra und dem Rest ihres internen Stacks.
„Weights & Biases gab unserem Team ein umfassendes Verständnis der Herkunft unseres Modells, von Datensätzen über Training bis hin zu Produktionsartefakten“, sagte Edward. „Wir konnten unsere Effizienz beim Erstellen von Modellen um 15 % steigern und zusätzlich etwa 15 % bei den Hardwareausgaben einsparen.“
Ein zusätzlicher Vorteil für das Team war, dass es seine Arbeit übersichtlich und einfach präsentieren konnte – sowohl gegenüber den Kollegen aus dem Bereich Computer Vision als auch gegenüber anderen Stakeholdern. Intern bedeutete dies, dass sie neue Ideen an kleinen Teilmengen ihrer riesigen Datensätze testen und sofort erkennen konnten, ob dieser Ansatz erfolgversprechend war. Sie konnten sich schneller auf ihre besten Ideen konzentrieren und weniger erfolgreiche Ideen hinter sich lassen. Extern konnten sie benutzerdefinierte Visualisierungen und Diagramme erstellen und zeigen, welche Modelle Betrug am wahrscheinlichsten vorhersagten. Sie konnten ihre Arbeit anderen Ingenieuren und weniger technisch versierten Stakeholdern auf verständliche Weise präsentieren. Sie kamen schneller voran und arbeiteten transparenter. Die Leistung von Predictive DocV verbesserte sich ständig.
Weights & Biases hilft auch bei der Bereitstellung. Durch leicht zugängliche Schlüssel und Artefakte sind Modelle leicht zu finden, zu verstehen und bereitzustellen. „Es ist wie das Abrufen eines Docker-Images“, sagte Edward. „Die Bereitstellung ist schnell und einfach.“
Abschluss
Einige Implementierungen des maschinellen Lernens sind neuartig, bringen aber nicht viele wichtige Vorteile mit sich. Denken Sie beispielsweise an ein GAN, das Ihr Gesicht in eine Zeichentrickfigur verwandelt. Bei Socure bringt maschinelles Lernen jedoch enorme, weitreichende Vorteile: Es schützt uns alle vor Betrug.
Und wie wir alle wissen, ist Betrug schnell. Es ist von größter Bedeutung, immer einen Schritt voraus zu sein. Zusammenarbeit ist der Schlüssel. Durch die Standardisierung der Machine-Learning-Workflows mit PyTorch und Weights & Biases konnten mehr und bessere Modelle schneller trainiert und schnell und zuverlässig bereitgestellt werden. Ihr Team ist intelligent, flexibel und wächst. Und sie leisten wichtige Arbeit, von der alle profitieren. Wenn Sie ihnen helfen möchten, uns alle vor dem wachsenden Betrugsproblem zu schützen, würden sie sich freuen, von Ihnen zu hören.