Socure は機械学習を使って不正行為とどのように戦うのか
「重みとバイアスにより、私たちのチームは、データセットからトレーニング、本番成果物に至るまで、モデルの系譜を完全に理解することができました。」

エドワード・リー
コンピュータビジョン研究責任者
ソキュア
について
詐欺はテクノロジーが大好きです。迷惑電話やスパム テキストの多発、常に存在するスパム メール、NFT 詐欺など、私たちの相互接続性により、詐欺を広範囲のユーザーに対して実行することがはるかに安価になります。スパム メールをキャッチするフィルターやボットをフィルタリングする CAPCHA などのガードレールが設定されると、詐欺師がすでに裏口やエクスプロイトを探して懸命に働いていると考えて間違いありません。詐欺はテクノロジーが大好きというだけでなく、動きも速いのです。
Socure は革新的で魅力的な企業で、購入者の身元と情報をインテリジェントかつ正確に検証する多数の製品を提供しています。その中には、今日ご紹介するPredictive DocV (ここでの「V」は検証の略) も含まれます。Predictive DocV は、多次元の階層化された ID 情報を活用して、政府発行の身分証明書や自撮り写真でユーザーの身元を検証することに特化しています。つまり、ソキュア
の拡大し続ける独自のデータベース (既知の 8 億の正当および不正な ID に関する業界横断的な顧客フィードバック データ) のデータを分析して相関させ、最先端のコンピューター ビジョン技術を適用します。目標は、数秒以内に確実な予測を提供することです。
の拡大し続ける独自のデータベース (既知の 8 億の正当および不正な ID に関する業界横断的な顧客フィードバック データ) のデータを分析して相関させ、最先端のコンピューター ビジョン技術を適用します。目標は、数秒以内に確実な予測を提供することです。
そして、それはうまく機能しています。ソキュア
は Capital One、Chime、Poshmark、Wells Fargo などの機関で使用されています。今日お答えしたいのは、ソキ ュア
のチームがどのようにして私たちを詐欺師から守っているかということです。
は Capital One、Chime、Poshmark、Wells Fargo などの機関で使用されています。今日お答えしたいのは、ソキ ュア
のチームがどのようにして私たちを詐欺師から守っているかということです。

導入
私たちは、Predictive DocV のコンピューター ビジョン コンポーネントに焦点を当てます。これは、ソキュア
の不正検出に対する総合的なアプローチの中で、比較的新しいコンポーネントだからです。チーム自体は設立されてから 1 年ちょっとです。
の不正検出に対する総合的なアプローチの中で、比較的新しいコンポーネントだからです。チーム自体は設立されてから 1 年ちょっとです。
このような問題を解決するには、賢く機敏な実践者で構成された素晴らしいチームを構築する必要があることは言うまでもありません。ソキュア
にはまさにそれがあります。しかし、機械学習は依然として急速に進化している分野であり、多様なバックグラウンドには多様なツールやライブラリが伴い、多様なチームや実践者間で ML ワークフローの利用方法に一貫性がなくなります。チームの効率性を向上させ、モデルの再現性を確保するために、標準化は最優先事項でした。
にはまさにそれがあります。しかし、機械学習は依然として急速に進化している分野であり、多様なバックグラウンドには多様なツールやライブラリが伴い、多様なチームや実践者間で ML ワークフローの利用方法に一貫性がなくなります。チームの効率性を向上させ、モデルの再現性を確保するために、標準化は最優先事項でした。
ソキュア
のコンピューター ビジョン研究責任者、Edward Li 氏の登場です。
のコンピューター ビジョン研究責任者、Edward Li 氏の登場です。
「私たちの哲学は、他の人のためにコードを書くということです」とエドワードは言います。「これは、クライアントが不正行為をより効果的に防止できるように製品版のコードを書くということだけではなく、チームメイトやパートナーのためにコードを書くことも意味します。そうすれば、彼らの母国語で記事を読むのと同じくらい簡単に、自分のコードを読んで理解できるようになります。」
彼らは、良心的なチームなら誰でもやるようなことをしました。つまり、ツールとフレームワークを試用し、比較検討したのです。結局、チームは PyTorch と Weights & Biases を標準化するという 2 つの優先事項に落ち着きました。チーム全体でこの 2 つを固定化することで、コード レビューが速くなり、モデルのトレーニングが速くなり、何よりも、実稼働までの時間が短縮されました。そして、不正検出のような分野では、その時間は本当に重要です。
ソキュア
が重みとバイアスを選択した理由
ソキ ュア
は頻繁に反復作業を行っています。同社は常に機械学習を使用してモデルをトレーニングし、不正行為を解決するための新しいコンピューター ビジョン アプローチを試しています。しかし、導入前はモデルの比較が面倒でした。時間がかかり、同等のものを比較していることに完全に自信を持つことが困難でした。W&B に移行すると、すべてが変わりました。チームはすぐに適応し、突然、より迅速に行動し、より多くのモデルをトレーニングし、より多くの実験を比較しました。全員が同じ考えを持っていました。
は頻繁に反復作業を行っています。同社は常に機械学習を使用してモデルをトレーニングし、不正行為を解決するための新しいコンピューター ビジョン アプローチを試しています。しかし、導入前はモデルの比較が面倒でした。時間がかかり、同等のものを比較していることに完全に自信を持つことが困難でした。W&B に移行すると、すべてが変わりました。チームはすぐに適応し、突然、より迅速に行動し、より多くのモデルをトレーニングし、より多くの実験を比較しました。全員が同じ考えを持っていました。
そして、すぐに成果が現れました。Weights & Biases は Python で書かれていました。モデルは簡単にレビューできました。パフォーマンスは理解しやすく、視覚的にも美しく表示されました。Artifacts などの W&B のコンポーネントは、チーム全体でさまざまな用途に再利用できました。Edward 氏は、これらのコンポーネントを、モデルのパフォーマンスを理解してデバッグしやすくするレゴ ブロックに例えています。チームが PyTorch を採用したことで、可読性とレビューが大幅に高速化されました。W&B 本来のカスタマイズ性を活用し、特定の問題に適した特定のワークフローとダッシュボードを構築しました。さらに、W&B は Hydra やその他の社内スタックとうまく連携しました。
「Weights & Biases により、データセットからトレーニング、本番環境の成果物に至るまで、モデルの系譜を完全に理解できるようになりました」とエドワード氏は語ります。「モデル構築の効率が 15% 向上し、さらにハードウェアのコストも約 15% 削減できました。」
チームにとってのさらなるメリットは、コンピューター ビジョン担当の同僚とその他の関係者の両方に、自分たちの仕事を紹介することが明確かつ簡単になったことです。 社内的には、膨大なデータセットの小さなサブセットで新しいアイデアをテストし、そのアプローチが有望かどうかをすぐに理解できるようになりました。最も優れたアイデアに素早く取り組み、あまり成功しなかったアイデアから先に進むことができました。社外的には、カスタムの視覚化とグラフを作成し、どのモデルが不正を最も予測できるかを示すことができました。他のエンジニアや技術に詳しくない関係者に、自分たちの仕事をわかりやすい形で提示することができました。彼らはより迅速に行動し、より透明性のある仕事をするようになりました。Predictive DocV のパフォーマンスは向上し続けました。
W&B はデプロイメントの面でも役立っています。キーと成果物に簡単にアクセスできるということは、モデルを簡単に見つけ、理解し、デプロイできることを意味します。「Docker イメージを取得するようなものです」とエドワード氏は言います。「デプロイメントは迅速かつ簡単です。」
結論
機械学習の実装の中には斬新なものもあるが、それほど重要なメリットをもたらすものではない。たとえば、顔を漫画のキャラクターに変える GAN を考えてみよう。しかし、ソキュア
では、機械学習は、私たち全員を詐欺から守るという、非常に広範囲にわたるメリットをもたらしている。
では、機械学習は、私たち全員を詐欺から守るという、非常に広範囲にわたるメリットをもたらしている。
ご存知のとおり、不正行為は急速に進んでいます。常に一歩先を行くことが何よりも重要です。コラボレーションが鍵となります。PyTorch と Weights & Biases を使用して機械学習ワークフローを標準化することで、より多くの優れたモデルをより速くトレーニングし、迅速かつ自信を持って展開できるようになりました。同社のチームは賢く、機敏で、成長を続けています。そして、彼らはすべての人に利益をもたらす重要な仕事をしています。拡大する不正行為の問題から私たちを守るために同社を支援したい方は、ぜひご連絡ください。