זיהוי הונאות על ידי אנומליות עם אנדרס מRiskified

זיהוי אנומליות הוא נושא שימושי למגוון בעיות, זיהוי סנסורים דפוקים, אאוטליירים בדאטא או התנהגות חשודה.

הבעיה היא שזיהוי אנמליות בפני עצמו הא לא תמיד שימושי, אם אין פעולה שאפשר לבצע בעקבות החריגה.

נדבר על הגישות הקלאסיות לאנומלי, כגון

* Density estimation

* Auto regressive

* Distance based measures

ועל הבעייתיות שנובעת מחישוב מרחקים במימדים גבוהים.

אנדרס יציג את הגישה ההירכית שעבדה להם בריסקיפייד, המבוססת על אימון מספר גדול (6000) של מודלים ברמות שונות, והפעלת לוגיקה סטטיסטית על החריגות של כל מודל בפני עצמו.

הגישה שונה מגישות קודמות, שכן כל מודל משויך למטריקה – אזי אפשר לא רק לחזות אנומליות , אלא גם להסביר מדוע זו אנומליה ולסנן אך ורק לאנומליות עבורן יש פעולה שאפשר לנקוט.

 

קישורים:

problems and challenges related to anomaly detection on big data

The Curse of Dimensionality

 

Andres’ talk about their “new approach”