בנדיטים עם דניאל חן

בפרק זה אירחנו את דניאל חן מפייבר, לדבר על אלגוריתמי בנדיטים.

Multi armed bandit

היא גרסה מנוונת של

Reinforcement learning

אבל שימושית מאוד, עם אלגוריתמים ייחודיים לפתרון יעיל.

נדבר על שימושים בעולמות הפרסום, תימחור דינמי, ואיך מכניסים קונטקסט לבנדיטים ושומרים על שפיות.