Listen

Description

בפרק זה אירחנו את דניאל חן מפייבר, לדבר על אלגוריתמי בנדיטים.

Multi armed bandit

היא גרסה מנוונת של

Reinforcement learning

אבל שימושית מאוד, עם אלגוריתמים ייחודיים לפתרון יעיל.

נדבר על שימושים בעולמות הפרסום, תימחור דינמי, ואיך מכניסים קונטקסט לבנדיטים ושומרים על שפיות.