Argmax.ml

We recoded 79 podcast episodes !

ExplAInable, Israel's most popular machine learning podcast

AlgoGen - שילוב של אלגוריתמים ומודלי שפה גנרטיביים, עם אמיר שחר

בפרק זה אמיר שחר יספר על שיטה חדשנית שפרסם לשילוב מודלי שפה יחד עם אלגוריתמים. לפני 20 שנים, כנראה שאם הייתם אומרים AI הייתם מתכוונים לאלגוריתמי חיפוש בעצים. אלגוריתמי חיפוש כמו A Star <a href="https://podcast.argmaxml.com/e/algogen%d7%a9%d7%99%d7%9c%d7%95%d7%91%d7%a9%d7%9c-%d7%90%d7%9c%d7%92%d7%95%d7%a8%d7%99%d7%aa%d7%9e%d7%99%d7%9d%d7%95%d7%9e%d7%95%d7%93%d7%9c/" class="btn">להאזנה</a>

מערכות המלצה כמשק כלכלי - עם ד״ר עומר בן פורת

נהוג להסתכל על מערכת המלצה כאל בעיית אופטימיזציה, איזה סרטון לנגן כך שיהיו הכי הרבה צפיות בהתחשב בהיסטוריית הלקוח. אבל אם לוקחים צעד אחורה, מגלים שאנחנו בשוק מסחר תלת צדדי. לסרטונים יש יוצרים, ולפלטפורמה יש בעלי מניות, וכמובן - אנחנו הצופים. כמובן שאם הפלטפורמה לא תהיה רווחית, תהיה בעיה בטווח המיידי - אבל גם אם יוצרי התוכן לא יזכו לחשיפה הם ינטשו את הפלטפורמה ותהיה בעיה בטווח הרחוק. <a href="https://explainable.podbean.com/e/%d7%9e%d7%a2%d7%a8%d7%9b%d7%95%d7%aa-%d7%94%d7%9e%d7%9c%d7%a6%d7%94-%d7%9b%d7%9e%d7%a9%d7%a7-%d7%9b%d7%9c%d7%9b%d7%9c%d7%99%d7%a2%d7%9d-%d7%93/" class="btn">להאזנה</a>

עושים כבוד לעצים

רשתות נוירונים על שלל סוגיהן זוכות להרבה אטנשן - אבל בפועל, הרבה פרויקטים לא זקוקים לרשתות נוירונים. מודליים עציים הם בדרך כלל הפתרון הפשוט והיעיל לדאטא טבלאי. בפרק קצרצר זה, נסקור את עצי החלטה, תהליך אימונם ובעיית הOverfit. נדבר על שתי ההרחבות הנפוצות: <a href="https://explainable.podbean.com/e/%d7%a2%d7%95%d7%a9%d7%99%d7%9d-%d7%9b%d7%91%d7%95%d7%93-%d7%9c%d7%a2%d7%a6%d7%99%d7%9d/" class="btn">להאזנה</a>

אימות פורמלי של רשתות נוירונים עם איתי בוחניק וד״ר גיא אמיר

נדירים המקרים בהם שני תחומים כ״כ רחוקים במדעי המחשב נפגשים, ועוד זוכים להגיע לפרודקשן. אימות פורמלי הוא תחום העוסק בוידוא מתמטי שתוכנית אמורה לרוץ בלי תקלות, והוכחה שהתוכנית מקיימת תכונות מסוימות. בדרך כלל רואים אימות פורמלי בתחומים כמו קומפילציה או לוגיקה, ולכן היה מרתק לשמוע איך שיטות תאורטיות כאלו מצאו את עצמן בישום אצל חברת אלביט המפתחת רשתות נוירונים. בפרק זה איתי (מאלישרא) וגיא (אוניברסיטה העברית) יספרו על שיתוף הפעולה, והישום בשטח. <a href="https://explainable.podbean.com/e/%d7%90%d7%99%d7%9e%d7%95%d7%aa%d7%a4%d7%95%d7%a8%d7%9e%d7%9c%d7%99-%d7%a9%d7%9c%d7%a8%d7%a9%d7%aa%d7%95%d7%aa-%d7%a0%d7%95%d7%99/" class="btn">להאזנה</a>

Mamba סיכום מנהלים ותחזיות לעתיד,עם מייק ארליכסון

עולם מודלי השפה מושתת על ארכיטקטורת הטרנספורמר שמכילה בעיה מובנית בתוכה - סיבוכיות ריבועית בקלט, ולאחרונה אלטרנטיבות מעניינות לטרנספורמר הגיחו לחיינו. פרק זה הינו פרק שני בסדרה, והוא סיכום מנהלים על עקרון הדואליות, מוטיבציה ותחזיות להמשך. מייק ואני נדבר על איך דואליות משפיעה על אימון יעיל והוזלה של עלויות, על ארכיטקטורות חומרה והתאמתן לטרנספורמרים. <a href="https://explainable.podbean.com/e/mamba%d7%a1%d7%99%d7%9b%d7%95%d7%9d-%d7%9e%d7%a0%d7%94%d7%9c%d7%99%d7%9d-%d7%95%d7%aa%d7%97%d7%96%d7%99%d7%95%d7%aa-%d7%9c%d7%a2%d7%aa/" class="btn">להאזנה</a>

Mamba סקירה טכנית עם מייק ארליכסון

יש הרבה התרחשויות סביב ארכיטקטורות חדשות (שאינן טרנספורמר) שיכולות להיות המנוע מאחורי הLLM הבא. פרק זה הינו פרק ראשון מתוך שניים, על Mamba ו State Space Models שנראים אלטרנטיבה מבטיחה. נצלול טכנית למוטיבציה ולאלגוריתמים המתמטיים, ואיך פולינומי לג׳נדר קשורים לעניין. הפרק טיפה טכני מהרגיל, בפרק הבא נעלה רמה ונסקור את ההשלכות ותחזיות לדעתנו. <a href="https://explainable.podbean.com/e/mamba%d7%a1%d7%a7%d7%99%d7%a8%d7%94-%d7%98%d7%9b%d7%a0%d7%99%d7%aa-%d7%a2%d7%9d%d7%9e%d7%99%d7%99%d7%a7%d7%90%d7%a8%d7%9c%d7%99/" class="btn">להאזנה</a>

עולם ללא עוגיות - פרק הפוך עם דין פלבן

פרק משותף עם דין פלבן מ <a href='https://www.youtube.com/playlist?list=PLC4-OBA5bH3i35-xxNHefhNxmanCvWqxB'>The MLOps Podcast</a> על הנושא שמעסיק את עולם הפרסום היום. ברוח חקיקה אירופאית ואמריקאית, נהיה קשה יותר ויותר מבחינה חוקית לעקוב אחרי התנהגות משתמשים עם קוקיז (עוגיות). <a href="https://explainable.podbean.com/e/%d7%a2%d7%95%d7%9c%d7%9d%d7%9c%d7%9c%d7%90-%d7%a2%d7%95%d7%92%d7%99%d7%95%d7%aa%d7%a4%d7%a8%d7%a7-%d7%94%d7%a4%d7%95%d7%9a-%d7%a2%d7%9d/" class="btn">להאזנה</a>

למידה מולטי מודאלית עם ד״ר חן חג׳ג׳

מודלים מולטי-מודאלים הגיעו לקידמת הבמה לאחרונה עם מודלים כמו chatGPT, Whisper, Midjourney. נדבר על האתגרים בשילוש מודלים חזותיים, טקסטואלים וגרפיים - כאשר המימדים שונים, המימדים שונים, ואיך מרוויחים מהשילוב הזה. נדבר על cross modal learning - איך אפשר ללמד מודל אחד על סמך מודאליות של מודל אחר. <a href="https://explainable.podbean.com/e/%d7%9c%d7%9e%d7%99%d7%93%d7%94%d7%9e%d7%95%d7%9c%d7%98%d7%99-%d7%9e%d7%95%d7%93%d7%90%d7%9c%d7%99%d7%aa%d7%a2%d7%9d-%d7%93%d7%b4%d7%a8-%d7%97%d7%9f/" class="btn">להאזנה</a>

ניהול פרויקטי דאטא סיינס עם חן קרני

ניהול אנשים זה אתגר, ניהול מחקר עם תוצר לא-וודאי - זה אתגר, וניהול ממשקים עם פרודקט,תוכנה והנהלה בכירה זה בכלל מורכב. בפרק זה אירחנו את חן קרני, מנהלת מנוסה בתחום הדאטא לדבר על איך עושים את זה נכון, וללמד מה עבד עבורה. איך לפרק פרויקטים גדולים למשימות קטנות (בשיטת הסלאמי) שאפשר לתקשר, איך למדוד ולהגדיר יעדים (שגם אפשר לעמוד בהם), ומה הם השלבים בפרויקט חדש. <a href="https://explainable.podbean.com/e/%d7%a0%d7%99%d7%94%d7%95%d7%9c%d7%a6%d7%95%d7%95%d7%aa%d7%99-%d7%93%d7%90%d7%98%d7%90-%d7%a1%d7%99%d7%99%d7%a0%d7%a1-%d7%a2%d7%9d%d7%97%d7%9f-%d7%a7/" class="btn">להאזנה</a>

טרנספורמרים בעיבוד תמונה Visual Transformers

טרנספורמרים הם ללא ספק המודל המועדף בעיבוד שפה - אבל האם גם בתמונות? אז... מסתבר שהתמונה לא כל כך ברורה בעיבוד תמונה. בפרק זה נדבר על היתרונות הגדולים של טרנספורמרים בתמונות - ועל הסיטואציות שבהן CNN מנצחות אותם. <a href="https://explainable.podbean.com/e/%d7%98%d7%a8%d7%a0%d7%a1%d7%a4%d7%95%d7%a8%d7%9e%d7%a8%d7%99%d7%9d-%d7%91%d7%a2%d7%99%d7%91%d7%95%d7%93-%d7%aa%d7%9e%d7%95%d7%a0%d7%94visual-transfor/" class="btn">להאזנה</a>

על אינטלגנציה מלאכותית בעולם המשפט - עם עומר חיון

לפני כשש שנים עומר חיון ואורי גורן התחילו הרפתקאה בעולם הLegal tech והקימו את BestPractix בסט פרקטיקס התמקדה בשלב הטיוטות של החוזים, והיוותה כלי עזר לעורכי דין לזהות ״אנומליות״ בחוזים (שבדרך כלל די סטנדרטים), והצעה של אלטרנטיבות מקובלות יותר. בשנת 2020 בסט פרקטיקס נמכרה לLitera Systems האמריקאית, ועומר הועבר להמשך הפיתוח. <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-%d7%90%d7%99%d7%a0%d7%98%d7%9c%d7%92%d7%a0%d7%a6%d7%99%d7%94-%d7%9e%d7%9c%d7%90%d7%9b%d7%95%d7%aa%d7%99%d7%aa-%d7%91%d7%a2/" class="btn">להאזנה</a>

AI Junk - איך עושים למידת מכונה עם קרטון ביצים

דיברנו הפעם על פרויקט <a href='https://ai-junk.com/'>ai-junk</a> המאפשר לכל אחד ליצור רובוטים מגרוטאות וליצור ולאמן מודלי reinforcement learning שישלטו ברובוטים. ובכך ליצור עולם משחק מרובה רובוטים על הריצפה בסלון. דיברנו על מה זה RL, על הקשיים להפוך RL שעובד טוב בוירטואלי לעולם הפיסי, על כמה נחמד ללמוד על התחום דרך רובוטים :) הפרק הוקלט לפני המלחמה ששיבשה לנו הכל וארועים שתוכננו בוטלו. אם מעניין אתכם להצטרף לסדנה או האקטון הרשמו <a href='https://docs.google.com/forms/d/e/1FAIpQLSdo2Y9z-kNg6LTwWXzJcm5EP_DeDyd8oWCmsxICxYpacZ4Ohw/viewform'>כאן</a> ונעדכן אתכם. <a href="https://explainable.podbean.com/e/ai-junk%d7%90%d7%99%d7%9a-%d7%a2%d7%95%d7%a9%d7%99%d7%9d%d7%9c%d7%9e%d7%99%d7%93%d7%aa%d7%9e%d7%9b%d7%95%d7%a0%d7%94-%d7%a2%d7%9d/" class="btn">להאזנה</a>

מה עושים כשיש מעט נתונים - עם נתנאל דוידוביץ

נתנאל, דאטא סיינטינסט ותיק שמוביל היום את המחקר בדאבל וריפיי ידבר איתנו על בעיה כואבת אך נפוצה. גייסנו תקציבים, כוח אדם, ועם הרבה רצון ומוטיבציה ניגשנו לפרויקט חדש - פתחנו את מכסה המנוע, וגילינו לצערינו שאין מספיק נתונים- מה הלאה ? נדבר על שלוש טקטיקות שאפשר לנקוט, בין אם זה תיוג עצמאי ורכישת דאטא, שימוש במודלים כגון Label spreading, transfer learning, kde <a href="https://explainable.podbean.com/e/%d7%9e%d7%94-%d7%a2%d7%95%d7%a9%d7%99%d7%9d-%d7%9b%d7%a9%d7%99%d7%a9-%d7%9e%d7%a2%d7%98-%d7%a0%d7%aa%d7%95%d7%a0%d7%99%d7%9d%d7%a2%d7%9d/" class="btn">להאזנה</a>

מודלי שפה ופלט רצוי

יצא לנו הרבה לדבר על מודלי שפה גדולים לאחרונה, ועל השימושים שלהם. למעט שימוש בצ׳אטבוט או כעזר לכתיבה, לרוב אנחנו רוצים לקבל את הפלט של המודל בפורמט כלשהו כמו Json / Data Class נדבר על שלושת השלבים ביצירת הפלט, הטוקנייזר, הטרנספורמר, והמפענח. <a href="https://explainable.podbean.com/e/%d7%9e%d7%95%d7%93%d7%9c%d7%99-%d7%a9%d7%a4%d7%94-%d7%95%d7%a4%d7%9c%d7%98-%d7%a8%d7%a6%d7%95%d7%99/" class="btn">להאזנה</a>

על מודלי שפה גדולים בפרודקשן עם איתי ציטבר

בפרק זה אירחנו את איתי ציטבר רש"צ מהיירו - לדבר על מודלי שפה בפרודקשן. המודלי צ'אט כ"כ חזקים - האם בכלל נשאר מה לעשות חוץ מאשר לחבר את הAPI לאתר ? מצד שני, זה נראה כאילו כולם משתמשים בLLM, גם כאשר קיימים מודלים פשוטים יותר. נדבר על מה קורה כשהמלצת המודל מתנגשת עם נהלים רפואיים, מה קורה שהמודל נותן הנחיות שגויות למטופל, ואין אפשר לצמצם את התופעה עם Retrieval augmented generation. <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-%d7%9e%d7%95%d7%93%d7%9c%d7%99-%d7%a9%d7%a4%d7%94-%d7%92%d7%93%d7%95%d7%9c%d7%99%d7%9d%d7%91%d7%a4%d7%a8%d7%95%d7%93/" class="btn">להאזנה</a>

איך נולדים נתונים מתויגים עם דניאל מנוחין

בפרק זה אירחנו את דניאל מנוחין, מנהלת קהילת data-ops המובילה את התיוג וטקסונומיה ב ebay בסופו של דבר, מודלים טובים ככל שיהיו - חסומים על ידי איכות הדאטא עליהם הם אומנו. דניאל תספר על החוויות שלה בebay, על נקודות כשל קלאסיות בתהליך התיוג ועל איך בונים פרוטוקול אנוטציה אחיד. נדון בהבדל בין מתייגים in-house שהם ממש חלק מהארגון, לעומת מתייגים חיצוניים (כדוגמת mechnical turk) ועל ההשפעה על איכות התיוגים ותהליכי הפיקוח. <a href="https://explainable.podbean.com/e/%d7%90%d7%99%d7%9a-%d7%a0%d7%95%d7%9c%d7%93%d7%99%d7%9d%d7%a0%d7%aa%d7%95%d7%a0%d7%99%d7%9d-%d7%9e%d7%aa%d7%95%d7%99%d7%92%d7%99%d7%9d/" class="btn">להאזנה</a>

על GLM ו AGLM עם לובה אורלובסקי

זה מרגיש כאילו עולם הלמידה מחולק ל2 מחנות, הסטטיסטיקאים ואנשי מדעי המחשב. ולאחרונה יצא מודל AGLM שהוא רעידת אדמה בעולם האקטואריה (ביטוח, פיננסים), וכנראה שרובנו לא שמענו עליו. בפרק זה נסקור מה אלו מודלי GLM, ספוילר - אחד מהם - הרגרסיה הלוגיסטית, אתם מכירים היטב. נדבר על השימושים שלהם, היתרונות שלהם בתחום הפיננסים בעקבות יכולת ההסבר שלהם, ונדבר גם על המגבלות שלהם. <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-glm-%d7%95-aglm-%d7%a2%d7%9d-%d7%9c%d7%95%d7%91%d7%94-%d7%90%d7%95%d7%a8%d7%9c%d7%95%d7%91%d7%a1%d7%a7%d7%99/" class="btn">להאזנה</a>

עם שוקי ויואל על מאחורי הקלעים של One Shot Learning

מי לא מכיר את שוקי ויואל - הגאונים מאחורי ערוץ היוטיוב האדיר שמביא את תרבות הלייב קודינג בעולמות למידת המכונה לארץ הקודש. וואן שוט לרנינג התחיל לפני כשנתיים כרעיון, ומאז הפך לקאלט של ממש. אבל מאחורי כל סרטון של חצי שעה, מסתתרת עבודה רבה, מחקר, באגים, והמון נסיונות שהלכו לפח. בפרק זה אורי ראיין את שוקי ויואל על מאחורי הקלעים של ההפקה, ושואל שאלות קשות. איך הכל התחיל ולמה? איזה פרק הכי אהבתם? איזה פדיחה קרתה בצילומים? ומה התוכניות להמשך ? <a href="https://explainable.podbean.com/e/%d7%a2%d7%9d-%d7%a9%d7%95%d7%a7%d7%99-%d7%95%d7%99%d7%95%d7%90%d7%9c-%d7%a2%d7%9c-%d7%9e%d7%90%d7%97%d7%95%d7%a8%d7%99-%d7%94/" class="btn">להאזנה</a>

תורת המשחקים עם מורן קורן

בפרק זה אירחנו את מורן קורן, חוקר ומרצה לתורת המשחקים מאוניברסיטת בן גוריון. דיברנו בעבר שימוש ב<a href='https://amlekai-ml-ai-podcast.castos.com/episodes/episode-06-xai'>ערכי שייפלי</a> לפרשנות מודלים, ערכי שייפלי הם נושא מחקר פעיל בתורת המשחקים והחלטנו להעמיק ולשפוך אור על תורת המשחקים ואיך הרעיונות משלימים את הנחקר בלמידת מכונה. דיברנו על המונחים, מהו שיווי משקל ? איך מגדירים משחקים לפי ידיעה שלמה או גורל, על אסטרטגיה אופטימלית, ואיפה תורת המשחקים פוגשת אותנו כאנשי דאטא. <a href="https://explainable.podbean.com/e/%d7%aa%d7%95%d7%a8%d7%aa-%d7%94%d7%9e%d7%a9%d7%97%d7%a7%d7%99%d7%9d-%d7%a2%d7%9d-%d7%9e%d7%95%d7%a8%d7%9f-%d7%a7%d7%95%d7%a8%d7%9f/" class="btn">להאזנה</a>

על מערכות חיפוש - סיכום ביקור בכנס הייסטאק 2023 עם אמיר לבנטל

אמיר ואורי נסעו במסגרת עבודתם ב<a href='https://www.argmaxml.com'>ארגמקס</a> לכנס הייסטאק HayStack2023 המתמקד בחיפוש, ואימלקו לכם את הפרק לעשרים דקות צפופות על החידושים בתחום החיפוש בעידן ה Language models <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-%d7%9e%d7%a2%d7%a8%d7%9b%d7%95%d7%aa%d7%97%d7%99%d7%a4%d7%95%d7%a9%d7%a1%d7%99%d7%9b%d7%95%d7%9d-%d7%91%d7%99%d7%a7%d7%95%d7%a8/" class="btn">להאזנה</a>

מעבר לדאטא אנליסט לדאטא סיינס - בחסות YDATA

בפרק זה אירחנו את רותם דמבו ועומר דודי, שסיפרו לנו על המעבר שעשו בשנה האחרונה, מתפקיד של אנליסט לתפקיד של מדען נתונים. דיברנו על הפערים "התרבותיים" בין המקצועות, אילו יתרונות יש לאנליסט שמחפש להכנס לתחום מדעי הנתונים, אילו השלמות כדאי לעשות ואיזה טיפים יש להם לתת למי שנכנס לתחום. הם יספרו על ההחלטה לעשות את המעבר, על הלימודים בתוכנית Y-DATA, על איך התוכנית סייעה להם במעבר ועל מה הם עושים כיום. <a href="https://explainable.podbean.com/e/%d7%9e%d7%a2%d7%91%d7%a8%d7%9c%d7%93%d7%90%d7%98%d7%90%d7%90%d7%a0%d7%9c%d7%99%d7%a1%d7%98-%d7%9c%d7%93%d7%90%d7%98%d7%90-%d7%a1/" class="btn">להאזנה</a>

על למידה חיזוקית באימון מודלי שפה RLHF עם מייק

קשה לעבור ברחוב היום בלי לשמוע מישהו מספר לחברו על צ'אט ג'י פי טי או LLM אחד החידושים באימון שלו, למעשה ב InstructGPT <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-%d7%9c%d7%9e%d7%99%d7%93%d7%94-%d7%97%d7%99%d7%96%d7%95%d7%a7%d7%99%d7%aa-%d7%91%d7%90%d7%99%d7%9e%d7%95%d7%9f-%d7%9e/" class="btn">להאזנה</a>

סיבתיות עם אוהד לוינקרון פיש

בפרק זה נדבר עם אוהד מדילטייל, העוסק בניתוח סיבתיות. אנחנו כולנו למדנו בטירונות דאטא סיינס ש Correlation does not imply causation אבל מה כן ? האם חייבים לבצע ניסויים מדוקדקים? והאם זה רלוונטי רק לעולם הרפואה או לכולנו ? <a href="https://explainable.podbean.com/e/%d7%a1%d7%99%d7%91%d7%aa%d7%99%d7%95%d7%aa-%d7%a2%d7%9d-%d7%90%d7%95%d7%94%d7%93-%d7%9c%d7%95%d7%99%d7%a0%d7%a7%d7%a8%d7%95%d7%9f-%d7%a4%d7%99%d7%a9/" class="btn">להאזנה</a>

חיפוש וקטורי מקורב

וקטורים, וקטורים בכל מקום ! דיברנו על מילים שהופכות לוקטורים, מסמכים שהופכים לוקטורים, תמונות שהופכות לוקטורים. אבל ברוב המקרים, נדרש חיפוש של וקטורים דומים למשימות של קלאסיפיקציה, דירוג ואפילו זיהוי אנומליות. חיפוש וקטורי בקנה מידה גדול זו בעיה הנדסית לא פשוטה, עם אילוצי זמן ריצה וזכרון. בפרק קצרצר זה, נסקור שלושה אלגוריתמים לחיפוש מקורב ונדבר על סוגי הוקטורים המתאימים. <a href="https://explainable.podbean.com/e/%d7%97%d7%99%d7%a4%d7%95%d7%a9-%d7%95%d7%a7%d7%98%d7%95%d7%a8%d7%99-%d7%9e%d7%a7%d7%95%d7%a8%d7%91/" class="btn">להאזנה</a>

על התאוריה של Replay Buffer עם שירלי די קסטרו שעשוע

פרק נוסף בתחום הלמידה החיזוקית, הפעם צוללים לפרטים הטכניים עם התאוריה מאחורי Replay Buffer סוכן, יכול ללמוד רק מהפעולות שלו - מה שנקרא On Policy <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-%d7%94%d7%aa%d7%90%d7%95%d7%a8%d7%99%d7%94%d7%a9%d7%9c-replaybuffer-%d7%a2%d7%9d%d7%a9%d7%99%d7%a8%d7%9c%d7%99-%d7%93%d7%99/" class="btn">להאזנה</a>

העבודה הראשונה בדאטא שלי

פרק זה הוא חסות מיוחד בשיתוף אנבידיה, שמוקדש לג'וניורים. אנבידיה הפיקה את כנס ה GTC עם דגש מיוחד השנה של גנרטיב - <a href='https://nvda.ws/3jLtogA'>להרשמה לחצו פה</a> <a href="https://explainable.podbean.com/e/%d7%94%d7%a2%d7%91%d7%95%d7%93%d7%94-%d7%94%d7%a8%d7%90%d7%a9%d7%95%d7%a0%d7%94-%d7%91%d7%93%d7%90%d7%98%d7%90-%d7%a9%d7%9c%d7%99/" class="btn">להאזנה</a>

על קורסטים עם איתן נצר

בפרק זה אירחנו את איתן נצר, מ data heroes לדבר על בחירה חכמה של דגימות לצורך אימון מודלים. אנחנו בעידן הדאטא, נאספים טרות של אירועים מדי יום - אבל המודל שלנו לאו דווקא מרוויח מכל השפע הזה. <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-%d7%a7%d7%95%d7%a8%d7%a1%d7%98%d7%99%d7%9d-%d7%a2%d7%9d-%d7%90%d7%99%d7%aa%d7%9f-%d7%a0%d7%a6%d7%a8/" class="btn">להאזנה</a>

אתגר הלווינות של מפא”ת

בפרק זה נציג את אתגר הלווינות החדש בסדרת MAFAT Challenge. אירחנו את ליאל ממפא"ת ואת שי ועידן מ-Webiks. דיברנו על מהפכת החלל, האתגר בזיהוי אובייקטים מתצלומי לוויין במאפיינים שונים וההבדלים ביחס לגילוי אובייקטים קלאסיים. <a href="https://explainable.podbean.com/e/%d7%90%d7%aa%d7%92%d7%a8-%d7%94%d7%9c%d7%95%d7%95%d7%99%d7%a0%d7%95%d7%aa-%d7%a9%d7%9c-%d7%9e%d7%a4%d7%90-%d7%aa/" class="btn">להאזנה</a>

זיהוי הונאות על ידי אנומליות עם אנדרס מRiskified

זיהוי אנומליות הוא נושא שימושי למגוון בעיות, זיהוי סנסורים דפוקים, אאוטליירים בדאטא או התנהגות חשודה. הבעיה היא שזיהוי אנמליות בפני עצמו הא לא תמיד שימושי, אם אין פעולה שאפשר לבצע בעקבות החריגה. נדבר על הגישות הקלאסיות לאנומלי, כגון * Density estimation <a href="https://explainable.podbean.com/e/%d7%96%d7%99%d7%94%d7%95%d7%99%d7%94%d7%95%d7%a0%d7%90%d7%95%d7%aa-%d7%a2%d7%9c%d7%99%d7%93%d7%99%d7%90%d7%a0%d7%95%d7%9e%d7%9c/" class="btn">להאזנה</a>

איך לא להעסיק ג’וניורים במקצועות הדאטא

פרק זה הוא פרק סולו של אורי, בוא הוא יספר על החוויה שלו בפתיחת משרת ג'וניור בארגמקס. המשרה זכתה לחשיפה גבוהה ברשתות החברתיות והגיעה ל40 אלף איש בעקבות שיטת הגיוס הלא שגרתית. אורי יספר על מבחן הבית, ההיענות המפתיעה של מועמדים והביקורות שקיבל מקולגות לתחום. באם יש לכם נסיון או מומחיות בתחום גיוס הג'וניורים, נשמח לפידבק בקבוצת הטלגרם שלנו <a href="https://explainable.podbean.com/e/%d7%90%d7%99%d7%9a-%d7%9c%d7%90-%d7%9c%d7%94%d7%a2%d7%a1%d7%99%d7%a7-%d7%92%d7%95%d7%a0%d7%99%d7%95%d7%a8%d7%99%d7%9d-%d7%91/" class="btn">להאזנה</a>

רשתות נוירונים על גרפים עם חגי מרון

בפרק זה אירחנו את חי מרון מ nvidia לדבר על עיבוד גרפים עם רשתות נוירונים. נדבר על ישומים של גרפים בחיים האמיתיים, ועל ההבדל האינהרנטי שבין גרף לבין "תמונה" או מטריצה כללית. <a href="https://explainable.podbean.com/e/%d7%a8%d7%a9%d7%aa%d7%95%d7%aa%d7%a0%d7%95%d7%99%d7%a8%d7%95%d7%a0%d7%99%d7%9d%d7%a2%d7%9c-%d7%92%d7%a8%d7%a4%d7%99%d7%9d-%d7%a2/" class="btn">להאזנה</a>

יצירה אוטומטית של קוד עם פרופ ערן יהב וד”ר אורי אלון

בפרק קודם דיברנו על קודקס, מודל השפה שמאחורי Github Co-Pilot בפרק זה, החלטנו להעמיק ולראיין את ערן יהב, חוקר באקדמיה והמוח מאחורי TabNine <a href="https://explainable.podbean.com/e/%d7%99%d7%a6%d7%99%d7%a8%d7%94%d7%90%d7%95%d7%98%d7%95%d7%9e%d7%98%d7%99%d7%aa%d7%a9%d7%9c-%d7%a7%d7%95%d7%93-%d7%a2%d7%9d%d7%a4%d7%a8%d7%95%d7%a4/" class="btn">להאזנה</a>

Data Centric AI עם סיגל שקד

נראה שעולם המודלים הגיעה לבשלות, לא פעם יוצא לנסות כמה מודלים שונים ולהגיע לאותן מטריקות. הטרנד של data centric ai שמוביל <a href="https://explainable.podbean.com/e/data-centric-ai-%d7%a2%d7%9d-%d7%a1%d7%99%d7%92%d7%9c-%d7%a9%d7%a7%d7%93/" class="btn">להאזנה</a>

על חינוך בתחום הבינה המלאכותית עם שי פרח

בפרק זה אירחנו את שי פרח ממכון וייצמן, מומחה להוראת המדעים. בעידן שלנו, ללמוד לתכנת זה כישור יסוד כמו קריאה וכתיבה בעידן המחשב. האם הגיע המקום לחשיבה בשיטת ai4all <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-%d7%97%d7%99%d7%a0%d7%95%d7%9a-%d7%91%d7%aa%d7%97%d7%95%d7%9d%d7%94%d7%91%d7%99%d7%a0%d7%94%d7%94%d7%9e%d7%9c%d7%90/" class="btn">להאזנה</a>

זרימות מנורמלות עם מייק ארליכסון

מייק, אורח קבוע של הפודקאסט ידבר איתנו על Normalized Flows מודל חדש ליצירת תמונה מטקסט, או תמונה מתמונה בדומה ל Diffusion model, GANS and VAE <a href="https://explainable.podbean.com/e/%d7%96%d7%a8%d7%99%d7%9e%d7%95%d7%aa-%d7%9e%d7%a0%d7%95%d7%a8%d7%9e%d7%9c%d7%95%d7%aa%d7%a2%d7%9d-%d7%9e%d7%99%d7%99%d7%a7-%d7%90/" class="btn">להאזנה</a>

אנומליות בתמונות עם ערן אילת

בפרק זה אירחנו את ערן אילת האנומליה, לדבר על חיזוי אנומליות בתמונות.. חיזוי של חריגות הוא קריטי לתחומים רבים כמו סייבר, הונאה פיננסית ובקרה על מודלים. בעולמות התמונה, נדבר על שלושת הסוגים של חריגות, חריגה מההתפלגות OOD <a href="https://explainable.podbean.com/e/%d7%90%d7%a0%d7%95%d7%9e%d7%9c%d7%99%d7%95%d7%aa-%d7%91%d7%aa%d7%9e%d7%95%d7%a0%d7%95%d7%aa-%d7%a2%d7%9d-%d7%a2%d7%a8%d7%9f-%d7%90%d7%99%d7%9c%d7%aa/" class="btn">להאזנה</a>

איך פרילנסר ניגש לפרויקט AI

תמיר ואורי, שניהם עוסקים כיועצים בתחום למידת המכונה - ועשו הרבה טעויות שניתן ללמוד מהם כשניגשים לפרויקט חדש. בפרק זה, נדבר על שלושה פרויקטים לדוגמא - ומה הן השאלות והסוגיות שצריך להעלות לפני שמתחילים. נדבר על מטריקות - איך מודדים פרויקט, על אתגרים טכניים. איך בוחנים האם הדאטא מספק, והאם הארגון בכלל בשל ל <a href="https://explainable.podbean.com/e/%d7%90%d7%99%d7%9a-%d7%a4%d7%a8%d7%99%d7%9c%d7%a0%d7%a1%d7%a8-%d7%a0%d7%99%d7%92%d7%a9-%d7%9c%d7%a4%d7%a8%d7%95%d7%99%d7%a7%d7%98-ai/" class="btn">להאזנה</a>

Co-Pilot - Codex ויצירה של קוד עם מודלי שפה

הקופיילוט של גיטהאב הכניס למודעות תחום מחקר מרתק של Program Synthesis העוסק ביצירה של קוד מתוך טקסט או מתוך דוגמאות הרצה. אורי, כמשתמש נלהב של טייס המשנה יספר מהחוויות שלו על השימוש - החוזקות והחולשות של הכלי. <a href="https://explainable.podbean.com/e/co-pilot-codex-%d7%95%d7%99%d7%a6%d7%99%d7%a8%d7%94-%d7%a9%d7%9c-%d7%a7%d7%95%d7%93-%d7%a2%d7%9d-%d7%9e%d7%95%d7%93%d7%9c%d7%99-%d7%a9%d7%a4%d7%94/" class="btn">להאזנה</a>

שישה מאמרים שכל דאטא סיינטינסט חייב להכיר עם שקד זיכלינסקי

בפרק זה אירחנו את שקד זיכלינסקי, ראש קבוצת ההמלצות של לייטריקס. שקד ריכז עבורנו את ששת המאמרים החשובים שכל דאטא סיינטיסט מודרני חייב להכיר. ששת המאמרים הם: (1) Attention Is All You Need <a href="https://explainable.podbean.com/e/%d7%a9%d7%99%d7%a9%d7%94%d7%9e%d7%90%d7%9e%d7%a8%d7%99%d7%9d-%d7%a9%d7%9b%d7%9c%d7%93%d7%90%d7%98%d7%90%d7%a1%d7%99%d7%99%d7%a0/" class="btn">להאזנה</a>

Novel Class Discovery זיו פרוינד על

בפרק זה אירחנו את זיו פרוינד שהכיר לנו מונח חדש לבעיה נפוצה. מכירים את זה שאימנתם מודל שעובד מעולה כשמסווגים 10 מחלקות, אבל פתאום כשמגיעים לשטח מגלים שיש עוד 12 מחלקות שלא חשבתם עליהם ומבלבלות את המודל ? זיו יספר על נסיונו בסיווג סיגנלים באלביט, ויספר על גישות לפתרון הבעיה. נשמע לכם כמו קלאסטרינג ? גם לנו - נדבר על ההבדלים ועל שימוש בשיטות כמו <a href="https://explainable.podbean.com/e/novel-class-discovery-%d7%96%d7%99%d7%95-%d7%a4%d7%a8%d7%95%d7%99%d7%a0%d7%93-%d7%a2%d7%9c/" class="btn">להאזנה</a>

Multi-Task Learning עם איתי מרגולין

בפרק זה נראיין את איתי מרגולין על אחת הטכניקות הפרקטיות בתעשייה שכל עסקן דיפ לרנינג חייב להכיר. מולטי-טאסק זו למידה של מספר משימות במקביל, ולמרות שהמונח קיים כבר עשרות שנים, הוא זכה להכרה מחדש עם פרוץ דיפ לחיינו. נדבר על מתי למידה של מספר משימות מועילה, מתי היא מזיקה ? מה ההבדל מול <a href="https://explainable.podbean.com/e/multi-task-learning-%d7%a2%d7%9d-%d7%90%d7%99%d7%aa%d7%99-%d7%9e%d7%a8%d7%92%d7%95%d7%9c%d7%99%d7%9f/" class="btn">להאזנה</a>

מערכות המלצה בטאבולה עם דנה קנר

כמשתמשים אנחנו נחפשים למערכות המלצה כל הזמן, בין אם זה בסופר בקניות או בגלילת סרטים בנטפליקס. בפרק זה נדבר עם דנה, על איך טאבולה, ענקית ההמלצות העולמית ממליצה לנו על כתבות דומות כשאנחנו גולשים באינטרנט. נדבר על המלצות מבוססות תוכן בלבד content filtering <a href="https://explainable.podbean.com/e/%d7%9e%d7%a2%d7%a8%d7%9b%d7%95%d7%aa-%d7%94%d7%9e%d7%9c%d7%a6%d7%94-%d7%91%d7%98%d7%90%d7%91%d7%95%d7%9c%d7%94%d7%a2%d7%9d-%d7%93/" class="btn">להאזנה</a>

זיהוי אובייקטים עם אברהם רביב

בפרק זה נדבר על זיהוי אובייקטים בתמונה, ונארח את אברהם רביב - דוקטורנט בתחום בבר אילן ופעיל מאוד בקהילה עם הסקירות המעולות שלו. נדבר על בעיות בראיה ממוחשבת, מקלאסיפיקציה, דרך זיהוי אובייקטים ועד סגמנטציה - ועל הקושי בתיוג. זיהוי אובייקטים יכול להיות ממודל או כבעיה דו שלבית, הכוללת שלב נקודות עניין ואז קלאסיפיקציה או יחדיו - ונזכיר את YOLO <a href="https://explainable.podbean.com/e/%d7%96%d7%99%d7%94%d7%95%d7%99%d7%90%d7%95%d7%91%d7%99%d7%99%d7%a7%d7%98%d7%99%d7%9d%d7%a2%d7%9d-%d7%90%d7%91%d7%a8%d7%94%d7%9d/" class="btn">להאזנה</a>

Defusion Denoising Models עם מייק ארליכסון

ראיון מיוחד עם מייק ארליכסון האחד והיחיד על מודל גנרטיבי "חדש". Diffusion Models הם שיטה חדש לפעפוע רעש, ואימון מודל להפוך רעש על ידי סדרה של מודלים לתמונות סופר איכותיות. נדבר על המאמר: <a href="https://explainable.podbean.com/e/defusion-denoising-models-%d7%a2%d7%9d-%d7%9e%d7%99%d7%99%d7%a7-%d7%90%d7%a8%d7%9c%d7%99%d7%9b%d7%a1%d7%95%d7%9f/" class="btn">להאזנה</a>

MLOps עם אורן רזון

בפרק זה נדבר עם אורן רזון שמוביל את superwise על שלושת השלבים של דיפלוימנט של מודלי למידת מכונה. נדבר על מה יכול להשתבש בפרודקשן כשמודל מתיישן והעולם מתיישן, ואיך ניתן להיות עם יד על הדופק עם <a href="https://explainable.podbean.com/e/mlops-%d7%a2%d7%9d-%d7%90%d7%95%d7%a8%d7%9f-%d7%a8%d7%96%d7%95%d7%9f/" class="btn">להאזנה</a>

Machine Learning Engineering עם אסף פנחסי

למידת מכונה נורא כיפית ופשוטה כשמורידים מחברת מקאגל וכל הדאטא יושב בקובץ על המחשב ליד, אבל בחיים האמיתיים המצב לא כ"כ פשוט. בפרק זה אסף פנחסי (יועץ בתחום, בוגר פייפל ובכיר בזברה מדיקל לש') לספר לנו על החיים האמיתיים. שאלנו את אסף את כל השאלות הקשות: מחברות או קוד ? האם feature store <a href="https://explainable.podbean.com/e/machine-learning-engineering-%d7%a2%d7%9d-%d7%90%d7%a1%d7%a3-%d7%a4%d7%a0%d7%97%d7%a1%d7%99/" class="btn">להאזנה</a>

סטטיסטיקה בייסיאנית

סטטיסטיקאים נחצים ל2 מחנות: הסטטיסטיקאים הקלאסיים-תדירותיים, והסטטיסטיקאים הבייסיאנים. סטטיסטיקה בייסיאנית היא גישה שונה לסטטיסטיקה, שמנסה לדון בסבירות לא רק של הדאטא הנצפה בהנתן השערה, אלא גם בסבירות של הפרמטרים של ההתפלגות. מודלים רבים כגון GMM, Naive Bayes ו Latent Dirrechlet allocation <a href="https://explainable.podbean.com/e/%d7%a1%d7%98%d7%98%d7%99%d7%a1%d7%98%d7%99%d7%a7%d7%94-%d7%91%d7%99%d7%99%d7%a1%d7%99%d7%90%d7%a0%d7%99%d7%aa/" class="btn">להאזנה</a>

ניווט אינרציאלי עם ברק אור

בפרק זה אירחנו את ברק אור לספר לנו על ניווט אינרציאלי. כשאנחנו חושבים על ניווט, אנחנו חושבים על גוגל מאפס, ווייז ושלל אפליקציות שמשתמשות ב GPS. אבל לג'י פי אס יש מגבלות, ויש דרכים נוספות לנווט - כגון מדדי תאוצה, מהירות ומצפן. <a href="https://explainable.podbean.com/e/%d7%a0%d7%99%d7%95%d7%95%d7%98-%d7%90%d7%99%d7%a0%d7%a8%d7%a6%d7%99%d7%90%d7%9c%d7%99-%d7%a2%d7%9d-%d7%91%d7%a8%d7%a7-%d7%90%d7%95%d7%a8/" class="btn">להאזנה</a>

על בינה מלאכותית בסייבר עם רועי טבח

בפרק זה ראיינו את רועי טבח שייספר לנו על האתגרים בעולם הסייבר, דיברנו על שימוש באנומלי דטקשן להתראה על אירועים חשודים בלוגים של מערכות. ודיברנו על מירוץ החימוש הנצחי בין התוקפים למגינים <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-%d7%91%d7%99%d7%a0%d7%94-%d7%9e%d7%9c%d7%90%d7%9b%d7%95%d7%aa%d7%99%d7%aa-%d7%91%d7%a1%d7%99%d7%99%d7%91%d7%a8-%d7%a2/" class="btn">להאזנה</a>

Proximal Policy Optimization מה זה

כבר התרגלנו בעולם המשין לרנינג, ששום מודל לא שורד יותר משנה-שנתיים בתור ה SOTA עד שמגיעה גישה חדשה שטורפת את הקלפים. לכן מעניין דווקא לדבר על <a href="https://explainable.podbean.com/e/proximal-policy-optimization-%d7%9e%d7%94-%d7%96%d7%94/" class="btn">להאזנה</a>

בנדיטים עם דניאל חן

בפרק זה אירחנו את דניאל חן מפייבר, לדבר על אלגוריתמי בנדיטים. Multi armed bandit היא גרסה מנוונת של Reinforcement learning <a href="https://explainable.podbean.com/e/%d7%91%d7%a0%d7%93%d7%99%d7%98%d7%99%d7%9d-%d7%a2%d7%9d-%d7%93%d7%a0%d7%99%d7%90%d7%9c-%d7%97%d7%9f/" class="btn">להאזנה</a>

Variational Auto Encoders עם מייק ארליכסון

פרק מהארכיון, עם מייק ארליכסון המפורסם מסקירות המאמרים. בפרק זה נדבר על הדרך מאוטו-אנקודר אל VAE לצורך יצירה של דאטא סינטתי. <a href="https://explainable.podbean.com/e/variational-auto-encoders-%d7%a2%d7%9d-%d7%9e%d7%99%d7%99%d7%a7-%d7%90%d7%a8%d7%9c%d7%99%d7%9b%d7%a1%d7%95%d7%9f/" class="btn">להאזנה</a>

עצי החלטה - חוזרים לבסיס

בפרק זה נחזור לבסיס ונדבר על עצי החלטה, המודל הבסיסי והאינטואטיבי ביותר - שעדיין עובד יותר טוב על דאטא טבלאי. נדבר על שיטות אימון חמדניות, ועל שימוש באנטרופיה כקירוב. ונתאר מה ההבדל בין שיטות ה ensemble <a href="https://explainable.podbean.com/e/%d7%a2%d7%a6%d7%99-%d7%94%d7%97%d7%9c%d7%98%d7%94-%d7%97%d7%95%d7%96%d7%a8%d7%99%d7%9d-%d7%9c%d7%91%d7%a1%d7%99%d7%a1/" class="btn">להאזנה</a>

למידה ניגודית Contrastive Learning

נראה שלמידה ניגודית מקבלת המון תשומת לב לאחרונה, בעיבוד תמונה, טקסט ואפילו דאטא טבלאי. נדבר על המאמר פורץ הדרך של הינטון SimCLR ונשווה אותו אל מול שיטות קלאסיות של הורדת מימד. <a href="https://explainable.podbean.com/e/%d7%9c%d7%9e%d7%99%d7%93%d7%94-%d7%a0%d7%99%d7%92%d7%95%d7%93%d7%99%d7%aa-contrastive-learning/" class="btn">להאזנה</a>

פדיחות של למידה

בהמשך לסיקור החדשותי של זילו, והחיזוי מחירי נדלן שהביאו להפסדים של מיליארדים - תמיר ואורי מתוודאים על פדיחות שעשו בפרויקטים. מה קורה כשהמודל מושלם אבל תהליך יצירת הדאטא פחות ? איך פרויקט תיוג יכול להשתבש ולהתפוצץ בפנים, וכמובן - כמה חשוב לקרוא את האותיות הקטנות בדוקמנטציה. <a href="https://explainable.podbean.com/e/%d7%a4%d7%93%d7%99%d7%97%d7%95%d7%aa-%d7%a9%d7%9c-%d7%9c%d7%9e%d7%99%d7%93%d7%94/" class="btn">להאזנה</a>

עיבוד קול עם אמיר עברי

בפרק זה אירחנו את אמיר עברי להסביר לנו על עיבוד קול, מה הם השלבים השונים בפייפליין של Speech recognition ועל האתגרים בתחום. בפרק נדבר על שיטות כגון MFCC <a href="https://explainable.podbean.com/e/speech-with-amir-ivri/" class="btn">להאזנה</a>

על התאוריה של דיפ לרנינג, עם גלעד יהודאי

על מהפכת הדיפ לרנינג לא צריך להרחיב, כולנו מכירים וחלקנו אף מימשנו. אבל למה לעזאזל הדבר הזה עובד ? בפרק זה אירחנו את גלעד יהודאי, סטודנט לדוקטורט לתחום ושאלנו אותו את השאלות הקשות. נלמד מה זה "אוברפיטינג שפיר" מה היא תופעת ה"ירידה הכפולה" ומה הם שלושת סוגי הטעויות בלמידה. <a href="https://explainable.podbean.com/e/%d7%a2%d7%9c-%d7%94%d7%aa%d7%90%d7%95%d7%a8%d7%99%d7%94%d7%a9%d7%9c-%d7%93%d7%99%d7%a4-%d7%9c%d7%a8%d7%a0%d7%99%d7%a0%d7%92%d7%a2%d7%9d-%d7%92/" class="btn">להאזנה</a>

עיבוד שפה בעברית, עם פרופסור רעות צרפתי

בפרק זה אורי מארח את רעות צרפתי לדבר על עיבוד שפה בעברית. מה ההבדל בכלל בין עברית לאנגלית ? למה זה יותר קשה ? האם החיים היו יותר קלים אם היינו כותבים עם ניקוד ? ודיברנו על ההבדלים הבלשניים של שפות שמיות (עברית וערבית) אל מול שפות הודו אירופאיות. <a href="https://explainable.podbean.com/e/hebrew-nlp-with-reut-tsarfaty/" class="btn">להאזנה</a>

Positive Unlabeled Learning שי פלצ‘י על

קיבלתם פעם דאטאסט עם "כל הדברים שחשוב לזהות" אבל בלי אף דוגמא שלילית ? אני בטוח שכן, אפשרות אחת לפתרון היא למדל את הבעיה כקלאסיפיקציה ואיכשהו להמציא דוגמאות שליליות. או, לחילופין למדל את הבעיה כ Positive Unlabeled Learning <a href="https://explainable.podbean.com/e/positive-unlabeled-learning-with-shay-palachy/" class="btn">להאזנה</a>

Welcome back -not amlek.ai - we‘re ExplAInable

Tamir Nave and Uri Goren introduce themselves and the new podcast format. <a href="https://explainable.podbean.com/e/welcome-back-not-amlekai-we-re-explainable/" class="btn">להאזנה</a>

Episode 18: AlgoTrading

בפרק זה, התארחנו ב <a href="http://weel.com" target="_blank" rel="noopener">weel.com</a>, ואירחנו את יגאל ויינברגר, שדיבר איתנו על AlgoTrading. שוחחנו על סוגי אלגוטריידינג (Sell side, Buy side, HFT), ועל גישות האלגוריתמים בתחום: כלים סטטיסטיים סטנדרטיים, LSTM, Reinforcement Learning. בנוסף, הצגנו כיצד אפשר להיכנס לתחום, ויגאל אפילו נתן לנו אלגוריתם baseline להתחיל לשחק איתו. האותיות הקטנות של האזהרה: כן לנסות את זה בבית, אבל לא כ"כ מהר על כסף אמיתי! קישורים רלוונטיים: <ul> <ul> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-18-algotrading" class="btn">להאזנה</a>

Episode 17: Models Discrimination

בפרק זה, נארח את אופיר יוקטן - שמתעסק בניבוי התאמה של קורות חיים. אופיר יציג כיצד הוא מתמודד עם מודלים מפלים על רקע מגדרי\גזעני. נעסוק בשיטות להתמודדות עם הבעיה הזו: העלמת או הינדוס פיצ'רים, אימון עם Database מאוזן, ושיטת Gradient reversal layer. קישורים: <ul> <li style="font-weight: 400;" aria-level="1"> "What is Adverse Impact? And Why Measuring It Matters." 26 Mar. 2018, <a href="https://www.hirevue.com/blog/hiring/what-is-adverse-impact-and-why-measuring-it-matters" target="_blank" rel="noopener">https://www.hirevue.com/blog/hiring/what-is-adverse-impact-and-why-measuring-it-matters</a>. Accessed 15 Dec. 2020.</li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-17-models-discrimination" class="btn">להאזנה</a>

Episode 16: GAN - Generative Adversarial Networks

בפרק זה, נדבר על מודלים ג'נרטיביים, ובפרט על מהפכת ה-GAN=Generative Adversarial Networks. איך עובד הקסם? תחרות בין מודלים - האחד שמזייף, והשני שמגלה זיופים. וקצת על כל הנגזרות של האלגוריתם, שבאו כפטריות אחרי הגשם. קישורים: <ul> <li style="font-weight: 400;" aria-level="1"><a href="https://arxiv.org/abs/1406.2661">מאמר מקורי GAN</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-16-gan-generative-adversarial-networks" class="btn">להאזנה</a>

Episode 15: Transformers - האבולוציה של ניתוח סדרות בזמן

בפרק זה, נסקור את ההשתלשלות של ניתוח סדרות בזמן החל מ-RNN, דרך Attention Models ועד ל-Transformers. נדבר על Self Attention, Multi Headed Attention, LSTM, RNN, GRU, Transformers ו-DeTR. קישורים רלוונטיים: <ul> <li style="font-weight: 400;" aria-level="1"><a href="https://towardsdatascience.com/attention-networks-c735befb5e9f">Attention Models</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-15-transformers-habvlvih-shl-nitv-sdrvt-bzm" class="btn">להאזנה</a>

Episode 14: Graph Neural Nets - שיכון גרפים

בפרק זה נארח את אלה בור, שתספר לנו על מהם גרפים (קשתות וצמתים), על בעיות המיוצגות ע"י גרפים ועל שיכון גרפים במרחב אוקלידי (GNN, Node2Vec). קישורים: <ul> <li style="font-weight: 400;" aria-level="1">Node2vec - <a href="https://arxiv.org/pdf/1607.00653.pdf">https://arxiv.org/pdf/1607.00653.pdf</a>, <a href="https://towardsdatascience.com/node2vec-embeddings-for-graph-data-32a866340fef">https://towardsdatascience.com/node2vec-embeddings-for-graph-data-32a866340fef</a></li> <li style="font-weight: 400;" aria-level="1">GNN - <a href="https://arxiv.org/pdf/1812.08434.pdf">https://arxiv.org/pdf/1812.08434.pdf</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-14-graph-neural-nets-shiv-grfim" class="btn">להאזנה</a>

Episode 13: 3D

<h3 style="direction: rtl; text-align: right;">בפרק זה אנו נארח את פיטר נפתליאב <a href="https://2d3d.ai/" target="_blank" rel="noopener">הבלוגר </a>ומנהל קהילת <a href="https://www.reddit.com/r/2D3DAI/" target="_blank" rel="noopener">/r/2D3DAI</a> שידבר איתנו על עולם התלת מימד. </h3> <h3 style="direction: rtl; text-align: right;">נעסוק ביישומים ובסוגי הבעיות בתחום. נסקור ייצוגים של DATA תלת מימדי: Cad, Mesh, Voxel, Points Cloud.</h3>   קישורים רלוונטיים: <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-13-3d" class="btn">להאזנה</a>

Episode 12: Gaussian process regression/ Kriging

בפרק זה נדבר על שיטת רגרסיה, שנקראת Kriging או Gaussian process regression - שיטה בייסיאנית שהחלה במטרה לאתר מכרות זהב. נדבר על מושגי מבוא, כמו: משתנה אקראי גאוסי ותהליך אקראי גאוסי, ועל משפט הגאוסיאני המותנה. קישורים רלוונטיים: <ul> <li style="font-weight: 400;" aria-level="1"><a href="https://www.math.univ-toulouse.fr/~fbachoc/LRC_Manon_2014.pdf" target="_blank" rel="noopener">https://www.math.univ-toulouse.fr/~fbachoc/LRC_Manon_2014.pdf</a></li> <li style="font-weight: 400;" aria-level="1"><a href="https://www.youtube.com/watch?v=xBE8qdAAj3w" target="_blank" rel="noopener">Pydata nyc workshop on GPR</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-12-gaussian-process-regression-kriging" class="btn">להאזנה</a>

Episode 11: Curriculum Learning - תכניות אימון למודלים

בפרק זה נעסוק בתחום ה-Curriculum Learning - מה זה ולמה זה טוב? איך מסדרים בסדר מוצלח יותר את דוגמאות האימון ולפי אילו מדדים? בשיחה, נדבר על המרכיבים המקובלים - scoring ו-pacing, ועל מתודולוגית Teacher-Student. קישורים רלוונטיים: <ul> <li style="font-weight: 400;"><a href="https://mila.quebec/wp-content/uploads/2019/08/2009_curriculum_icml.pdf" target="_blank" rel="noopener">Curriculum learning</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-11-curriculum-learning-tnivt-aimv-lmvdlim" class="btn">להאזנה</a>

Episode 10: Fourier Transform - אינטרו לפורייה

בפרק זה, נשוחח על מהי התמרת פורייה. מוטיבציות, שימושים, Time Series והקשר ללמידה עמוקה. קישורים רלוונטיים:  <ul> <li><a href="https://www.youtube.com/watch?v=spUNpyF58BY" target="_blank" rel="noopener">But what is the Fourier Transform? A visual introduction</a></li> <li><a href="http://ecmlpkdd2017.ijs.si/papers/paperID11.pdf" target="_blank" rel="noopener">Fourier Convolutional Neural Networks</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-10-fourier-transform-ainrv-lfvriih" class="btn">להאזנה</a>

Episode 9: Adversarial Training - איך לבלבל מודלים?

בפרק זה, נדבר על Adversarial Attacks, על איך מייצרים Adversarial Examples בשיטת FGSM, על התקפות White or Black box models ונזכיר Certifiable Robustness. <ul> <ul> <li style="font-weight: 400;"><a href="https://arxiv.org/pdf/1412.6572.pdf" target="_blank" rel="noopener">FGSM</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-9-adversarial-training-ai-lblbl-mvdlim" class="btn">להאזנה</a>

Episode 8: הורדת מימדים

בפרק זה נדבר על הורדת מימדים - Dimensionality reduction. נעסוק במוטיבציות (קללת המימדים), ובאלגוריתמים PCA, T-SNE, AutoEncoders, SOM. קישורים רלוונטיים: <ul> <li style="font-weight: 400;"><a href="https://onlinecourses.science.psu.edu/stat505/lesson/11">https://onlinecourses.science.psu.edu/stat505/lesson/11</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-8-hvrdt-mimdim" class="btn">להאזנה</a>

Episode 7: Clustering from a bird eye view

בפרק זה נעסוק בבעיה הכי שכיחה בעולם unsupervised, הרי היא בעיית ה-clustering - ניתוח אשכולות. נדבר על משפחות אלגוריתמים (top down - bottom up, soft-hard, metric/ graph/ distribution based), ונעסוק במדדי הצלחה קלאסיים (silhouette, dunn index, DB index, Rand index) ובמדדי הצלחה תלויי בעיה. קישורים רלוונטיים: <ul> <li style="font-weight: 400;"><a href="https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=8412085" target="_blank" rel="noopener">Deep Learning Clustering</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-7-clustering-from-a-bird-eye-view" class="btn">להאזנה</a>

Episode 06: (XAI) פרשנות מודלים

בפרק זה נעסוק באיך מפרשים מודלים ואיך מבינים את ההחלטות שלהם. תחום רחב זה נקרא Explainable artificial intelligence או Interpretable machine learning. בפרק נעסוק בטכניקות השונות שיש בתחום ובפרט ב ZF-NET, DeepDream, GradCam, Lime, Shap. קישורים רלוונטיים: <ul> <li style="font-weight: 400;"><a href="https://christophm.github.io/interpretable-ml-book/">ספר אונלייני</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-06-xai" class="btn">להאזנה</a>

Episode 05: NLPH (NLP In Hebrew)

בפרק זה נדבר על עיבוד טקסט בעברית, ונציג כיצד הוא שונה משפות אחרות, ובפרט מאנגלית. נשוחח על ה-NLP Pipeline ועל למה הוא שבור בעברית, ונדבר על התחביר של עברית והתכונות הייחודיות של שפות שמיות. <a href="https://cs.biu.ac.il/staff/118" target="_blank" rel="noopener">רעות צרפתי</a> <a href="https://cs.biu.ac.il/staff/106" target="_blank" rel="noopener">יואב גולדברג</a> <a href="https://github.com/OnlpLab" target="_blank" rel="noopener">המעבדה לעיבוד שפה טבעית בעברית</a> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-05-nlph-nlp-in-hebrew" class="btn">להאזנה</a>

Episode 04: All Multi's

בפרק זה נדבר על כל ה-Multi's וננסה לעשות סדר במושגים שנוטים לבלבל: multi class classification, multi label classification, multi task learning, Multi objective, Multiple modality. נגדיר כל מושג, ניתן דוגמאות ונדון בסוגיות ומימושים סביב כל מושג. קישורים רלוונטיים: <ul> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-04-all-multi39s" class="btn">להאזנה</a>

Episode 03: Active Learning

<h5 style="direction: rtl;">בפרק זה נדבר על מהי Active Learning, כמה זה נפוץ ומתי ניתן לעשות זאת. נדבר על קריטריוני החלטה (Query Strategies):</h5>  Least Confidence ,Margin Sampling ,Entropy Sampling ונזכיר את ההבדלים במתודולוגיות: Membership Query Synthesis, Stream-Based Selective Sampling, Pool-Based Sampling. לסיום נדון ב-Active Learning כבעיית Reinforcement Learning. קישורים רלוונטים\שהזכרנו: <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-03-active-learning" class="btn">להאזנה</a>

Episode 02: Reinforcement Learning - Introduction

<h5 style="direction: rtl;">בפרק זה נדבר על למידה חיזוקית - Reinforcement Learning.</h5> <h5 style="direction: rtl;">נדבר על מושגי היסוד בתחום (environment, state, policy, agent, reward), על סיווג של התחום הזה ב-Machine Learning, על למה זה נהיה מאוד פופולארי, על הקשיים בתחום ועל דילמת ה-Exploration - Exploitation.</h5> קישורים שהוזכרו: <a href="https://openai.com/blog/emergent-tool-use/" target="_blank" rel="noopener">שיתוף פעולה בין סוכנים במשחק המחבואים</a> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-02-reinforcement-learning-introduction" class="btn">להאזנה</a>

Episode 01: The Lottery Ticket Hypothesis

בפרק זה, נעסוק ב-Neural Network Pruning, כאשר נתקמד בפרט במאמר פורץ דרך מ2019, שנקרא "THE LOTTERY TICKET HYPOTHESIS: FINDING SPARSE TRAINABLE NEURAL NETWORKS", מבית היוצר של MIT. במאמר זה, מציעים דרך מעניינת לקצץ רשת גדולה במעל 80% מהמשקלים שלה בצורה כזו שהביצועים (ה-accuracy) לא ייפגעו. קישורים שהוזכרו בפרק: <ul> <li><a href="https://arxiv.org/pdf/1803.03635.pdf">THE LOTTERY TICKET HYPOTHESIS: FINDING SPARSE, TRAINABLE NEURAL NETWORKS</a></li> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-01-the-lottery-ticket-hypothesis" class="btn">להאזנה</a>

Episode 00: Who are we and what do we want?

<h4 style="text-align: right; padding-left: 30px;">זהו פרק מבוא קצרצר בו אנו מספרים מי הוא תמיר נווה ומי הוא אורי גורן, למה החלטנו להתחיל עם הפודקאסט, ומה היינו רוצים שיהיה בפרקים הבאים.</h4> <a href="https://amlekai-ml-ai-podcast.castos.com/episodes/episode-00-who-are-we-and-what-do-we-want" class="btn">להאזנה</a>

Argmax - Recommendation system experts