Description
איך בונים מודלי שפה בעברית? למה זה כל כך מורכב, יקר, ודורש כל כך הרבה מתנדבים? והאם מודלים מקומיים בקוד פתוח יכולים באמת להתחרות במפלצות הבינה המלאכותית של OpenAI וגוגל?
בפרק הזה של "עושים תוכנה" מתארח, שוב, ים פלג. לים יש רקורד עשיר מאוד בפיתוח ומחקר סביב AI. הוא מדורג בין המובילים בעולם במדע נתונים תחרותי והחזיק לאורך השנים בכמה שיאי עולם בקטגוריות השונות בתחום. הוא אחד ממפתחיה הראשונים של ספריית הבינה המלאכותית הפופולרית: Keras, ומשמש כמנכ"ל חברת סטארט-אפ שאותה הקים, Deep Trading Ltd, חברת מסחר פיננסי גלובלית, שנשענת על ניסיונו במדעי הנתונים, תכנות ואלגוריתמים.
אבל ל-"עושים תוכנה" הוא הגיע הפעם בעיקר כדי לדבר על פרויקט מיוחד, מקומי, שבו הוא מעורב: Ivrit.AI. מיזם ללא מטרות רווח שמטרתו לאפשר תמיכה איכותית בעברית בכלי בינה מלאכותית. אלפי מתנדבים בפרויקט אוספים ומתייגים מאגרי מידע בעברית שלבסוף משוחררים לקהל הרחב ברישיון נוח לשימוש המאפשר לפתח מודלים ושירותי בינה מלאכותית בעברית. המיזם הושק לפני כשנה ואחד היישומים הראשונים שלו הוא מודל תמלול ראשון בעברית, שלפי הדיווחים מתעלה על ביצועי כל המודלים האחרים הקיימים כיום.
תפקידו של ים הוא אימון המודל, ויש לו המון דברים מרתקים לספר עליו, על עתיד מודלי השפה, ועל הדרך קדימה עבור הבינה המלאכותית בכלל.
האזנה נעימה,
בועז לביא
לפרק הקודם עם ים:https://www.osimhistoria.com/software/ep123-machine-language
לאתר הפרויקט של Ivrit.AIhttps://www.ivrit.ai/en/ivrit-ai-2/
איך מלמדים מודל שפה להבין מה חשוב בשיחת מכירות? מדוע מודלי שפה מתבססים על סיינפלד כשמבקשים מהם דאטה על שיחות עסקיות? איך נעזרים במומחי תוכן כדי לייצר פרומפטים מדויקים? ולמה לא פשוט למדוד פרודוקטיביות של מתכנתים?
יעקב אקל הוא מנהל חטיבת AI Platform בחברת גונג – המפתחת כלי AI שמסייעים לארגונים...
Published 11/18/24
מודלי השפה הגדולים כובשים את עולם הפיתוח – אבל עם הכוח הרב שלהם מגיעים גם סיכונים. בדאטה שעליו הם אומנו יש לפעמים תוכן בעייתי; משתמש יצירתי עלול לחלץ מתוכם מידע רגיש; ובכלל – ניתן לעשות איתם שימוש שעומד בניגוד למטרות המוצר או החברה. איך מתגוננים מפני כל זה?
ניב רבין, Principal Software...
Published 11/04/24