[קלוד·LEARN]/מה זה LLM

מבית אנתרופיק ישראל

01 / 12

תיאוריה ויסודות · מודול 01

מה זה LLM,
במילים פשוטות.

מודל שפה הוא לא קסם, לא כישוף ולא Google בתחפושת. בלי מתמטיקה, בלי מטריצות - רק מודל מנטלי שעובד.

12 שקופיות · 0 משוואות · ~7 דקות

השאלה שכל אחד שואל

מאיפה הוא יודע
את כל זה?

רוב האנשים מניחים, ברגע הראשון, שקלוד הוא Google בתחפושת - בנק תשובות גדול שמחפש את הקרובה ביותר.

זו לא ההסתכלות הנכונה. אם תזכרו דבר אחד מהמצגת הזאת - תזכרו שזה לא חיפוש.

הגדרה רשמית

Large Language Model.
כל אות חשובה.

LARGE

גדול

הסקאלה אינה קישוט. מיליארדי פרמטרים הם מה שמאפשרים דברים שמודל קטן פשוט לא יכול.

LANGUAGE

שפה

טקסט. רק טקסט. הוא לא יודע מה זה כאב, מה זה אדום, מה זה לרוץ - הוא יודע איך אנשים כותבים על זה.

MODEL

מודל

ייצוג מתמטי, לא מאגר. סטטיסטיקה של שפה - לא ארגז של תשובות שמחפשים בו.

≈ T

איך הוא למד

טריליוני מילים של טקסט.

ספרים, ויקיפדיה, אתרים, פורומים, קוד, מאמרים. דמיינו מישהו שקרא כל מה שכתבו בני האדם - ועכשיו צריך לחזות איך כל משפט ימשיך.

זה לא בדיוק מה שקורה - אבל זה דימוי שימושי. המודל אומן לחזות את המילה הבאה, שוב ושוב, מיליארדי פעמים.

מה הוא עושה, בעצם, ברגע הריצה

כשאתם כותבים לקלוד, הוא עושה דבר אחד:

חוזה את המילה הבאה במשפט.
שוב, ושוב, ושוב.

זהו. אין יותר מזה. כל מה שנראה לכם מורכב - תרגום, סיכום, קוד, שיחה - הוא בסך הכל חזרה על אותה פעולה.

הדגמה

איך הוא בוחר את המילה הבאה?

"השמש זורחת ב"

המודל מחשב הסתברות לכל מילה אפשרית. לרוב הוא בוחר את הגבוהה ביותר - לפעמים דוגם, כדי לא להישמע צפוי.

זאת הסיבה שאותה שאלה לא תמיד מקבלת אותה תשובה.

"בוקר"

62%

"מזרח"

28%

"שמיים"

"חזק"

"מוסקבה"

הערה חשובה

המודל לא קורא מילים. הוא קורא טוקנים.

"Hello world" - באנגלית - שני טוקנים. נקי, יפה.

Hello world

"שלום עולם" - בעברית - נשבר לחתיכות קטנות יותר.

שלום עולם

משמעות מעשית

עברית עולה יותר מאנגלית, ונכנסת פחות לחלון ההקשר.

משמע: למשימות ארוכות במיוחד - לפעמים שווה לתרגם את הקלט לאנגלית, גם אם אתם עובדים בעברית.

למה זה מספיק כדי להיראות חכם?

כי כדי לחזות טוב את המילה הבאה,
צריך ללמוד -

היגיון: כדי לדעת אם משפט הגיוני, צריך להבין סיבה-תוצאה.
סגנון: מאמר אקדמי לא נגמר כמו טוויט - צריך לזהות את ההקשר.
עובדות:"בירת צרפת היא ___" - צריך לדעת שזה פריז.
שיחה: מי דובר, מה הוא רוצה, מתי לעצור.

מה שאף אחד לא תיכנת לתוכו, אבל הופיע בדרך אגב - בעולם המקצועי נקרא emergent behavior.

מה אין לו (כברירת מחדל)

חמישה דברים שאנשים מניחים שיש - ואין.

אין גישה לאינטרנט. מה שלמד הוא מה שיש לו.

אין זיכרון בין שיחות. כל שיחה - דף חלק.

אין מודעות לעצמו - מודל בסיס לא יודע מי הוא. (קלוד אחרי כיוונון יודע להציג את עצמו.)

אין הבנה אמיתית. סגנון של הבנה - לא הבנה.

אין מקור. הוא לא יכול להגיד איפה למד משהו.

המיתוס שכדאי לזרוק

קלוד אינו מאגר,
הוא מנגן.

כמו נגן ג'אז שמאלתר: הוא לא שולף תשובה שמורה, אלא מנחש את התו הבא - בדיוק כמו שראינו: חיזוי המילה הבאה.

מאגר נשאל ומשיב. מנגן יוצר ברגע - לפי כל מה שלמד, ולפי ההקשר הספציפי שנתתם לו ברגע הזה.

אותה שאלה, פעמיים - לא תמיד אותה תשובה.

- המודל המנטלי החשוב ביותר במצגת

מסקנות מעשיות

מתי מנגן טוב, ומתי לא?

נוטה להצליח

משימות של סגנון, ניסוח, ועיבוד · לסכם טקסט שנתתם לו · לכתוב מייל בטון מסוים · לסדר רעיון מבולגן · לתרגם, לפענח כוונה · לכתוב קוד מתבנית מוכרת · לעצב, לערוך, להציע חלופות

נוטה להיכשל

משימות של עובדה מדויקת · חישובים גדולים בראש · תאריכים, מספרים, מקורות מדויקים · מידע מעבר לתאריך עדכון הידע · "מצא לי את ה___ של ___" בדייקנות · מידע נדיר על אדם פרטי / חברה קטנה · סטטיסטיקה ספציפית עם מקור

שתי הרשימות לא קבועות - המודלים משתפרים. אבל המודל המנטלי הזה הוא נקודת מוצא טובה.

סיום

בקיצור: קלוד הוא מנגן שפה
שלמד על-ידי חיזוי מילים.

המשך טבעי 01

טוקנים - איך קלוד באמת קורא טקסט

פירוט מלא של מה שראינו בשקופית 7. איך מתכננים בקשות ארוכות בלי לפוצץ את חלון ההקשר.

המשך טבעי 02

הזיות - למה המודל ממציא

אם הבנתם ש"מנגן" - אתם כבר חצי הדרך להבנה למה הוא ממציא. עכשיו נראה איך לזהות, ומתי גם למנוע.

קלודLEARN · סוף מודול 01 · חזרה לקטלוג

→ השתמשו במקשי החצים ← · רווח להמשך

מה זה LLM,במילים פשוטות.

מאיפה הוא יודעאת כל זה?

Large Language Model.כל אות חשובה.

טריליוני מילים של טקסט.

כשאתם כותבים לקלוד, הוא עושה דבר אחד:

איך הוא בוחר את המילה הבאה?

המודל לא קורא מילים. הוא קורא טוקנים.

משמעות מעשית

כי כדי לחזות טוב את המילה הבאה,צריך ללמוד -

חמישה דברים שאנשים מניחים שיש - ואין.

מתי מנגן טוב, ומתי לא?

בקיצור: קלוד הוא מנגן שפהשלמד על-ידי חיזוי מילים.

טוקנים - איך קלוד באמת קורא טקסט

הזיות - למה המודל ממציא

מה זה LLM,
במילים פשוטות.

מאיפה הוא יודע
את כל זה?

Large Language Model.
כל אות חשובה.

כי כדי לחזות טוב את המילה הבאה,
צריך ללמוד -

בקיצור: קלוד הוא מנגן שפה
שלמד על-ידי חיזוי מילים.