קלודLEARN/מה זה LLM
01 / 12
תיאוריה ויסודות · מודול 01

מה זה LLM,
במילים פשוטות.

מודל שפה זה לא קסם, לא כישוף, ולא Google בתחפושת. בלי מתמטיקה, בלי מטריצות - רק מודל מנטלי שעובד.

12 שקופיות  ·  0 משוואות ·  ~7 דקות
השאלה שכל אחד שואל

מאיפה הוא יודע
את כל זה?

רוב האנשים מניחים, ברגע הראשון, שקלוד הוא Google בתחפושת - בנק תשובות גדול שמחפש את הקרובה ביותר.

זו לא ההסתכלות הנכונה. אם תזכרו דבר אחד מהמצגת הזאת - תזכרו שזה לא חיפוש.

הגדרה רשמית

Large Language Model.
כל אות חשובה.

LARGE
גדול

הסקלה היא לא קישוט. מיליארדי פרמטרים זה מה שמאפשר דברים שמודל קטן פשוט לא יכול.

LANGUAGE
שפה

טקסט. רק טקסט. הוא לא יודע מה זה כאב, מה זה אדום, מה זה לרוץ - הוא יודע איך אנשים כותבים על זה.

MODEL
מודל

ייצוג מתמטי, לא מאגר. סטטיסטיקה של שפה - לא ארגז של תשובות שמחפשים בו.

≈ T
איך הוא למד

טריליוני מילים של טקסט.

ספרים, ויקיפדיה, אתרים, פורומים, קוד, מאמרים. דמיינו מישהו שקרא כל מה שכתבו בני האדם - ועכשיו צריך לחזות איך כל משפט ימשיך.

זה לא בדיוק מה שקורה - אבל זה דימוי שימושי. המודל אומן לחזות את המילה הבאה, שוב ושוב, מיליארדי פעמים.

מה הוא עושה, בעצם, ברגע הריצה

כשאתם כותבים לקלוד, הוא עושה דבר אחד:

חוזה את המילה הבאה במשפט.
שוב, ושוב, ושוב.

זהו. אין יותר מזה. כל מה שנראה לכם מורכב - תרגום, סיכום, קוד, שיחה - הוא בסך הכל ריבוי של אותה פעולה.

הדגמה

איך הוא בוחר את המילה הבאה?

"השמש זורחת ב"

המודל מחשב הסתברות לכל מילה אפשרית. לרוב הוא בוחר את הגבוהה ביותר - לפעמים דוגם, כדי לא להישמע צפוי.

זאת הסיבה שאותה שאלה לא תמיד מקבלת אותה תשובה.

"בוקר"
62%
"מזרח"
28%
"שמיים"
7%
"חזק"
2%
"מוסקבה"
1%
הערה חשובה

המודל לא קורא מילים. הוא קורא טוקנים.

"Hello world" - באנגלית - שני טוקנים. נקי, יפה.

Hello world

"שלום עולם" - בעברית - נשבר לחתיכות קטנות יותר.

שלום עולם

משמעות מעשית

עברית עולה יותר מאנגלית, ונכנס פחות לחלון ההקשר.

משמע: למשימות ארוכות במיוחד - לפעמים שווה לתרגם את הקלט לאנגלית, גם אם אתם עובדים בעברית.

למה זה מספיק כדי להיראות חכם?

כי כדי לחזות טוב את המילה הבאה,
אתה חייב ללמוד -

  • היגיון: כדי לדעת אם משפט הגיוני, צריך להבין סיבה-תוצאה.
  • סגנון: מאמר אקדמי לא נגמר כמו טוויט - צריך לזהות את ההקשר.
  • עובדות:"בירת צרפת היא ___" - צריך לדעת שזה פריז.
  • שיחה: מי דובר, מה הוא רוצה, מתי לעצור.

מה שאף אחד לא תיכנת לתוכו, אבל הופיע בדרך אגב - בעולם המקצועי נקרא emergent behavior.

מה אין לו (כברירת מחדל)

חמישה דברים שאנשים מניחים שיש - ואין.

01
אין גישה לאינטרנט. מה שלמד הוא מה שיש לו.
02
אין זיכרון בין שיחות. כל שיחה - דף חלק.
03
אין מודעות לעצמו. הוא לא יודע שהוא קלוד.
04
אין הבנה אמיתית. סגנון של הבנה - לא הבנה.
05
אין מקור. הוא לא יכול להגיד איפה למד משהו.
המיתוס שכדאי לזרוק

קלוד אינו מאגר,
הוא מנגן.

מאגר נשאל ומשיב. מנגן מאלתר - לפי כל מה שלמד, ולפי ההקשר הספציפי שנתתם לו ברגע הזה.

אותה שאלה, פעמיים - לא תמיד אותה תשובה.

- המודל המנטלי החשוב ביותר במצגת

מסקנות מעשיות

מתי מנגן טוב, ומתי לא?

נוטה להצליח
משימות של סגנון, ניסוח, ועיבוד · לסכם טקסט שנתתם לו · לכתוב מייל בטון מסוים · לסדר רעיון מבולגן · לתרגם, לפענח כוונה · לכתוב קוד מתבנית מוכרת · לעצב, לערוך, להציע חלופות
נוטה להיכשל
משימות של עובדה מדויקת · חישובים גדולים בראש · תאריכים, מספרים, מקורות מדויקים · מידע אחרי תאריך החיתוך · "מצא לי את ה___ של ___" בדייקנות · מידע נדיר על אדם פרטי / חברה קטנה · סטטיסטיקה ספציפית עם מקור

שתי הרשימות לא קבועות - המודלים משתפרים. אבל המודל המנטלי הזה הוא נקודת מוצא טובה.

סיום

בקיצור: קלוד מנגן שפה
שלמדה על-ידי חיזוי מילים.

המשך טבעי 01

טוקנים - איך קלוד באמת קורא טקסט

פירוט מלא של מה שראינו בשקופית 7. איך מתכננים בקשות ארוכות בלי לפוצץ את חלון ההקשר.

המשך טבעי 02

הלוצינציות - למה המודל ממציא

אם הבנתם ש"מנגן" - חצי מבינים למה הוא ממציא. עכשיו נראה איך לזהות, ומתי גם למנוע.

קלודLEARN · קץ המודול 01 · חזרה לקטלוג

← → מקשי חצים  ·  רווח להמשך