מאמר

מי זה אנתרופיק?

החברה, המייסדים, החזון ה-safety-first, וההיסטוריה הקצרה - ולמה כל זה משנה למה שקלוד אומר.

מי היא אנתרופיק

אנתרופיק (Anthropic) היא חברת מחקר בבינה מלאכותית שנוסדה ב-2021, שמטה שלה בסן פרנסיסקו. החברה נוסדה על-ידי קבוצה קטנה של חוקרים, רובם בכירים לשעבר ב-OpenAI, שעזבו ביחד בסוף 2020 כדי לבנות מעבדה ש“ מחזיקה את הבטיחות במרכז” - לא רק כסעיף במצגת אלא כעקרון שמעצב את המוצר עצמו.

שני המייסדים הבולטים הם דריו אמודיי(Dario Amodei), המנכ"ל, שהיה סגן נשיא המחקר ב-OpenAI; ואחותו דניאלה אמודיי(Daniela Amodei), הנשיאה, שהובילה ב-OpenAI את צוות הבטיחות וההפעלה. סביבם נאספו תום בראון (המחבר הראשי של המאמר על GPT-3), כריס אולה (חוקר מוביל בפרשנות מודלים), ג'ק קלארק, סם מקקנדליש, ועוד.

אנתרופיק רשומה כ-Public Benefit Corporation - תאגיד לתועלת הציבור. זה מבנה משפטי אמריקאי שמחייב את החברה לשקול לא רק רווח אלא גם השפעה ציבורית בהחלטות הניהוליות. מבחינה מעשית: הצהרת כוונות עם משקל משפטי, לא רק שיווקי.

החזון: בטיחות לפני יכולת

המוטיב שחוזר בכל מסמך פנימי וחיצוני של אנתרופיק הוא safety-first. לא בטיחות אחרי שהמודל מוכן, אלא בטיחות כקריטריון שמלווה את המחקר מתחילתו. הטענה: עד שלא נדע להתאים מודלים גדולים לערכים אנושיים בצורה אמינה, אסור לפרסם אותם בקנה מידה רחב.

החזון הזה הוא הסיבה שאמודיי ועמיתיו עזבו את OpenAI. הם חשבו שבחברה שגדלה במהירות, עם לחץ עצום להוציא מוצרים, הבטיחות תידחק לטובת התחרות. ב-2020 הם החליטו שעדיף להתחיל מחדש - חברה קטנה, מבנה משפטי שיכריח שיקולים ציבוריים, צוות שמורכב סביב חוקרי בטיחות, ומוצר שבא מאוחר אחרי המחקר.

שורש העניין

לא כל מי שמדבר על בטיחות עוסק באותו דבר. אנתרופיק מתמקדת בעיקר בשני זרמים: alignment - איך לגרום למודל לעשות את מה שהמשתמש באמת רוצה, ולא רק את מה שכתוב; ו-interpretability - איך להבין מה קורה בתוך המודל, כדי לזהות התנהגות בעייתית לפני שהיא יוצאת החוצה.

Constitutional AI - הרעיון המכונן

ב-2022 פרסמה אנתרופיק מאמר שהציג שיטה חדשה לאימון מודלים - שיטה שהפכה לחתימה של החברה: Constitutional AI, או בעברית, “בינה מלאכותית חוקתית”. הרעיון פשוט יחסית: במקום לסמוך אך ורק על משוב אנושי לכל החלטה (גישה יקרה, איטית, ומלאת הטיות) - לכתוב למודל מערכת עקרונות, ולתת לו לכייל את עצמו לפיהם.

ה“חוקה” של קלוד היא רשימה של עקרונות שהמודל אמור לכבד: להיות כן, להימנע מנזק, לכבד אוטונומיה של המשתמש, לא לסייע בפעולות לא חוקיות, וכן הלאה. במהלך האימון, המודל בודק את התשובות שלו עצמו מול העקרונות האלה ומשפר אותן. התוצאה: מודל שמסביר את ההחלטות שלו בלשון של ערכים, לא רק של חוקים.

בפועל, זו אחת הסיבות שקלוד נשמע אחרת ממודלים אחרים. הוא נוטה להסביר למה הוא לא יענה על משהו, להציע חלופות, ולקבל אחריות על שיפוט - במקום פשוט לחסום בקיר “אסור”. זה לא תמיד נוח למשתמש שרוצה תשובה מהירה, אבל זו בחירה ערכית של החברה, לא באג.

היסטוריה קצרה - איך הגענו לקלוד 4.7

מאז היווסדה, אנתרופיק הוציאה דורות עוקבים של מודלי קלוד. כל דור שיפר את היכולות, אבל גם עידן את שיטות הבטיחות - לעיתים על חשבון גמישות שמשתמשים ותיקים התרגלו אליה.

  • קלוד 1 (מרץ 2023) - השקה ראשונה, גישה מוגבלת.
  • קלוד 2 (יולי 2023) - חלון הקשר של 100K טוקנים, קפיצת מדרגה משמעותית.
  • קלוד 3 (מרץ 2024) - הצגת שלושת המודלים: Opus, Sonnet, ו-Haiku. שלושה גדלים, שלוש נקודות איזון בין יכולת ועלות.
  • קלוד 3.5 Sonnet (יוני 2024) - שיפור מהותי ביכולות קוד, הפך לברירת המחדל של רוב המפתחים.
  • קלוד 4 ו-4.5 (2025) - דור חדש עם שיפורים בהסקה, בכתיבה, ובשימוש בכלים.
  • קלוד 4.7 Opus (2026) - הדור הנוכחי. חלון הקשר של מיליון טוקנים, יכולות סוכן משופרות, מצב חשיבה ארוך לבעיות קשות.

המימון והסדר הגודל

אנתרופיק היא חברה פרטית, אבל גייסה סכומים שלא נראו במחקר AI לפניה. שני המשקיעים הבולטים הם גוגל (השקעה משולבת של מספר מיליארדי דולרים החל מ-2022) ו-אמזון (התחייבות של עד 8 מיליארד דולר עד 2026, חלק ממנה בתמורה לשימוש מועדף בשרתי AWS). בנוסף מצטרפות קרנות סיכון מובילות - Spark Capital, Lightspeed, ועוד.

המספרים האלה לא רק מרשימים - הם חיוניים. אימון מודל בקנה מידה של קלוד עולה מאות מיליוני דולרים בחומרה ובחשמל לפני שהציבור רואה שורה אחת של פלט. בלי מימון בקנה המידה הזה, מעבדה עצמאית של מאות אנשים פשוט לא יכולה להתחרות מול ענקיות שיש להן מודלי שפה משלהן.

המתח המובנה

יש מתח לא קטן בין “safety-first” לבין הצורך לגייס מיליארדים. משקיע שמשקיע 4 מיליארד דולר רוצה לראות תשואה. כדי לקיים את המתח הזה, אנתרופיק אימצה מבנים פנימיים שמטרתם להפחית את הסיכון: ועדה אתית עצמאית, מנגנון להאטה במקרה של זיהוי סיכון, והתחייבויות פרסום מחקר פתוח על נושאי בטיחות.

למה זה חשוב למה שקלוד אומר

כל זה לא תיאוריה. הזהות המוסדית של אנתרופיק - safety-first, Constitutional AI, מבנה Public Benefit - משפיעה ישירות על מה שקלוד יסכים או לא יסכים לעשות. ועל הטון. ועל מה שיציע מיוזמתו.

שלוש דוגמאות מוחשיות: ראשית, קלוד מסרב לעיתים לבקשות שמודלים אחרים יענו עליהן - לא בגלל חוסר יכולת, אלא בגלל ניתוח של הסיכון. שנית, כשהוא מסכים, הוא לרוב מוסיף הקשר, אזהרה, או הצעה לדרך פעולה אחרת. שלישית, הוא לרוב יודה באי-וודאות יותר ממודלים אחרים, ויאמר “לא יודע” במקום לנחש בביטחון.

אלה לא באגים - אלה תוצאות של החלטות אימון. אם תבינו שזה התכנון, לא תנסו להתעקש על תשובות שקלוד לא מוכן לתת, ותדעו לכוון את הבקשה כך שתתאים יותר לדרך שבה המודל אומן לחשוב.

המסקנה

אנתרופיק היא אחת משתיים או שלוש מעבדות שמרכזות כיום את החזית של מחקר ה-AI הכללי. ההבדל המרכזי בינה לבין המתחרות הוא לא ביכולת הטכנולוגית - אלא בערכים שמכוונים את ההחלטות הקטנות שמצטברות לאיך שהמוצר מתנהג. בטיחות לפני יכולת, פרשנות לפני אמינות, וכבוד לאוטונומיה של המשתמש לפני סגירה ב“לא אעזור” פשוט.

לא צריך להאמין לכל הצהרה של חברה כדי להעריך את ההשפעה של הצהרות אלה. כשתפתחו את השיחה הבאה עם קלוד, זכרו: התשובה שתקבלו היא תוצאה של עשרות החלטות עיצוב שנעשו לפניכם - על מה לסרב, איך להסביר, מתי להודות בחוסר ידע, ומתי לקחת אחריות. זה לא מודל ניטרלי. זה מודל עם חזון, ולא משנה מה דעתכם על החזון, שווה לדעת מה הוא.