טמפרטורה ופרמטרים
הרבה אנשים מכוונים לפי תחושה. כדאי להבין מה הם עושים.
פרמטרי ליבה
מזהה המודל שיענה. דוגמה: claude-opus-4-5 או claude-sonnet-4-5. שדה חובה - אין ברירת-מחדל.
המספר המרבי של טוקנים בתשובה. שדה חובה. מומלץ 1024 לתשובה קצרה, 4096 לארוכה. זו תקרה ולא יעד - המודל עשוי לסיים מוקדם יותר.
רשימת ההודעות בשיחה, לסירוגין user ו-assistant. ההודעה האחרונה חייבת להיות user. שדה חובה.
הוראות יציבות שמלוות את כל הפנייה - זהות, טון, הקשר קבוע. נמסר כשדה נפרד, לא בתוך messages.
פרמטרי דגימה
ערך בין 0 ל-1. נמוך = תשובות צפויות ועקביות. גבוה = יצירתי ומגוון. ברירת-מחדל 1. למשימות סיווג מומלץ 0.
מסנן את הטוקנים האפשריים לקבוצה שהסתברותם המצטברת מגיעה ל-p. דרך חלופית לשליטה ביצירתיות. ברירת-מחדל 1. אל תשנו גם את זה וגם את הטמפרטורה.
מצמצם את הטוקנים האפשריים ל-K המובילים. כלי דגימה נוסף - לרוב לא נדרש לכוונן. ברירת-מחדל ללא הגבלה.
רשימת מחרוזות. כשהמודל מייצר אחת מהן הוא עוצר מיד. שימושי לפלט מובנה - למשל לעצור בסיום בלוק JSON.
צורת התשובה
true = מקבלים את הפלט טוקן-אחר-טוקן בזמן אמת. false = מקבלים את התשובה בסיום. ברירת-מחדל false.
auto = המודל מחליט. any = חובה להשתמש בכלי כלשהו. tool = חובה להשתמש בכלי הספציפי הזה. none = אסור להשתמש בכלים.
רשימת פונקציות שהמודל יכול לקרוא להן. כל כלי כולל שם, תיאור, ו-schema של הפרמטרים שלו.
מבנה את הפלט - לרוב אובייקט JSON עם schema. שימושי לפלט מובנה צפוי, אבל עולה ב-latency.
מטא ובקרה
מחרוזת לזיהוי המשתמש מאחורי הקריאה. שימושי לחיוב, ניתוח וזיהוי דפוסי שימוש לרעה.
תאריך גרסה בכותרת ה-HTTP. נעולה לגרסה כדי לא להישבר כשה-API מתפתח. מומלץ לנעול ולא לעקוב אחרי 'latest'.
כותרת HTTP להפעלת יכולות שעדיין לא יציבות - prompt caching, batch API, ועוד. שמות הפיצ'רים מופרדים בפסיק.
מסמן חלקים בפרומפט לשמירה במטמון. עלות נמוכה משמעותית בפניות חוזרות. דורש anthropic-beta מתאים.
ערכים מומלצים לפי משימה
כשרוצים פלט יציב וצפוי - סיווג, חילוץ ישויות, JSON מובנה. אפסו את הטמפרטורה. top_p נשאר 1.
סיפור, מטאפורות, רעיונות. השאירו על 1. אם התשובות חוזרות על עצמן, נסו לגוון את הפרומפט.
טווח האמצע - שילוב סביר של עקביות וגיוון. ברירת-המחדל של רוב היישומים.
כתיבת קוד צריכה להיות צפויה. נמוך מ-0.7, אך לא אפס מוחלט - קצת גמישות בדרך הפתרון עוזרת.
מכאן ממשיכים
עוד יסודות לבניית אפליקציות עם ה-API