מאמר

מודלי תמחור - איך קלוד גובה כסף

per-token, מנויים, ו-rate tiers. להבין את המנגנון, לא לעקוב אחרי המספרים.

שני עולמות נפרדים

לקלוד יש שני מודלי תמחור נפרדים, ורוב הבלבול נוצר כשמערבבים בין השניים. צד אחד הוא claude.ai - האתר שאליו נכנסים בדפדפן, עם מנויים חודשיים בסכום קבוע. צד שני הוא ה-API של אנתרופיק - שאליו ניגשים מקוד, ומשלמים לפי כמות הטוקנים שעוברת.

שני המודלים מכוונים לקהלים שונים. המנוי החודשי מתאים למשתמש הקצה - סטודנט, כותב, יועץ. ה-API מתאים למפתח שבונה אפליקציה - כי הוא לא יודע מראש כמה הוא צורך ביום, אבל יודע לחשב את העלות לכל פנייה. המאמר הזה יסביר את שניהם, ויעזור לכם לבחור.

המנויים: שלוש דרגות

מי שמשתמש ב-claude.ai מהדפדפן בוחר באחת משלוש דרגות. המספרים המדויקים משתנים מדי פעם, אבל המבנה יציב:

  • Free - חינם, אבל עם תקרות שימוש יומיות צרות. סבבה לטעימה ראשונה, לא ליום-יום.
  • Pro - מנוי חודשי בסביבות 20 דולר. תקרות שימוש גבוהות בהרבה, גישה למודלים החזקים, ויכולות נוספות כמו Projects ו-Artifacts מורחבים.
  • Max - מנוי בסביבות 100 או 200 דולר לחודש, בכמה רמות. מיועד למשתמש כבד - תקרות גבוהות פי כמה, גישה מורחבת למודלים מתקדמים ולחלון הקשר ארוך.
לא לעקוב אחרי המספרים

הסכומים והתקרות משתנים. במקום לזכור מספר ספציפי, תזכרו את ההיגיון: Free לטעימה, Pro לשימוש קבוע אישי, Max למי שמרגיש את התקרות של Pro. ההמלצה הפרקטית: כמעט כל מי שנכנס פעם ביום לקלוד יחזיר את עלות Pro מהר.

ה-API: תשלום לפי טוקנים

ב-API משלמים אחרת לגמרי. כל פנייה נמדדת בטוקנים - גם הקלט שאתם שולחים, וגם הפלט שחוזר. מכפילים בתעריף של המודל הספציפי, וזו העלות. אין מנוי קבוע - אם לא תקראו ל-API, לא תשלמו.

התעריפים שונים בין מודלים. Haiku הוא הזול ביותר ומיועד למשימות קלות בנפח גבוה. Sonnet נמצא באמצע - בלעדיו רוב האפליקציות לא היו עולות לאוויר. Opus הוא היקר ביותר אבל גם החכם, מתאים למשימות שדורשות הסקה מורכבת.

בנוסף, קיים הבדל בין מחיר הקלט למחיר הפלט - הפלט בדרך כלל יקר פי כמה. הסיבה: ייצור הפלט דורש חישוב חי, בעוד קריאת הקלט היא פעולה זולה יותר. בגלל זה פרומפט ארוך + תשובה קצרה הוא כמעט תמיד עסקה טובה יותר מפרומפט קצר + תשובה ארוכה.

דרגות שימוש (Rate Tiers)

לא רק המחיר משתנה - גם הקצב. אנתרופיק מחלקת את משתמשי ה-API לדרגות, בהתאם לכמה הוצאתם בעבר. דרגה גבוהה יותר = יותר בקשות בדקה, יותר טוקנים ביום, פחות חסימות. רוב המפתחים מתחילים בדרגה 1 ועולים אוטומטית ככל שהם משלמים.

בעיה נפוצה: סטארטאפ שמשיק מוצר ומגלה שהוא חסום על-ידי הקצב, לא על-ידי המחיר. הפתרון: לבקש העלאת דרגה מראש, או לפזר את העומס על פני זמן. הדרגות לא מסתירות מידע - הן רשומות בתיעוד של אנתרופיק.

חיסכון שמרבית האנשים מפספסים

שלושה כלים יכולים להוריד את חשבון ה-API בעשרות אחוזים, ורבים לא מפעילים אותם:

1. Prompt Caching. אם אתם שולחים את אותו הקשר בכל פנייה - מסמך, טבלה, system prompt ארוך - אפשר לסמן אותו ל-caching. קלוד שומר את ההקשר במטמון, ובפניות הבאות העלות שלו נחתכת ב-90%. שווה משמעותית למי שבונה אפליקציה.

2. Batch API.אם המשימה לא דחופה - סיכום של 10,000 מסמכים, מיון, תיוג - אפשר להגיש את הכל ביחד ולקבל תשובה תוך 24 שעות. המחיר נחתך בחצי. שווה לעיבוד מרוכז, לא לצ'אט חי.

3. בחירת מודל מודעת.אנשים נוטים לבחור את המודל הכי חזק “ליתר ביטחון”, ומשלמים פי 5-10 על משימות שהיו עוברות בקלות אצל Haiku. מבחן פשוט: התחילו ב-Haiku, ועברו ל-Sonnet רק אם איכות התשובות יורדת. כסף שנשאר בכיס.

איך מעריכים עלות מראש

לפני שמשיקים תכונה חדשה, רוב המפתחים רוצים לדעת כמה זה יעלה. החישוב המעשי בנוי משלושה מספרים: טוקנים לפניה, פניות ביום, ו-תעריף המודל. נכפילים ביחד = עלות יומית. נכפילים ב-30 = חודש.

דוגמה: צ'אטבוט עם פרומפט מערכת של 2,000 טוקנים, שאלה ממוצעת של 200, ותשובה של 600. סך הכל לפנייה: 2,800 טוקנים. במחיר Sonnet של 3 דולר לכל מיליון טוקני קלט ו-15 דולר לפלט - העלות לפנייה היא בערך 0.016 דולר. 1,000 משתמשים שמתשאלים 5 פעמים ביום = 80 דולר ביום, כ-2,400 דולר בחודש.

השוו שלושה מחירים

אל תחליטו לפי המחיר לכל מיליון בלבד. שאלו את עצמכם מה הוא בלי caching, מה הוא עם caching, ומה הוא ב-Batch. שלושת המספרים האלה משנים את הכיוון של הפרויקט יותר מאשר ההפרש בין Sonnet ל-Opus.

מתי לבחור מה

אם אתם משתמשי קצה - תשתמשו במנוי. גם אם אתם כותבים הרבה. לא שווה את הזמן שתשקיעו בחישוב טוקנים לכל שיחה. Pro או Max בהתאם לעומס.

אם אתם מפתחים שבונים אפליקציה - תשתמשו ב-API. לא רק בגלל גמישות הטוקנים, אלא בגלל שיש שם כלים שהמנוי לא חושף: tool use, structured output, caching, batch.

ויש מצב ביניים: מפתחים שעובדים גם ב-claude.ai כצרכן ו-גם בונים אפליקציה. עבורם, שני החיובים נפרדים. המנוי לא נותן זיכוי על ה-API ולהיפך. שתי מערכות חיוב, שתי דרכי תשלום, שני לוחות בקרה.

המסקנה

התמחור של קלוד לא מסובך, אבל הוא דורש לזכור שיש כאן שני עולמות שונים עם היגיון שונה. המנוי מתמחר זמן-משתמש; ה-API מתמחר טוקנים. אם תתחילו עם הקצוות - שאלה אחת ביום או חמישים אלף ביום - מהר מאוד תבינו לאיזה צד אתם שייכים.

והכי חשוב: אל תיכנסו לפאניקה מהמחיר לפני שאתם בודקים את שלוש דרכי החיסכון - caching, batch, ובחירת מודל נכונה. הן לעיתים קרובות מורידים חשבון ה-API לחצי, בלי לפגוע באיכות התוצאה.