Agents - קלוד שפועל לבד
מה זה סוכן, איפה הוא טוב, ואיפה הוא מסוכן.
מה זה סוכן
בלשון פשוטה: סוכן הוא לולאה שבה המודל מקבל מטרה, בוחר פעולה, מבצע אותה, רואה את התוצאה, ומחליט מה הצעד הבא. בלי שאתם מעורבים בכל החלטה.
ההבדל מ-tool use רגיל הוא בעצמאות. ב-tool use, הקוד שלכם שולט - שולחים בקשה, מקבלים תשובה, ואם המודל ביקש כלי, אתם מבצעים. בסוכן, הלולאה חוזרת על עצמה - המודל יכול לקרוא ל-10 כלים ברצף כדי להגיע למטרה הסופית.
איפה זה טוב
סוכנים מצוינים במשימות שעונות על שני קריטריונים: מטרה ברורה ו-צעדים לא ידועים מראש. אם אתם יודעים בדיוק מה הצעדים - כתבו סקריפט. אם אתם יודעים את התוצאה אבל לא את הדרך - סוכן עוזר.
שלוש דוגמאות שעובדות:
- חקירה.“מצא את הבאג שגורם ל-X בבסיס הקוד הזה” - המודל יצטרך לקרוא קבצים, להריץ פקודות, להתנסות.
- עיבוד נתונים מסובך.“ייבא 50 קבצי CSV, ייצב מבנים, ופלוט קובץ אחיד” - הסוכן יתאים את עצמו לוואריאציות.
- אינטגרציה בין מערכות.“קח את ההזמנות שאמורות להישלח, צור חשבוניות במערכת X, ועדכן את הסטטוס בטבלה Y” - תהליך עם החלטות בכל צעד.
איפה זה מסוכן
סוכנים גם יוצרים סיכונים שלא קיימים ב-tool use רגיל. הסיכון המרכזי: אובדן שליטה. הסוכן יכול לקרוא ל-20 כלים תוך שלוש דקות. אם לא תכננתם נכון, אתם משלמים, או יוצרים נזק.
- עלות יוצאת משליטה. סוכן שטעה ונכנס ללולאה אינסופית = מאות דולרים בדקות.
- פעולות לא הפיכות. מחיקת קבצים, שליחת מיילים, מחיקת רשומות - אסור לתת לסוכן לעשות בלי אישור.
- פרשנות שגויה.“תסדר את מסד הנתונים” - המודל יכול לבחור גישה דרסטית. הקשר ברור חיוני.
1. תקרת קריאות לסוכן יחיד (לרוב 20-50). 2. תקרת עלות יומית, גלובלית. 3. שום פעולה הרסנית בלי אישור אנושי - לעולם.
איך מתכננים סוכן
סוכן טוב מתחיל לא בקוד, אלא בעיצוב. ארבעה שלבים:
1. מטרה צרה.“עזור עם הקוד” - רחב מדי. “מצא את הבאג ב-PaymentService שגורם ל-500” - ברור.
2. כלים מינימליים. תנו לסוכן רק את הכלים שהוא צריך. עוד כלי = יותר טעויות. תתחילו במינימום.
3. תנאי עצירה.מתי הסוכן יודע שסיים? “כשהבדיקות עוברות”, “כשמצאתם 3 סיבות אפשריות” - תנו תנאי ברור.
4. סקירה אנושית.בנקודות מפתח, הסוכן צריך לעצור ולשאול: “אני עומד למחוק 5 רשומות. מאשר?”
דפוסי סוכן נפוצים
כמה דפוסים שמופיעים שוב ושוב:
- ReAct (Reason + Act). המודל מנמק - פועל - רואה תוצאה - מנמק - פועל. ברירת המחדל ברוב המקרים.
- Planner + Executor. שלב ראשון: לבנות תכנית. שלב שני: לבצע את התכנית. מתאים למשימות מורכבות עם תלויות.
- Critic loop. כל פלט נשלח לסוכן שני לבדיקה. עלות גבוהה אבל איכות גבוהה.
- Multi-agent. כמה סוכנים שמתמחים בתחומים שונים, עובדים במקביל או בסדר. מתאים לפרויקטים גדולים.
סוכנים ב-Claude Code
Claude Code הוא דוגמה מובחנת של סוכן. הוא מקבל מטרה, יש לו כלים (קריאה, עריכה, Bash), והוא עובד צעד אחר צעד. הוא גם מאפשר להפעיל סוכני משנה - לעבודה ארוכה שלא צריכה את ההקשר הראשי.
המודל הזה - host + subagents - הוא דוגמה לאיך לארגן עבודה. הסוכן הראשי לא יודע את כל הפרטים, אבל יודע למי לשלוח כל משימה.
איך לדעת אם הסוכן עובד
לפני שמעלים סוכן לייצור, צריך לאמת. שלושה שלבים:
- מטריצת מקרי בוחן. 20-50 דוגמאות מתויגות - קלט ופלט צפוי. הריצו, בדקו אחוז הצלחה.
- לוג של החלטות. אילו כלים נקראו? אילו החלטות התקבלו? בלי לוג, אי אפשר לדבג.
- סקירה ידנית של מקרי קצה. 10 ריצות אקראיות, קראו כל אחת במלואה. תמצאו דברים שהמטריקות החמיצו.
המסקנה
סוכנים הם הצעד הבא של עבודה עם LLM. הם מאפשרים אוטומציה של משימות שלא היו אפשריות עד עכשיו, אבל הם דורשים תכנון. סוכן רע הוא יקר ולעיתים מסוכן. סוכן טוב הוא שותף שעובד בזמן שאתם ישנים.
ההמלצה למפתחים שמתחילים: התחילו קטן. סוכן ראשון - מטרה אחת, 3 כלים, תקרת 10 קריאות. אחרי שהוא עובד בצורה אמינה לחודש, תוכלו להרחיב. ה-shortcut של “נבנה סוכן כללי שיעשה הכל” מסתיים בקבר של פרויקטים נטושים.
להמשיך לבנות
עוד נושאים שמשתלבים בעיצוב סוכנים