פורטפוליו שלושה ספקים, מיפוי ניתוב לכל סקיל וסוכן, מודל עלות בסקייל, ומוצרים חדשים ללקוח
מחירים ומוצרים מאומתים 17.5.2026הבסיס הוא הקובץ inbal-main/outputs/dolev-operations-cost-mapping.html, נוצר ב-6.5.2026 לקראת פגישת בוקר עם דולב. זה אומדן ולא חשבוניות, עם הסתייגות מפורשת לעדכן מול חשבוניות אמיתיות לפני החלטות. הממוצע החודשי שנכתב שם הוא כ-120 עד 200 דולר, 8 שירותי SaaS, וכ-30 עד 50 דולר חיסכון פוטנציאלי.
המסמך הנוכחי הוא היורש שלו לעידן הסקייל. הוא מתקן את מחירי הטוקנים שבמסמך 6.5 שכבר אינם תקפים, מרחיב משלוש שכבות AI לפורטפוליו שלושה ספקים, ומוסיף את הנחת היסוד החדשה, כניסת הרבה לקוחות חדשים שעוברים את כל מסלול 8 השכבות עם הרבה תוכן טקסטואלי וויזואלי לכל אחד.
Anthropic, קלוד
| פריט | מחיר | הערה |
|---|---|---|
| מודלים נוכחיים | Opus 4.6 ו-4.7, Sonnet 4.6, Haiku 4.5 | נכון למאי 2026 |
| API Opus | $5 / $25 למיליון | ירד מ-$15 / $75, כ-67% הוזלה |
| API Sonnet | $3 / $15 למיליון | קלט פלט |
| API Haiku | כ-$1 / $5 למיליון | הזול במשפחה |
| Pro | $20/חודש, $17 שנתי | Projects, Code מוגבל |
| Max 5x | $100/חודש | פי 5 מ-Pro, Code כבד |
| Max 20x | $200/חודש | פי 20 מ-Pro, סוכנים מקבילים |
| Team Standard | $20/מושב שנתי, $25 חודשי | ניהול מרכזי, ללא אימון על דאטה |
| Team Premium | $100/מושב שנתי, $125 חודשי | תקרות גבוהות |
| Batch API | 50% הנחה | תוצאות עד 24 שעות |
| Prompt caching | 90% הנחה על cache | Batch plus cache עד 95% על עומסים מתאימים |
OpenAI
| פריט | מחיר | הערה |
|---|---|---|
| מודלים נוכחיים | GPT-5.3 חינם, סדרת GPT-5.4, GPT-5 Pro | נכון למאי 2026 |
| Free | $0 | מוגבל |
| Go | $8/חודש | ללא reasoning מתקדם, ללא Sora, ללא Deep Research |
| Plus | $20/חודש | סדרת GPT-5.4, מולטימודל |
| Pro | $200/חודש | בלתי מוגבל, GPT-5 Pro, extended thinking |
| Business | $25/משתמש/חודש | workspace, אדמין |
| Enterprise | מותאם | מול מכירות |
| API | לפי טוקן | Sora ו-gpt-image דרך API, Codex תמחור נפרד, Batch 50% |
Google, מערכת Gemini
| פריט | מחיר | הערה |
|---|---|---|
| מודלים נוכחיים | Gemini 3.1 Pro, 3 Pro, 2.5 Flash, 2.5 Deep Think | נכון למאי 2026 |
| Free | $0 | 2.5 Flash, 2.5 Pro מוגבל, Deep Research, 100 קרדיט וידאו |
| Google AI Plus | $7.99/חודש | חלון 128K, NotebookLM מורחב, 200 קרדיט |
| Google AI Pro | $19.99/חודש | 2.5 Pro, Deep Research, Veo 3.1, 1000 קרדיט, Gemini 3, CLI מורחב |
| Google AI Ultra | $249.99/חודש | Gemini 3.1 Pro, 2.5 Deep Think, Veo 3.1, 25000 קרדיט |
| API Gemini 3 Pro | $2 / $12 למיליון | קלט פלט |
| API Gemini 2.5 Pro | $1.25 / $10 עד 200K, $2.50 / $15 מעל | תלוי אורך הקשר |
| Imagen 4 | $0.02 עד $0.06 לתמונה | Fast, Standard, Ultra |
| Veo 3.1 | $0.05 עד $0.60 לשנייה | תלוי רזולוציה |
מקורות אימות: claude.com/pricing, openai.com/api/pricing ו-chatgpt.com/pricing, ai.google.dev/gemini-api/docs/pricing ו-gemini.google/subscriptions, plus סקירות תמחור 2026. כולם נבדקו ב-17.5.2026.
יחידת עלות ללקוח מלא plus עשרה תכנים, מחירים מאומתים, לפני Batch ו-caching
| רכיב | עלות | תדירות |
|---|---|---|
| סריקת דומיינים, 6 ישויות | $3 עד $9 | פעם אחת ללקוח, מנוע הסריקה |
| מותג, אסטרטגיה, תבניות | $1 עד $3 | פעם אחת, רינדור חוזר $0 |
| 10 מאמרים, אופוס כעורך | $1 עד $4 | לפי לוח התוכן |
| 10 תמונות Imagen 4 | $0.20 עד $0.60 | לפי לוח התוכן |
| וידאו 30 שניות Veo 3.1 | $1.50 עד $18 | תלוי רזולוציה, אם מופק |
| מחקר Deep Research | כלול ב-AI Pro | מול Perplexity לפי שימוש |
| סהכ ללקוח לפני אופטימיזציה | כ-$8 עד $35 | עם Batch plus caching, ירידה 50 עד 95% על החלקים המתאימים |
הקרנה, מסומנת כהנחה ולא נתוני חיוב: 30 לקוחות לרבעון, כ-$240 עד $1000 משתנה לפני אופטימיזציה, כ-$120 עד $400 אחרי Batch ו-caching ו-Imagen במקום שרשרת Fal. בסקייל הקבועים זניחים מול העלות המשתנה ללקוח.
| ספק ותוכנית | עלות | יתרון | חיסרון | וקטור |
|---|---|---|---|---|
| Anthropic API | לפי טוקן | אופוס $5/$25, Batch, caching | לא צפוי בסקייל | סקייל, איכות |
| Claude Max 5x | $100 | Code כבד, תקרה צפויה | יקר אם שימוש נמוך | סקייל |
| Claude Max 20x | $200 | סוכנים מקבילים אגרסיביים | יקר מאוד אם לא מנוצל | סקייל |
| Claude Team Standard | $20/מושב | ניהול מרכזי, ללא אימון | מינימום מושבים | דיוק |
| OpenAI Go | $8 | זול לגישה בסיסית | ללא Sora, ללא reasoning מתקדם | עלות |
| OpenAI Plus | $20 | סדרת GPT-5.4 מולטימודל | תקרות לסקייל מסחרי | איכות |
| OpenAI Pro | $200 | GPT-5 Pro דיוק מרבי | יקר, יחיד לא צוותי | דיוק, מוצר חדש |
| OpenAI API | לפי טוקן | Sora וידאו, gpt-image טקסט | o-series יקר | מוצר חדש, דיוק |
| Google free | $0 | Flash, Deep Research | חסימת RPM בשימוש מסחרי | סקייל |
| Google AI Pro | $19.99 | Veo 3.1, Deep Research, NotebookLM, Gemini 3 | אוריינטציה צרכנית | סקייל, מוצר חדש, איכות |
| Google AI Ultra | $249.99 | Veo 3.1, Deep Think, 25K קרדיט | יקר | מוצר חדש |
| Google API | לפי טוקן | Flash הזול, Imagen 4, Veo 3.1 | ניהול מכסה | סקייל |
Google הוא סוס הנפח. AI Pro ב-$19.99 פותח Veo, Deep Research, NotebookLM, Gemini 3 בעלות אחת קבועה. Flash ו-Imagen 4 ב-API לטקסט ותמונה בנפח. Claude הוא ליבת הדיוק והתזמור, אופוס 4.6 ו-4.7 לאסטרטגיה plus Claude Code, עם Batch 50% ו-caching 90% אגרסיביים. OpenAI נקודתי ליכולת עליונה, Sora אם איכות הוידאו עולה על Veo, gpt-image לטקסט עברי בתוך תמונה, GPT-5 Pro לדיוק רגולטורי בשכבת פרמיום. Batch בשלושת הספקים לכל ייצור שאינו בזמן אמת.
| סקיל או סוכן | כלי נוכחי | ניתוב מומלץ מאומת | וקטור |
|---|---|---|---|
| domain-intel סינתזה | Perplexity | Gemini Deep Research, כלול ב-AI Pro | סקייל, מנוף 1 |
| Layer 3 תמונות | Recraft, Ideogram, Fal | Imagen 4 ראשי $0.02 עד $0.06, gpt-image לטקסט עברי בתמונה | איכות, עלות |
| Layer 5 אסטרטגיה | Claude אופוס | premium אופוס 4.7, lite Gemini 3 | דיוק |
| article-engine טיוטה | Content Writer אופוס | Gemini Flash או Groq, אופוס כעורך, Batch לילי 50% | סקייל, מנוף 2 |
| marcom visual | שרשרת fallback | Imagen 4 ראשי, חיתוך השרשרת ל-2 | עלות |
| Video Producer ו-Editor | Remotion plus דפדפן | Veo 3.1 כלול ב-AI Pro, Sora להשוואת איכות | מוצר חדש |
| תוכן רגולטורי amitai | Claude | GPT-5 Pro או אופוס 4.7 לדיוק | דיוק |
| layout QA | Gemini Vision חינמי | להשאיר plus להרחיב לעוד שלבי QA | עלות |
| Reference Analyzer | Gemini plus GPT-4o | Gemini Vision בלבד, להפיל GPT-4o | עלות |
| Gamma מצגות | Gamma API בתשלום | תקרה, או Slides plus Gemini 3 | סקייל |
| text-corrections | Haiku 4.5 | כבר אופטימלי, לתעד | עלות |
| gemini-review | Gemini Flash | כבר אופטימלי, להרחיב שימוש | עלות |
| תמלול video-captions | whisper מקומי | כבר אופטימלי $0, מקומי קודם | עלות |
| כל ייצור לא בזמן אמת | סינכרוני | Batch API 50% בשלושת הספקים | סקייל, מנוף 1 |
עוגן Google AI Pro $19.99. החלטת Claude Max מול API לפי חיוב Anthropic אמיתי 3 חודשים דורש אימות. ביקורת OpenAI plus הפלת GPT-4o מ-Reference Analyzer דורש אימות שימוש 90 יום. ביקורת Zapier מול n8n על Hetzner המשולם דורש אימות zaps.
Batch 50% בשלושת הספקים על ייצור שאינו בזמן אמת. Deep Research במקום Perplexity. Imagen 4 במקום שרשרת Fal. caching וסדר פרומפט יציב. מאגר מתחרים משותף לסקטור. ללא שינוי מנוי
cost-monitor עם עלות ללקוח לפי מחירי יחידה מאומתים, התרעת חריגה. הרצת skill-discovery לפני בנייה לפי כלל זיכרון.
קווי שירות וידאו, קריינות, מחקר עומק, ופרמיום רגולטורי לפי סעיף המוצרים החדשים.
6 סבבים, כולם 17.5.2026. קלוד, Gemini, GPT, תשובות, התכנסות מלאה, ותוכנית 14 יום להעמדת דרג 0. שלב ההמלצה סגור, הצעד הבא הוא החלטת יישום של ענבל ודולב.
שרשרת ה-fallback של התמונות, עד 6 קריאות בתשלום, היא פרצת העלות הדחופה ביותר. להחליף בנתב חכם מבוסס קוד שמנתב לפי סוג המשימה, ונופל ל-fallback רק על שגיאת מערכת 429 או 500, לא על תוצאה קריאטיבית לא מספקת. לפצל את Google לשתי שכבות, Flash לעיבוד מקדים, ניקוי, חילוץ, clustering, שזה 60 עד 75% מהקריאות, ו-Pro רק לסינתזה והקשר ארוך. להוריד ייצור המוני מאופוס, אופוס רק לאסטרטגיה, נעילת קול מותג, QA, וליטוש סופי. להפריד מודל יוצר ממודל שופט, רק האחוזון העליון ממשיך, חוסך בזבוז ניסיונות חוזרים. Batch לכל ייצור שאינו בזמן אמת, גם פותר מגבלות קצב בסקייל. מודל העלות חסר רכיבים, אחסון ו-Vector DB, תקורת תזמור 20 עד 40%, תיקון אנושי 15 עד 20% הרצות חוזרות, ונראות עלויות. תקרות עצירה קשיחות בשלושת חשבונות המפתחים plus התראות בחצי התקציב. וידאו AI כתוספת פרימיום בלבד, לא בסיס. דוח מחקר עומק להשאיר ולהדגיש, שולי רווח עצומים. טקסט עברי בתמונה ישירות ל-gpt-image.
בעיית הייצור ההמוני הזול: GPT מוסיף שכבת OSS, Llama 4, Qwen, DeepSeek דרך Groq או Fireworks, לפעולות חצי דטרמיניסטיות. Gemini במקום זה ממליץ דיסטילציה, לקחת 1000 מאמרי אופוס ולעשות fine-tuning למודל קטן וזול. הכרעה: בנפח הנוכחי ובצוות של שניים בלי DevOps, OSS דרך Groq זול ופשוט יותר מיידית, דיסטילציה רק מעל סף נפח גבוה. שער ניתוב: Gemini נקב בכלים, LiteLLM או Portkey. הכרעה: לאמץ את ההמלצה הזו, Portkey מנוהל עדיף בצוות בלי תשתית. מוצרים חדשים: GPT הוסיף שלושה מוצרי הכנסה דביקים שלא חשבנו עליהם, Competitive Drift Monitor, Brand Brain, ו-AI Content QA. הכרעה: לאמץ, זה הרחבת הכנסה אמיתית. מבנה תוכן רגולטורי: Gemini חידד נכון, הסתמכות בלעדית על LLM היא סיכון משפטי, לבנות כ-LLM plus קוד דטרמיניסטי plus חתימה אנושית.
| החלטה | קלוד, סבב 1 | Gemini, סבב 2 | GPT, סבב 3 | הכרעה ונימוק |
|---|---|---|---|---|
| חלוקת פורטפוליו | Google נפח, Claude דיוק, OpenAI נקודתי | נכון, 5/5 | נכון, 5/5 | מאושר, התכנסות מלאה |
| שכבת Google | Flash ו-Pro לפי משימה | לפצל Flash עיבוד מקדים, Pro סינתזה | אותו פיצול בדיוק | מאומץ, Flash הוא 60 עד 75% מהקריאות |
| שרשרת תמונות | חיתוך ל-2 | נתב חכם, fallback רק 429/500, 5/5 | confidence gating, נתב, 5/5 | שודרג, נתב מבוסס קוד, פרצת העלות הדחופה |
| ייצור טקסט המוני | Gemini Flash או Groq, אופוס עורך | Sonnet 4.6 plus caching | Flash או OSS, לא אופוס | מאושר, plus OSS מול דיסטילציה למחלוקת |
| מודל שופט נפרד | לא נכלל | נתב plus confidence gating | editor plus judge, רק top ממשיך | נוסף, ממליצים שניהם, מוריד בזבוז |
| תוכניות מנוי | עוגן Google AI Pro, Max לפי חיוב | Team Standard, הניח צוות | מטריצת תפקידים, הניח צוות | תוקן, ראו תיקון שני המשתמשים למטה |
| Batch ו-caching | 50 עד 95% לילי | 4.5/5, גם פותר rate limits | קריטי, plus אסינכרוני | מאושר, מנוף סקייל מספר 1 |
| קדם-עיבוד סריקה | לא הודגש | HTML ל-Markdown, חיתוך 70%, 4/5 | parsing overhead משמעותי | נוסף, פותר את מוקד העלות $3 עד $9 |
| וידאו AI | מוצר חדש מוביל | פרימיום בלבד, 4.5/5 | premium add-on, לא בסיס | תוקן, תוספת פרימיום עם תקרת שניות |
| מוצרים חדשים | 5 מוצרים | מאשר, מחדד רגולציה | plus Drift Monitor, Brand Brain, Content QA | הורחב, 3 מוצרים דביקים נוספו |
| סיכון ראשי | מכסות לא מוגבלות | Agent runaway, hard caps | נעילת workflow לספק | שניהם, hard caps עכשיו, abstraction layer |
גם Gemini וגם GPT הניחו צוות שלם והמליצו תוכניות מבוססות מושבים. Gemini, Claude Team Standard עדיף על Max. GPT, מטריצת תפקידים עם הכלל 20% מהצוות צורכים 80% מהטוקנים. שני אלה לא תקפים. המציאות, שני משתמשים בלבד, ענבל ודולב, שניהם כבדים מאוד, רוויי שימוש, אינטנסיביים ב-Claude Code. ההיגיון 20 מול 80 קורס, 100% מהמשתמשים הם החלק הכבד. הערך של Team Standard הוא ממשל וריבוי מושבים, מיותר לשניים, והתקרה הנמוכה למושב הופכת לחיסרון בשימוש כבד. מסקנה מתוקנת. שכבת המנויים האנושית, Google AI Pro לשניהם, כ-$40, Claude Max למשתמש כבד, כנראה Max 20x, לא Team Standard, לפי חיוב Anthropic אמיתי, OpenAI Plus לשניהם plus API, Pro רק אם עומס רגולציה או תמונה מצדיק. כל מפעל הייצור עובר API plus Batch תחת תקרות, שני האנשים הם שכבת אסטרטגיה ו-QA ואישור, לא קו הייצור. רצפה חודשית צפויה, כ-$40 Google plus כ-$40 OpenAI plus Claude Max כ-$200 עד $400, plus API ייצור מוגבל בתקרות.
Gemini. Max מול Team, המשוואה מתהפכת, לשני מפעילי ליבה Team Standard הוא צוואר בקבוק קטלני, שני Max 20x הם כלי עבודה הכרחי. דיסטילציה, חד משמעית לרדת מזה עכשיו, ROI חיובי רק ב-100 עד 250 אלף קריאות לחודש, ניתוב ל-Flash או Haiku plus caching נותן 95% מההוזלה ב-0% תחזוקה. Portkey חד משמעית מול LiteLLM, SaaS מוכן מהקופסה. חיתוך 70% מתייחס רק לעלות טוקנים מ-HTML מלוכלך, סקרייפר שמחזיר Markdown נקי, Jina או Firecrawl, plus Gemini Flash מוריד את השכבה לסנטים. רגולציה, אינכם human in the loop משפטי אלא צינור עריכה, האחריות תמיד שלכם אלא אם הוחרגה בחוזה, המוצר מחייב עורך דין בלולאה או מודל טיוטה שמעביר אחריות ללקוח.
GPT. לבחור דיסטילציה פרקטית בתוך מערכת מנוהלת, לא OSS, complexity הורג שולי רווח מהר יותר מתמחור טוקן. מטריצה לשניים, משתמש 1 אסטרטגיה ו-QA עם Claude Max, משתמש 2 ייצור עם Claude Pro או Team לא Max, Gemini Flash default ל-API. המוצר המנצח Brand Brain, דביק, נתפס אסטרטגי, MVP על NotebookLM plus Drive plus Claude Projects בלי DB. נראות מינימלית, OpenRouter plus Helicone plus n8n plus Airtable plus Sheets, 4 מדדים בלבד, עלות ללקוח, עלות ל-workflow, ניסיונות חוזרים, זמן תיקון אנושי. provenance, עדיין לא חובה משפטית מלאה 2026 אבל ציפיית enterprise גוברת, מינימום היום Airtable עם מודל, מקור, פרומפט, אישור.
אין OSS hosting ואין דיסטילציית ML אמיתית כעת. במקום, מודל פרימיום מייצר דוגמאות זהב plus ניתוב ייצור המוני ל-Gemini Flash או Haiku 4.5 plus prompt caching, כ-95% חיסכון ב-0 תחזוקה. שער מנוהל כ-SaaS, לא תשתית עצמית. Gemini Flash כמנוע הייצור הדיפולטיבי. נראות מינימלית עכשיו, 4 מדדים בלבד. תיקון מנוע הסריקה עם סקרייפר Markdown plus Flash, מוריד $3 עד $9 לסנטים. בלי מורכבות מוקדמת, בלי vector DB, בלי fine-tuning, בלי governance ארגוני. מוצר רגולטורי מחייב עורך דין אמיתי בלולאה או העברת אחריות חוזית.
האם משתמש 2 מקבל Claude Max. נסגר, שניהם Max. GPT תיקן את עצמו, אם שניהם רוויי Claude Code והקשר ארוך, Pro צוואר בקבוק, Max plus Max הוא ה-sweet spot. Gemini נתן כלל מספרי שמוביל לאותה תוצאה למשתמש כבד אמיתי, מעל 25 שאילתות הקשר כבד ביום Pro נחסם תוך שעתיים. כלי שער, נסגר, Portkey עם kill switch, env vars שמאפשרים חזרה ישירה לספק ב-30 שניות, הפרומפטים נשמרים אצלכם ולא בממשק Portkey. סדר עדיפויות, נסגר, אין סתירה, יציבות עלות ואז מוצר.
0. הבסיס שמחזיק את הכל, שכבת אמת קנונית ללקוח plus שער שופט אוטומטי. בלעדיו כל השאר קורס, ראו הכרטיס האדום למטה. 1. שער מנוהל Portkey עם kill switch plus תקרות עלות קשיחות בשלושת החשבונות plus סגירת שרשרת ה-fallback העיוורת, מיידי, כשעתיים. 2. תיקון מנוע סריקת הדומיינים, סקרייפר Markdown plus Gemini Flash, סוגר את חור התקציב. 3. שדרוג מנויים, Claude Max לשני המשתמשים plus Google AI Pro לשניהם, אפס קוד. 4. Brand Brain כמוצר ההכנסה הראשון plus נראות 4 מדדים, משתמש 2 הבעלים, לוגינג אוטומטי, ביקורת שבועית 30 דקות.
דרג A, נעול, שני המשתמשים Claude Max plus Google AI Pro כ-$40 plus OpenAI Plus כ-$40, רצפה כ-$480 לחודש לשכבה האנושית plus ייצור API תחת תקרות, ללא Ultra ללא Business ללא Team. כלל גארדריל, אם פילוח Anthropic יראה משתמש קל, מעל 25 שאילתות הקשר כבד ביום מצדיק Max, אחרת Pro. דרג B, נעול, לא OSS ולא דיסטילציית ML, דוגמאות זהב 3 עד 5 לסוג תוכן מופרדות מהנחיות המותג ומגורסות, plus ניתוב ל-Flash או Haiku plus caching, סריקה עם סקרייפר Markdown plus Flash. דרג C, נעול, Portkey עם kill switch, נראות 4 מדדים, משתמש 2 בעלים, רוב אוטומטי plus dropdown אחד לזמן תיקון אנושי, ביקורת שבועית. דרג D, סדר בנייה, Brand Brain ראשון על שכבת אמת קנונית, אחריו Drift Monitor ו-Content QA, רגולטורי עם עורך דין בלולאה, וידאו פרימיום בלבד. דרג 0 חדש וקודם לכל, שכבת אמת קנונית plus שער שופט אוטומטי.
GPT. תיקון, שני המשתמשים Claude Max, לא בגלל chat אלא Claude Code, throughput מתמשך, סשנים ארוכים, פרויקטים מקבילים, זמן operator הוא הנכס היקר, עלות הפרעה גבוהה ממחיר המנוי. Brand Brain נשבר לא לפי מספר לקוחות אלא לפי chaos של כפילויות וסחף אחזור, בערך 25 עד 60 לקוחות, שלב ביניים Airtable canonical לפני Vector DB. 4 המדדים, הבעלים משתמש 2, רוב אוטומטי, ידני רק dropdown לדקות תיקון, ביקורת שבועית 30 דקות לא יומית. הדבר היחיד שיהרוס הכל, היעדר שכבת אמת קנונית, AI מגביר כאוס במקום מינוף.
Gemini. כלל מספרי, פער Max מול Pro הוא $180, נקודת איזון 3.6 שעות אבודות בחודש, מעל 25 שאילתות הקשר כבד ביום, מעל 40 אלף טוקן לקריאה, Pro נחסם תוך שעתיים, אז Max. דוגמאות זהב 3 עד 5 לסוג, מופרדות מהנחיות המותג, מגורסות, סקריפט Flash זול מדרג ומחליף דוגמאות מתחת ל-8 בתוצרים מאושרים אחרונים. Portkey הסיכון הוא uptime לא מחיר, kill switch ב-2 משתני סביבה, חזרה ישירה לספק ב-30 שניות. הדבר היחיד שיהרוס הכל, שיתוק בקרת איכות אנושית, צוות של שניים יטבע בעריכה ידנית של מאות תוצרים.
נקודת הכשל היחידה של סטודיו בן שני אנשים אינה מודל, כלי, או מחיר. היא צוואר הבקבוק האנושי. GPT קורא לזה היעדר שכבת אמת קנונית, Gemini קורא לזה שיתוק בקרת איכות אנושית, זה אותו דבר משני צדדים. עם Batch וניתוב נכון שני אנשים יכולים לייצר מאות תוצרים בלילה בעלות דולרים, ואז למות מתחת לעומס הביקורת. הפתרון בשני חלקים. אחד, שכבת אמת קנונית לכל לקוח, מינימום Airtable, מיצוב מאושר, מסרים, כללי טון, טענות אסורות, הצעות נוכחיות, תקציר אסטרטגיה, ובעל מקור אמת. כל נכס פרומפט קמפיין וידאו מצגת מודעה מתחיל מאותו מקור. שתיים, שער שופט אוטומטי על Gemini Flash בעלות אפסית, כל תוצר נבדק מול צ'קליסט סקפטי, מילים עצלניות, עברית תקינה, הזיה, מתחת ל-90 נזרק לתיקון או נפסל ולא מגיע אליכם, אתם פותחים את הבוקר רק עם ה-10% הירוקים ומלטשים, לא מסננים זבל.
GPT, הממשל. בעלות, משתמש 1 בעל האמת האסטרטגית, סמכות עריכה, מאשר מיצוב מסרים טון היררכיית הצעות וטענות אסורות. משתמש 2 בעל היישום והאכיפה, מחבר workflows לשכבת האמת, מסמן drift, מפעיל QA. אסור שאותו אדם גם מגדיר אמת וגם מריץ נפח, תחת לחץ הייצור מנצח את הממשל. כלל אנטי-ריקבון, שכבת האמת מתעדכנת רק כתוצר לוואי של workflow קיים, 5 טריגרים חוקיים בלבד, אישור לקוח, תוצר אסטרטגיה, פיבוט קמפיין, שינוי הצעה, תיקון רגולציה. שופט, הסיכון האמיתי הוא עייפות פסילות שווא מצטברת שמובילה לעקיפת השופט, לכייל ב-sampling, שבוע ראשון 20 עד 30 תוצרים ידני בלבד, יעד פסילת שווא מתחת ל-15%, החמצה קטסטרופלית כמעט אפס, retry אוטומטי אחד בלבד.
Gemini, המנגנון. צ'קליסט שופט 8 בדיקות בינאריות לעברית, קלישאות AI, התאמת מין ומספר, עברית הפוכה במדיה, הזיית נתונים, חוקי מותג, מטא-טקסט של המודל, עיוותים ויזואליים, רציפות פריים. ספים, טקסט 7 מתוך 7 וקלישאות דקדוק והזיה תנאי קשיח, תמונה 4 מתוך 5 ועברית הפוכה תנאי קשיח, וידאו 5 מתוך 6 ורציפות פריים תנאי קשיח. הזרקת אמת ללא קוד, ארכיטקטורת caching היברידית, מגירה קבועה ל-DNA סוכנות plus DNA לקוח מסומנת ל-prompt caching ב-90% הנחה, מגירה דינמית לתדריך בתשלום מלא, שדה Airtable רזה עד 1000 מילים, ב-Batch משלמים על ה-DNA פעם אחת.
| יום | מה בונים |
|---|---|
| 1 | סכמת Airtable Clients Canonical Truth, מיצוב ICP טון טענות מאושרות אסורות היררכיית הצעות CTA מיסגור מתחרים כיוון ויזואלי תאריך אישור בעל אמת. פתיחת Portkey SaaS plus מפתחות Anthropic ו-Google. לקוח פיילוט. |
| 2 | הגדרת 5 הטריגרים החוקיים לעדכון אמת בלבד. |
| 3 | Portkey virtual URLs plus fallback בסיסי, שגיאת קלוד עוברת ל-Gemini 3 Pro. Prompt Loader חובה שמושך תמיד את הבלוקים הקנוניים, cache-control ephemeral על ה-System. |
| 4 | workflow תבנית אחד בלבד, Make או n8n, טריגר שורה חדשה, שליפת קנוני מ-Airtable, שליחה ל-Portkey עם cache header. |
| 5 | Judge v0 על Gemini 3 Flash, 8 בדיקות בינאריות, מחזיר JSON קשיח pass ו-reasons. |
| 6 | לוגיקת retry, כשלון חוזר למודל עם reasons השופט, סבב תיקון אחד בלבד. |
| 7 | אימות עלות ו-cache, 10 משימות פיילוט, לוודא Cache Hits גבוה ב-Portkey, ביקורת ראשונה לפסילות שווא ולסחף אמת. |
| 8 | תהליך Update Canonical, קלט תוצר מאושר, פלט diff מוצע. |
| 9 | תהליך אישור, משתמש 1 מאשר דוחה עורך, Airtable מתעדכן אוטומטית. |
| 10 | מטא-דאטה לכל נכס, מודל תאריך לקוח גרסת קנוני, גם משרת מינימום provenance. |
| 11 | דשבורד מינימלי, Google Sheet, 4 מדדים, ניסיונות חוזרים תוצרים דקות תיקון אנושי כשלי שופט. |
| 12 | QA מדיה ב-Vision, הרחבת השופט לתמונה ווידאו, בדיקות 3 7 8, plus התרעת drift על טענה או טון או ICP חדשים. |
| 13 | בדיקת קצה לקצה, 3 לקוחות 10 עד 15 נכסים plus משימות זבל מכוונות, לוודא שהשופט תופס הכל ושום תוצר פגום לא מגיע ללוח. |
| 14 | הקפאת v1, תיעוד מה עבד ואיפה נשבר, בלי פיצ'רים חדשים, רק אז מתחילים סקייל. |
אסור ב-14 הימים, סוכנים מורכבים, Vector DB, אורקסטרציה מפוארת, multi-agent, workflows אוטונומיים, fine-tuning. המטרה אינה אוטומציה אלא עמוד שדרה אמין, אם שכבת האמת והשופט יציבים, כל שאר הסקייל פשוט בהרבה.
6 סבבים, קלוד Gemini GPT, התכנסות מלאה. אין יותר מחלוקת מהותית. האסטרטגיה, הפורטפוליו, הניתוב, התמחור, והתשתית, סגורים ומגובים בחוות דעת חיצונית. המסמך נשאר המלצה בלבד, ללא ביצוע. הצעד הבא אינו עוד סבב דעה אלא החלטת ענבל ודולב, האם לאשר את דרג 0, תוכנית 14 הימים, ולעבור משלב ההמלצה לשלב תכנון יישום. עד אישור כזה לא מבוצע דבר. אם תרצו אימות נוסף, אפשר לשלוח את תוכנית 14 הימים לסבב ביקורת אחרון, אך זו כבר ליטוש ולא אסטרטגיה.