לדבר 3 דקות במקום לעבוד 30 — שיחה קולית מיידית עם הסוכן
אומרים לקלוד "תפעיל איתי שיחה קולית על X" — והוא מקים לך תוך 3 שניות אפליקציית web פנימית עם שיחה ברילטיים מול
gpt-realtime-2 של OpenAI. נפתח טאב בדפדפן, מדברים, סוגרים — ומקבלים בחזרה מסמך פלט מובנה עם החלטות, הערות ופעולות להמשך.
הסוכן באמת קורא ומעדכן קבצים בזמן השיחה. כלים פעילים: read_file, write_file, append_file, update_json, array_update_json, list_dir, run_bash.
שימוש לדוגמה: "עבור על כל הלידים הפתוחים, ספר לי על כל אחד, אני אגיד מה לעדכן" → הסוכן מעדכן את ה-CRM בזמן השיחה.
בלי כלי עדכון. רק שיחה. בסוף יוצא מסמך פלט מובנה ארוך עם מסקנות, החלטות, ופעולות להמשך — חוזר ישירות לקלוד להמשך עבודה.
שימוש לדוגמה: "בוא נחשוב על הקופי לדף הנחיתה החדש" → 3 דקות שיחה חופשית → דוקיומנט מובנה עם 4 כיוונים, כל אחד עם hook ו-CTA.
הסוכן יכול לזרוק לקנבס בזמן השיחה תוכן מכל סוג — אתם רואים, מגיבים בקול, הוא ממשיך לפריט הבא:
״בוא נעבור על התמונות שיצרת״ — הקנבס מציג אחת-אחת, אתם מגיבים בקול ״הזאת לא, השניה ועם פחות אור״, בסוף יש דוקיומנט שאומר איזו לבחור ומה לתקן.
Live mode. ״תפתח לי את freelancers.json, תעבור אחד-אחד, תשאל על השבועיים האחרונים, ותעדכן ציון״. 5 דקות → משימה שעות שנאתם — נסגרה.
Distill. ״בוא נחשוב מה החזון של הדף״. 3 דקות שיחה חופשית. מסמך מובנה עם 4 כיוונים, hook ו-CTA לכל אחד.
״עבור על כל הלידים הפתוחים, ספר על כל אחד, אני אגיד מה לעדכן״. 12 לידים, 8 דקות, הכל ב-CRM.
הקנבס מציג כל וריאציה, אתם מגיבים ברפלקס בקול, הסוכן מתעד פידבק מסודר לכל אחת.
הקנבס מציג סעיף סעיף, אתם מדברים עליהם, הסוכן מסמן בעיות. במקום לקרוא PDF 40 דקות.
Distill בוקר, 5 דקות שיחה, יוצא יום מתוכנן עם בלוקים, עדיפויות ופעולה ראשונה.
fetch מובנההסקיל קרוס-פלטפורם: מק / לינוקס / וינדוס. ה-launcher כתוב ב-Node ולא תלוי ב-bash.
לחצו על כפתור ההורדה למעלה, או הריצו:
curl -L https://aviz85.github.io/claude-skills-library/downloads/quick-voice.zip -o /tmp/quick-voice.zip
unzip /tmp/quick-voice.zip -d ~/.claude/skills/cd ~/.claude/skills/quick-voice
cp .env.example .env
# ערכו את הקובץ ושימו את המפתח שלכם:
# OPENAI_API_KEY=sk-...ה-launcher יתקין אוטומטית את התלויות (express, dotenv) בהפעלה הראשונה.
צריך OpenAI API Key עם גישה ל-Realtime API. אם המפתח לא מורשה — תקבלו שגיאת SDP בדפדפן.
״תפעיל איתי שיחה קולית על [נושא]״ — או שקלוד מסיק מההקשר של השיחה הנוכחית.
יוצר runtime/<id>/config.json עם הוראות בעברית, מצב (live/distill), רשימת כלים מותרת ורמזי קנבס.
node scripts/launch.js <id> — מוצא פורט פנוי בטווח 3031-3040, מעלה שרת, ופותח דפדפן.
WebRTC ישיר מהדפדפן ל-OpenAI. הקנבס והכלים פעילים. הסוכן עובד בזמן אמת.
סגירת דפדפן / לחיצה על ✓ / קריאת end_session — והסקיל מחזיר את output.md לקלוד.
״בוא נעבור על התמונות שיצרת״ (distill + קנבס תמונות):
{
"mode": "distill",
"topic": "סקירת תמונות",
"instructions": "הצג כל תמונה ב-canvas_show, שאל 'מה דעתך?', שמור פידבק ב-save_note. בסוף end_session.",
"voice": "ash",
"tools": ["canvas_show", "canvas_clear", "save_note", "end_session"],
"canvas_hints": [
{ "type": "image", "source": "/abs/path/img-1.png", "title": "1" },
{ "type": "image", "source": "/abs/path/img-2.png", "title": "2" }
],
"output_template": "# פידבק על תמונות\n\n"
}| כלי | תיאור |
|---|---|
canvas_show | מציג תוכן בקנבס (image/markdown/code/json/video/audio/url/html/text) |
canvas_clear | נוקה את הקנבס |
save_note | מוסיף סקציה ל-output.md |
end_session | סוגר את השיחה ושומר סיכום סופי |
| כלי | תיאור |
|---|---|
read_file | קורא קובץ (תחת cwd) |
write_file | כותב קובץ |
append_file | מוסיף לסוף קובץ |
update_json | shallow-merge ל-JSON object |
array_update_json | עדכון רשומה אחת לפי match field |
list_dir | תכולת תיקייה |
run_bash | פקודת shell (להשתמש בזהירות) |
.envבדקו את runtime/<id>/server.log. בדרך כלל זה OPENAI_API_KEY שגוי או תלות חסרה.
ה-launcher מדפיס את ה-URL לקונסול. פתחו ידנית.
החשבון שלכם לא מורשה ל-Realtime API. בדקו ב-platform.openai.com שיש הרשאה.
פתחו DevTools בדפדפן ובדקו את ה-Console. את הצד-שרת תמצאו ב-server.log של ה-session.
quick-voice הופך כל משימה שאפשר לסגור בשיחה — לשיחה.