OpenAI הכריזה לאחרונה על תכונה חדשה לכוונון עדין של חיזוק שתהפוך לזמינה ב-OpenAI Playground. הודעה זו נמסרה במהלך היום השני של "12 הימים של

OpenAI מציגה o1-mini כוונון עדין של חיזוק אלפא ב-Playground

OpenAI הכריזה לאחרונה על תכונה חדשה לכוונון עדין של חיזוק שתהפוך לזמינה ב-OpenAI Playground. הודעה זו פורסמה במהלך היום השני של אירוע "12 ימים של OpenAI" שלהם. התכונה תאפשר למשתמשים ללמד מודלים לנמק בתוך תחומים ספציפיים, מה שיאפשר למודלים מכוונים בהתאמה אישית לספק תוצאות טובות משמעותית במשימות מיוחדות. בתחילה, יכולת זו תוצע לקבוצה מוגבלת של משתמשי אלפא, כאשר זמינות רחבה יותר צפויה ברבעון הראשון. משתמשים המעוניינים יכולים להגיש בקשה לגישה באמצעות טופס הרשמה אלפא.

💡

You can apply for reinforcement fine-tuning Alpha access via this form

כאשר תכונה זו תוצג, המשתמשים יקבלו גישה לבורר שיטות כוונון עדין בממשק המשתמש. בורר זה יכלול שלוש אפשרויות בנוסף לכוונון העדין המפוקח הזמין כעת: אופטימיזציה ישירה של הפניות וכיוונון עדין חיזוק. צפוי שאופטימיזציה של הפניות ישירה תושק בסופו של דבר כתכונה עצמאית עם הכרזה משלה.

עבור כוונון עדין של חיזוק, למשתמשים תהיה היכולת לציין סכימת מדרג כדי להגדיר כיצד יש להעריך את תגובות המודל. לחלופין, הם יכולים להשתמש בהנחיה כדי ליצור סכימה זו באופן אוטומטי, מה שהופך את התהליך לאינטואיטיבי וגמיש יותר.

שמתי לב במהלך השידור החי של "12 ימים של OpenAI: Day 2" היום שבסרגל הצד של פלטפורמת OpenAI יש אייקון חדש, אולי קשור לאחת ההכרזות הקרובות - "קולות מותאמים אישית" - "צור קול למטה או באמצעות OpenAI API" - "צור דוגמה קולית שלך על ידי... pic.twitter.com/c6ZGZpHBwr
— Tibor Blaho (@btibor91) December 6, 2024

בנוסף לכוונון עדין של חיזוק, תכונות אחרות נמצאות גם בפיתוח. כלי בולט אחד יאפשר למשתמשים לשכפל את הקול שלהם. על ידי קריאת פסקה ספציפית של טקסט, משתמשים יכולים לאפשר ל-OpenAI ליצור שיבוט קולי המסוגל לבטא כל טקסט בקול שלהם. תכונה זו תהיה מוגבלת ככל הנראה למשתמשים בני 18 ומעלה, מה שמסמן צעד משמעותי בפישוט טכנולוגיית שיבוט הקול.