Anthropic הציגה קבוצה חדשה של ממשקי API הנקראים "שימוש במחשב" בדגם קלוד 3.5 Sonnet AI שלה, המאפשר ל-AI לקיים אינטראקציה עם מחשבים בדומה למשתמש אנושי. תכונה זו נמצאת כעת בגרסת בטא ציבורית ומאפשרת ל-AI לבצע משימות כמו הזזת סמן, הקלדת טקסט ולחיצה על כפתורים על ידי תפיסה ואינטראקציה עם ממשקי מחשב. חברות כמו Asana, Canva ו- DoorDash כבר בודקות את הפוטנציאל שלה בתהליכי העבודה שלהן.
מציגים סונטה משודרגת של קלוד 3.5, ודגם חדש, קלוד 3.5 הייקו. אנחנו גם מציגים יכולת חדשה בגרסת בטא: שימוש במחשב. מפתחים יכולים כעת לכוון את קלוד להשתמש במחשבים כמו שאנשים עושים - על ידי הסתכלות על מסך, הזזת סמן, לחיצה והקלדת טקסט. pic.twitter.com/ZlywNPVIJP
— Anthropic (@AnthropicAI) October 22, 2024
תכונת השימוש במחשב מסמנת מעבר מיישומי AI ספציפיים למשימה ליכולות למטרות כלליות יותר. זה מאפשר למפתחים לבצע אוטומציה של תהליכים שחוזרים על עצמם, לבנות ולבדוק תוכנות ולבצע משימות פתוחות כמו מחקר. יכולת זו נתפסת כניסיונית ויכולה להיות מועדת לשגיאות, עם אתגרים בביצוע פעולות כמו גלילה או גרירה. למרות המגבלות הללו, זה מייצג צעד משמעותי קדימה באינטראקציה בין בינה מלאכותית לאדם.
אפילו בזמן הקלטת ההדגמות הללו, נתקלנו בכמה רגעים משעשעים. באחד, קלוד עצר בטעות הקלטת מסך ארוכת טווח, מה שגרם לאיבוד כל הצילומים. מאוחר יותר, קלוד לקח הפסקה מהדגמת הקידוד שלנו והחל לעיין בתמונות של הפארק הלאומי ילוסטון. pic.twitter.com/r6Lrx6XPxZ
— Anthropic (@AnthropicAI) October 22, 2024
הגישה של Anthropic לתכונה זו כוללת שימוש ב-API המאפשר לקלוד לתרגם הוראות לפקודות מחשב, כגון מילוי טפסים באמצעות נתונים מגיליונות אלקטרוניים או דפי אינטרנט. החברה שמה דגש על בטיחות, מפתחת מסווגים לאיתור שימוש לרעה ולהפחתת סיכונים כמו דואר זבל או מידע מוטעה.
שחרורו של תכונה זו היא חלק מהאסטרטגיה הרחבה יותר של Anthropic לשפר את יכולות דגמי הבינה המלאכותית שלה, כאשר ה-Cloud 3.5 Sonnet המשודרג מציגה שיפורים משמעותיים במשימות הקידוד והשימוש בכלים. ההקדמה של השימוש במחשב צפויה להתפתח במהירות עם משוב מהמפתחים.
