OpenAI מפתחת יכולות ראייה עבור מצב השיחה של ChatGPT ב-iOS. תכונה חדשה זו, שעדיין נמצאת בפיתוח ועדיין אינה זמינה למשתמשים, תאפשר ליחידים

OpenAI מתכננת להוסיף יכולות ראייה למצב השיחה של ChatGPT ב-iOS

Vision mode on ChatGPT for iOS

OpenAI מפתחת יכולות ראייה עבור מצב השיחה של ChatGPT ב-iOS. תכונה חדשה זו, שעדיין בפיתוח ועדיין אינה זמינה למשתמשים, תאפשר לאנשים לצלם או להעלות תמונות. ChatGPT תנתח את התמונות הללו ותשלב את המידע בשיחה המתמשכת. התכונה מסתמכת על ה-Vision API מדגם GPT-4 Turbo ששוחרר לאחרונה, במטרה לספק חווית שיחה מקיפה יותר על ידי שילוב הקשר חזותי.

יכולות ראייה בפעולה ב-ChatGPT עבור iOS במצב שיחה 📲https://t.co/TcrxqYSvcV pic.twitter.com/1YclKYVkHO
— TestingCatalog News 🗞 (@testingcatalog) April 27, 2024

כדי להשתמש בתכונה זו, לאחר שתהיה זמינה, סביר להניח שהמשתמשים יצטרכו:

עבור למצב שיחה ב-ChatGPT במכשיר iOS.
בחר לצלם תמונה חדשה או בחר תמונה קיימת.
אפשר ל-ChatGPT לעבד ולבחון את התמונה.
לאחר מכן ChatGPT ישתמש בהקשר החזותי כדי להמשיך בדיאלוג.

על ידי זיהוי אובייקטים, בחינת סצנות או מענה לשאלות על סמך התמונה שסופקה, משתמשים יכלו לתקשר עם ChatGPT בדרכים חדשות. עם זאת, כמו כל טכנולוגיה חדשה, ישנן מגבלות וחששות אפשריים. OpenAI השמיעה בעיות פוטנציאליות, במיוחד בנוגע לניתוח תמונות שמציגות אנשים, וקבעה אמצעים כדי להתמודד עם החששות הללו.

אודות GPT-4 Turbo with Vision: GPT-4 Turbo with Vision היא טכנולוגיה שפותחה על ידי OpenAI שיכולה לפרש גם קלט טקסט וגם תמונה. פריצת דרך זו מקלה על מצב JSON ותפקוד הקורא לשאלות ראייה, מה שהופך את הדגם להתאמה ונוח יותר למשתמשים. זה מסמן קפיצת מדרגה בטכנולוגיית AI על ידי OpenAI, ומרחיב את היכולות של ChatGPT לשלב היבטים חזותיים יחד עם דיאלוגים טקסטואליים.

מקור: @testingcatalog