Американська компанія OpenAI представила нову версію штучного інтелекту ChatGPT — GPT-4o. Удосконалена версія буде доступна всім користувачам навіть без підписки.
Про це йдеться в блозі компанії.
Літера «о» в назві означає omni (всебічний), що вказує на мультимодальність GPT-4o. Це означає, що вона може генерувати контент або розуміти команди голосом, текстом або зображеннями.
GPT-4o може реагувати на аудіозапит лише за 232 мілісекунди (в середньому 320 мілісекунд), що відповідає часу реакції людини під час розмови.
Фактично чат-бот тепер зможе виконувати роль голосового помічника. У нинішній версії голосовий режим більш обмежений: він відповідає на одне запрошення за один раз і працює тільки з тим, що чує, пише The Verge.
Розробники, які бажають попрацювати з GPT-4o, отримають доступ до інтерфейсу програмування (API), який вдвічі дешевший і вдвічі швидший, ніж GPT-4 Turbo, написав генеральний директор OpenAI Сем Альтман на X.
BBC зазначає, що під час демонстрації можливостей голосової версії GPT-4o він надав корисні поради щодо розвʼязування простого рівняння, написаного на аркуші паперу, а не просто його розвʼязок.
Також він проаналізував компʼютерний код, перекладаючи з італійської на англійську, та інтерпретував емоції на селфі усміхненого чоловіка. А коли йому робили комплімент, він фліртував у відповідь.
Технічний директор OpenAI Міра Мураті, яку цитує CNN, повідомила, що оновлена версія ChatGPT тепер також матиме можливості памʼяті, тобто зможе вчитися на попередніх розмовах з користувачами й здійснювати переклад у режимі реального часу.