OpenAI представив нову версію ChatGPT. Він може генерувати контент голосом, текстом або зображеннями

Автор:
Оля Березюк
Дата:

Американська компанія OpenAI представила нову версію штучного інтелекту ChatGPT — GPT-4o. Удосконалена версія буде доступна всім користувачам навіть без підписки.

Про це йдеться в блозі компанії.

Літера «о» в назві означає omni (всебічний), що вказує на мультимодальність GPT-4o. Це означає, що вона може генерувати контент або розуміти команди голосом, текстом або зображеннями.

GPT-4o може реагувати на аудіозапит лише за 232 мілісекунди (в середньому 320 мілісекунд), що відповідає часу реакції людини під час розмови.

Фактично чат-бот тепер зможе виконувати роль голосового помічника. У нинішній версії голосовий режим більш обмежений: він відповідає на одне запрошення за один раз і працює тільки з тим, що чує, пише The Verge.

Розробники, які бажають попрацювати з GPT-4o, отримають доступ до інтерфейсу програмування (API), який вдвічі дешевший і вдвічі швидший, ніж GPT-4 Turbo, написав генеральний директор OpenAI Сем Альтман на X.

BBC зазначає, що під час демонстрації можливостей голосової версії GPT-4o він надав корисні поради щодо розвʼязування простого рівняння, написаного на аркуші паперу, а не просто його розвʼязок.

Також він проаналізував компʼютерний код, перекладаючи з італійської на англійську, та інтерпретував емоції на селфі усміхненого чоловіка. А коли йому робили комплімент, він фліртував у відповідь.

Технічний директор OpenAI Міра Мураті, яку цитує CNN, повідомила, що оновлена версія ChatGPT тепер також матиме можливості памʼяті, тобто зможе вчитися на попередніх розмовах з користувачами й здійснювати переклад у режимі реального часу.