Тексти

ChatGPT навчили жартувати та розпізнавати людські емоції. Розповідаємо про можливості версії GPT-4o і тестуємо функції, які скоро будуть доступні всім (ми добряче його заплутали)

Автор:: Софія Коротуненко
Редактор:: Дмитро Раєвський

Дата:: 18:32, 16 травня 2024

ChatGPT навчили жартувати та розпізнавати людські емоції. Розповідаємо про можливості версії GPT-4o і тестуємо функції, які скоро будуть доступні всім (ми добряче його заплутали) — Анастасія Лисиця / Катерина Бандус / «Бабель»

Тринадцятого травня 2024 року OpenAI анонсувала нову версію ChatGPT. GPT-4o — це покращена модель платної версії GPT-4. Тепер ШІ запрацює вдвічі швидше. Наприклад, буде реагувати на голосовий запит настільки ж оперативно, як і людина під час розмови, — за 200—300 мілісекунд. Голосова асистентка GPT-4o також буде розпізнавати людські емоції по відео й аудіо, імітувати різні акценти, змінювати інтонацію і жартувати. Вона не просто начитає відповідь, але й відреагує, якщо її перебити. Користувачі безплатної версії GPT-3.5 невдовзі отримають доступ до платних функцій GPT-4, як-от аналіз документів і фото, голосовий чат з ботом і функція памʼяті, завдяки якій ChatGPT знатиме, про що ви говорили раніше. Оновлення спершу зʼявиться у тих, хто оформив платну підписку, а згодом у всіх. «Бабель» розповідає про функції GPT-4o і тестує можливості GPT-4, які скоро стануть доступними для всіх.

Що таке GPT-4o

Це оновлена версія великої мовної моделі ChatGPT. Тепер зі ШІ можна буде спілкуватись як з реальною людиною — система навчилась аналізувати відео й аудіо в режимі реального часу. Голосова асистентка GPT-4o реагуватиме не тільки на слова, але й на інтонацію та дихання. Вона здогадається, якщо людина нервує, і дасть декілька порад, як заспокоїтися.

Нова модель також стане людянішою — навчиться жартувати, змінювати інтонацію і відповідати так, ніби справді переживає емоції. Наприклад, коли співробітник OpenAI назвав GPT-4o «корисним і дивовижним», асистентка кокетливо попрохала його припинити, оскільки він «змушує її червоніти».

GPT-4o проаналізує, що показано на відео, і зможе спілкуватись про те, що відбувається навколо. Наприклад, зможе оцінити, наскільки доречно вдягнена людина для співбесіди, чи поглузує з невдалого вибору капелюха.

Один з розробників Роккі запитує у голосової асистентки ChatGPT-4o, як він виглядає перед співбесідою.

GPT-4o зможе не тільки розвʼязувати математичні задачі, але й підказувати користувачу, як крок за кроком знайти правильну відповідь. Система реагує на голос учня, аналізує його записи та ввічливо виправляє, коли він помиляється.

Засновник освітньої організації Khan Academy Салман Хан разом із сином Імраном тестують ChatGPT-4o, щоб розвʼязати математичну задачу.

Голосовий режим зʼявиться протягом наступних тижнів. Першими доступ отримають ті, хто оформив передплату. Але в безплатній версії згодом теж все це буде. Окрім голосової асистентки, буде й доступ до розширених функцій ChatGPT, що раніше були доступні тільки за платною підпискою Plus.

Які функції GPT-4 будуть доступні всім?

Мультимедійність

ChatGPT опрацьовує не тільки текстові команди, але й голосові. Він також зможе проаналізувати зображення або файл та обговорити їхній вміст. Наприклад, описати, що зображено на фото.

«Бабель» надіслав ChatGPT фото трьох монет номіналом 1, 5 та 10 гривень. Система змогла назвати кількість монет, але помилилась з номіналом та постатями, які зображені на їхніх зворотах. Вона вважає, що на монеті номіналом 10 грн викарбуваний Богдан Хмельницький, а не Іван Мазепа. Хмельницький є на нашому фото, але він зображений на 5 гривнях, які ШІ сплутав з 2 гривнями.

Чат-бот рахує монети на фото і пояснює, хто зображений на їхніх зворотах. ШІ припустився декількох помилок.

Доступ до інтернету в режимі реального часу

ChatGPT шукатиме відповідь на запитання не в обмеженому наборі даних, а в усьому інтернеті. Хоча це технологічний прорив, оглядач Wired Ріс Роджерс закликає все одно перевіряти достовірність інформації — розробники досі не запобігли ШІ-галюцинаціям, коли ChatGPT просто вигадує відповідь. У травні 2024 року технічна директорка OpenAI Міра Мураті запевнила, що команда продовжує вдосконалювати систему.

«Бабель» попрохав ChatGPT назвати фільм за кадром з нього. Спочатку ми показали йому сцену з фільму 2023 року «Мирний-21», де начальник прикордонного загону говорить із сепаратистом. ChatGPT правильно назвав фільм, хоча уточнив, що це «українські військові, які ведуть діалог». ChatGPT не зміг розпізнати наступний кадр із фільму «Уроки толерантності». Він запевняв, що це «Памфір» навіть після того, як ми написали йому, що він помилився.

ChatGPT-4o правильно назвав фільм «Мирний-21», але неправильно описав героїв у кадрі. Розпізнати «Уроки толерантності» чат-бот не зміг.

ChatGPT-4o правильно назвав фільм «Мирний-21», але неправильно описав героїв у кадрі. Розпізнати «Уроки толерантності» чат-бот не зміг.

GPT Store

Це платформа, де розробники-користувачі діляться власними моделями ChatGPT, що спеціалізуються на вузькій темі. Наприклад, Books порадить книгу за смаками користувача, а Code Tutor підкаже програмістам, як писати потрібний їм код.

ШІ генерує зображення за допомогою DALL-E

ChatGPT може створити зображення в різних стилях. Потрібно лише детально описати, що саме має бути на малюнку. Розробники також запевняють, що ChatGPT може перетворити пласке зображення на 3D-модель.

«Бабель» попрохав ChatGPT намалювати обкладинку для інтерв’ю «Бабеля» з Ксенією Семеновою і зобразити на ній гостю, інтервʼюєра Олександра Мʼясищева та будівлю Національного авіаційного університету (НАУ) на фоні.

Хоча ми надіслали фото Семенової та Мʼясищева, ChatGPT намалював зовсім не схожі на спікерів аватари — відрізнявся навіть колір волосся. ШІ справді зміг видозмінити обкладинку в кількох стилях — ретрофутуризму і бруталізму. Але в жодній з версій будівля на фоні не була схожа на НАУ.

Створити 3D-логотип «Бабеля» у ШІ теж не вийшло. Він не зміг відтворити його з png-зображення, тому пропонував різні моделі, схожі на літеру «Б» або музичну ноту.

ChatGPT-4o без успіху намагається відтворити синьо-жовтий логотип «Бабеля». Запропоновані ШІ варіанти схожі на літеру «Б» або на музичну ноту.

ChatGPT-4o без успіху намагається відтворити синьо-жовтий логотип «Бабеля». Запропоновані ШІ варіанти схожі на літеру «Б» або на музичну ноту.

Пам’ять

ChatGPT запамʼятовуватиме всі розмови з користувачем і поступово вивчатиме його звички та побут. Наприклад, ШІ знатиме, чи є у користувача діти, скільки їм років і чим вони цікавляться.

Аналіз даних

Чат зможе опрацьовувати великий масив даних і структурувати їх у таблицях або діаграмах. Він також зможе послухати лекцію замість користувача і написати за нею короткий конспект.

«Бабель» запропонував ChatGPT виписати головне з відеоексплейнеру про OSINT-розслідування, що допомагають викривати воєнні злочини. Спершу ШІ загально описав, про що йдеться у відео, як-от про «важливість навчання і постійного вдосконалення навичок у сфері OSINT». Коли ми попрохали його розповісти деталі, він заплутався і написав, що OSINT-розслідувачі Molfar — «народні мудреці, які проводять обряди для захисту і зцілення населення».

ChatGPT-4o загально описує, про що йдеться у відео. У деталях заплутався і назвав OSINT-розслідувачів «народними мудрецями».

ChatGPT-4o загально описує, про що йдеться у відео. У деталях заплутався і назвав OSINT-розслідувачів «народними мудрецями».

Навіщо платна підписка, якщо все буде безплатно?

Користувачі зможуть надсилати обмежену кількість запитів GPT-4o на день. Із платною підпискою їх буде «в пʼять разів більше». Якщо й ці запити закінчаться, підписники зможуть користуватись платною версією GPT-4, можливості якої не сильно відрізняються від GPT-4o. А звичайним користувачам, коли вони вичерпають ліміт запитів, доведеться повернутися до застарілої версії GPT-3.5.

Користувачі платної підписки також отримають ранній доступ до нових функцій, зокрема до оновленої голосової асистентки й десктопного застосунку для компʼютерів Mac, що полегшить взаємодію з ChatGPT на робочому столі. Наприклад, коли користувач зробить знімок екрана, ШІ проаналізує його зміст і виокремить найголовніше.

За словами розробників, застосунок зʼявиться у користувачів Mac вже наступного тижня. А версію для Windows OpenAI планує випустити до кінця року.

«Бабель» не обмежує кількість текстів, які можна прочитати безплатно. Усі наші матеріали відкриті, але лише завдяки вашій підтримці: 🔸 Buy Me a Coffee, 🔸 Patreon, 🔸 PayPal: [email protected]