Що таке GPT-4o
Це оновлена версія великої мовної моделі ChatGPT. Тепер зі ШІ можна буде спілкуватись як з реальною людиною — система навчилась аналізувати відео й аудіо в режимі реального часу. Голосова асистентка GPT-4o реагуватиме не тільки на слова, але й на інтонацію та дихання. Вона здогадається, якщо людина нервує, і дасть декілька порад, як заспокоїтися.
Нова модель також стане людянішою — навчиться жартувати, змінювати інтонацію і відповідати так, ніби справді переживає емоції. Наприклад, коли співробітник OpenAI назвав GPT-4o «корисним і дивовижним», асистентка кокетливо попрохала його припинити, оскільки він «змушує її червоніти».
GPT-4o проаналізує, що показано на відео, і зможе спілкуватись про те, що відбувається навколо. Наприклад, зможе оцінити, наскільки доречно вдягнена людина для співбесіди, чи поглузує з невдалого вибору капелюха.
GPT-4o зможе не тільки розвʼязувати математичні задачі, але й підказувати користувачу, як крок за кроком знайти правильну відповідь. Система реагує на голос учня, аналізує його записи та ввічливо виправляє, коли він помиляється.
Голосовий режим зʼявиться протягом наступних тижнів. Першими доступ отримають ті, хто оформив передплату. Але в безплатній версії згодом теж все це буде. Окрім голосової асистентки, буде й доступ до розширених функцій ChatGPT, що раніше були доступні тільки за платною підпискою Plus.
Які функції GPT-4 будуть доступні всім?
Мультимедійність
ChatGPT опрацьовує не тільки текстові команди, але й голосові. Він також зможе проаналізувати зображення або файл та обговорити їхній вміст. Наприклад, описати, що зображено на фото.
«Бабель» надіслав ChatGPT фото трьох монет номіналом 1, 5 та 10 гривень. Система змогла назвати кількість монет, але помилилась з номіналом та постатями, які зображені на їхніх зворотах. Вона вважає, що на монеті номіналом 10 грн викарбуваний Богдан Хмельницький, а не Іван Мазепа. Хмельницький є на нашому фото, але він зображений на 5 гривнях, які ШІ сплутав з 2 гривнями.
Доступ до інтернету в режимі реального часу
ChatGPT шукатиме відповідь на запитання не в обмеженому наборі даних, а в усьому інтернеті. Хоча це технологічний прорив, оглядач Wired Ріс Роджерс закликає все одно перевіряти достовірність інформації — розробники досі не запобігли ШІ-галюцинаціям, коли ChatGPT просто вигадує відповідь. У травні 2024 року технічна директорка OpenAI Міра Мураті запевнила, що команда продовжує вдосконалювати систему.
«Бабель» попрохав ChatGPT назвати фільм за кадром з нього. Спочатку ми показали йому сцену з фільму 2023 року «Мирний-21», де начальник прикордонного загону говорить із сепаратистом. ChatGPT правильно назвав фільм, хоча уточнив, що це «українські військові, які ведуть діалог». ChatGPT не зміг розпізнати наступний кадр із фільму «Уроки толерантності». Він запевняв, що це «Памфір» навіть після того, як ми написали йому, що він помилився.
GPT Store
Це платформа, де розробники-користувачі діляться власними моделями ChatGPT, що спеціалізуються на вузькій темі. Наприклад, Books порадить книгу за смаками користувача, а Code Tutor підкаже програмістам, як писати потрібний їм код.
ШІ генерує зображення за допомогою DALL-E
ChatGPT може створити зображення в різних стилях. Потрібно лише детально описати, що саме має бути на малюнку. Розробники також запевняють, що ChatGPT може перетворити пласке зображення на 3D-модель.
«Бабель» попрохав ChatGPT намалювати обкладинку для інтерв’ю «Бабеля» з Ксенією Семеновою і зобразити на ній гостю, інтервʼюєра Олександра Мʼясищева та будівлю Національного авіаційного університету (НАУ) на фоні.
Хоча ми надіслали фото Семенової та Мʼясищева, ChatGPT намалював зовсім не схожі на спікерів аватари — відрізнявся навіть колір волосся. ШІ справді зміг видозмінити обкладинку в кількох стилях — ретрофутуризму і бруталізму. Але в жодній з версій будівля на фоні не була схожа на НАУ.
Створити 3D-логотип «Бабеля» у ШІ теж не вийшло. Він не зміг відтворити його з png-зображення, тому пропонував різні моделі, схожі на літеру «Б» або музичну ноту.
Пам’ять
ChatGPT запамʼятовуватиме всі розмови з користувачем і поступово вивчатиме його звички та побут. Наприклад, ШІ знатиме, чи є у користувача діти, скільки їм років і чим вони цікавляться.
Аналіз даних
Чат зможе опрацьовувати великий масив даних і структурувати їх у таблицях або діаграмах. Він також зможе послухати лекцію замість користувача і написати за нею короткий конспект.
«Бабель» запропонував ChatGPT виписати головне з відеоексплейнеру про OSINT-розслідування, що допомагають викривати воєнні злочини. Спершу ШІ загально описав, про що йдеться у відео, як-от про «важливість навчання і постійного вдосконалення навичок у сфері OSINT». Коли ми попрохали його розповісти деталі, він заплутався і написав, що OSINT-розслідувачі Molfar — «народні мудреці, які проводять обряди для захисту і зцілення населення».
Навіщо платна підписка, якщо все буде безплатно?
Користувачі зможуть надсилати обмежену кількість запитів GPT-4o на день. Із платною підпискою їх буде «в пʼять разів більше». Якщо й ці запити закінчаться, підписники зможуть користуватись платною версією GPT-4, можливості якої не сильно відрізняються від GPT-4o. А звичайним користувачам, коли вони вичерпають ліміт запитів, доведеться повернутися до застарілої версії GPT-3.5.
Користувачі платної підписки також отримають ранній доступ до нових функцій, зокрема до оновленої голосової асистентки й десктопного застосунку для компʼютерів Mac, що полегшить взаємодію з ChatGPT на робочому столі. Наприклад, коли користувач зробить знімок екрана, ШІ проаналізує його зміст і виокремить найголовніше.
За словами розробників, застосунок зʼявиться у користувачів Mac вже наступного тижня. А версію для Windows OpenAI планує випустити до кінця року.
«Бабель» не обмежує кількість текстів, які можна прочитати безплатно. Усі наші матеріали відкриті, але лише завдяки вашій підтримці: 🔸 Buy Me a Coffee, 🔸 Patreon, 🔸 PayPal: [email protected]