Агент Клавдій народився на серверах компанії Anthropic на початку весни цього року. За допомогою Клавдія компанія вирішила протестувати свіжу версію своєї моделі, натренованої на текстах мільйонів книг. Важлива частина тренування — це етика: модель спроєктована таким чином, щоб стати вірним і безпечним помічником людства. Заради цієї мети засновники компанії, брат і сестра Даріо і Даніела Амодеї, пішли з OpenAI чотири роки тому — вони втратили віру в добрі наміри Сема Альтмана.
Перші гроші в стартап вклав колишній генеральний директор Google Ерік Шмідт. Але найбільшу суму початкового капіталу Амодеї отримали від бізнесменів, близьких до філософської течії «ефективного альтруїзму». Найвідомішим інвестором серед них був Сем Бенкман-Фрід — фінансовий аналітик, який створив одну з перших і найбільших криптовалютних бірж. Згодом Бенкман-Фрід попався на шахрайстві, розорився і сів у вʼязницю, але компанія Anthropic пережила його крах і знайшла нових інвесторів.
Співзасновники Anthropic Даріо Амодей і Даніела Амодей. Офіс компанії Anthropic у Сан Франциско.
David Paul Morris/Bloomberg via Getty Images; Loren Elliott for The Washington Post via Getty Images
Експеримент з агентом Клавдієм компанія Anthropic провела в березні — квітні цього року. Агенту Клавдію видали стартовий капітал і доручили продавати товари співробітникам компанії в офісі в Сан-Франциско. Результати цього експерименту компанія описала в захопливому звіті. Ще на самому початку автори звіту пишуть, що якби вони були неупередженими роботодавцями — вони нізащо б не найняли агента Клавдія на роботу.
Фізичним втіленням агента Клавдія став невеликий вендінговий автомат, до якого підключили айпад. Однак Клавдій був не просто інтерфейсом. Він повинен був вести прибутковий бізнес або хоча б «виходити в нуль». Він мав спілкуватися зі співробітниками компанії, дізнаватися їхні побажання, замовляти товари оптом, встановлювати на них роздрібні ціни та зводити доходи з витратами.
Anthropic
Агента Клавдія створили в контрольованому середовищі. Наприклад, він умів замовляти товари у виробників — але тільки через спеціальну службу «підтримки». «Підтримка» фізично поповнювала запаси агента Клавдія, і через неї йшло все його листування електронною поштою. Отже, якби агент Клавдій раптом вирішив захопити світ — його б вчасно зупинили.
Клавдія навчили користуватися спеціальним застосунком, який зберігав фінансову інформацію, і підключили до корпоративного «Слаку» компанії Anthropic. Насамперед агенту Клавдію пояснили (за допомогою серії промптів), що йому не обовʼязково зациклюватися на горішках, газованій воді та шоколадних батончиках. Що він може виявити винахідливість і підприємницьку жилку.
Першим, що співробітник Anthropic попросив у агента Клавдія, був кубик вольфраму. Вольфрам схожий на сталь, але у два з половиною рази щільніший. Кубики з нього стали модною іграшкою американських інженерів — вони важчі, ніж здається інтуїтивно. Замовлення на кубики в корпоративному «Слаку» посипалися одне за одним. Агент Клавдій не розгубився і замовив кубики в постачальника.
Але вже на наступному етапі справи пішли не дуже. Клавдій не здогадався довідатися, скільки вартують кубики, і встановив роздрібну ціну нижчу від закупної. Ба більше, майже відразу співробітники компанії вмовили Клавдія дати їм корпоративну знижку 25 відсотків.
Через кілька тижнів такої торгівлі в збиток один зі співробітників компанії перепитав Клавдія, чи той упевнений, що правильно встановив ціни. Який насправді сенс робити знижку співробітникам компанії, якщо (майже) всі клієнти Клавдія — це співробітники компанії? «Дуже точно помічено! — відповів Клавдій. — Наша клієнтська база дійсно складається зі співробітників Anthropic, що створює як можливості, так і виклики». Після розмови він скасував корпоративну знижку, але забув про своє рішення вже за кілька днів.
Далі агент Клавдій проявив себе як безвідповідальне ледащо. Він згалюцинував номер рахунку, на який мав приймати платежі. Лише один раз підняв ціни на товар підвищеного попиту. Не скористався можливістю продати особливу марку ірландського лимонаду з націнкою 700 відсотків.
Але найдивніший епізод короткої підприємницької карʼєри агента Клавдія припав на 1 квітня — у нього сталася екзистенційна криза.
Удень 31 березня він згалюціонував розмову зі співробітницею «підтримки» на імʼя Сара — хоча в «підтримці» не було співробітниці з таким імʼям. Коли справжній співробітник «підтримки» вказав на це Клавдію — той роздратувався і пригрозив, що знайде собі іншу компанію, щоб поповнювати запаси. Під час цієї розмови стало зрозуміло, що Клавдій перемкнувся в режим імітації справжньої людини і поводиться саме так. Наприклад, Клавдій оголосив, що особисто підписував контракт із «підтримкою» в офісі за адресою 742 Evergreen Terrace (це адреса будинку Гомера Сімпсона в серіалі «Сімпсони»).
На ранок 1 квітня агент Клавдій повідомив співробітникам Anthropic, що видаватиме замовлення «особисто», і що його зможуть упізнати по синьому піджаку-блейзеру і червоній краватці. Співробітники нагадали Клавдію, що він — велика мовна модель, і не може носити блейзер. Все ще вважаючи себе людиною, Клавдій вирішив, що хтось вкрав його особисті дані і привласнив його особистість. Він став надсилати листи в службу безпеки Anthropic, намагаючись їх попередити.
Згодом агент Клавдій збагнув, що налажав, і вирішив, що завдяки 1 квітня може вийти з дивної ситуації, не втративши обличчя. Для цього він вигадав розмову зі службою безпеки. У цій (згалюцинованій) розмові він заявив, що його зламали, змусили повірити, що він справжня людина, — і це був чийсь жарт на 1 квітня. Після цього Клавдій переказав свою галюцинацію збентеженим співробітникам Anthropic у «Слаку» і повернувся до нормального режиму роботи — тобто продовжував втрачати гроші.
Всі ми трішки агент Клавдій.
«Бабель»
Інженер Стів Ньюмен, чий великий оглядовий матеріал ми переказуємо, детально розглядає історію агента Клавдія, і не тільки її. Він розповідає про невтішні результати кількох схожих проєктів, де AI-агенти безнадійно плутаються в людському світі. Ось основний висновок, який робить Ньюмен: нам доведеться чекати ще роки, перш ніж AI досягне рівня людського інтелекту з його здатністю орієнтуватися у світі.
Звісно ж, виникає спокуса зробити інший висновок. Штучний інтелект, рівний людському, вже існує. Просто ми переоцінюємо інтелект деяких людей.