OpenAI запустить «магазин додатків» для штучного інтелекту
Користувачі зможуть створювати власні версії ChatGPT та заробляти на них.
Компанія OpenAI, головний гравець на ринку генеративних мовних моделей, а можливо і штучного інтелекту загалом, провела 6 листопада презентацію нових продуктів та покращень існуючих. Вона проходила в рамках DevDay – першого в історії компанії заходу для розробників. Однак деякі з анонсів будуть цікавими і простим користувачам. Розповідаємо про центральну новину презентації: запуск спеціалізованих моделей GPT та «магазина додатків» для них.
ChatGPT, GPT-4, GPT — що все це означає?
OpenAI використовує абревіатуру GPT у різних варіантах – як у назвах технологій, так і у продуктів, що на них засновані. GPT (генеративний переднавчений трансформер, generative pre-trained transformer) - це тип мовних моделей, які вчаться генерувати текст, схожий на людський, навчаючись на величезних масивах даних.
Мабуть, найчастіше люди чують про ChatGPT – це онлайн-сервіс, який виглядає як чат-бот та працює на мовних моделях, розроблених OpenAI. Сервіс запустився в листопаді 2022 року і за рік набув неймовірної популярності: щотижня ним користується 100 мільйонів людей.
Самі моделі, що лежать в основі ChatGPT та інших продуктів, OpenAI називає порядковими числами: GPT-1 та GPT-2 навчалися на відносно невеликому обсязі тексту і не набули широкого поширення. Вибухове зростання популярності ChatGPT забезпечила модель GPT-3.5, випущена в березні 2022 року. У березні 2023 року з'явилася ще більш досконала модель GPT-4, яка поступово навчилася працювати не тільки з текстом, але також «розуміти» зображення. Зараз вона доступна лише тим, хто має оформлену платну передплату на ChatGPT.
OpenAI представила ще один GPT – тепер це ваш власний «агент»
На презентації 6 листопада глава OpenAI Сем Альтман розповів про запуск ще одного продукту з тією самою абревіатурою у назві. GPT – це спеціалізовані версії ChatGPT, налаштовані на виконання конкретного кола завдань (їх ще називають "агентами").
У блозі компанії пояснюється, що провісником GPT були Custom instructions - спеціальні інструкції, які користувач може вписати в налаштуваннях свого ChatGPT, щоб не повторювати щоразу те саме. Простим варіантом Custom instructions можна вважати рядок «Дій як моя улюблена вчителька історії, яка кожну тему пояснювала захоплююче та місткісно, без нудного списку дат та імен», який модель матиме на увазі при відповіді на всі ваші запитання (бажано, пов'язані з історичними подіями).
Але за бажання в поля для спеціальних інструкцій можна було запакувати цілу систему, за якою повинен працювати ChatGPT: один із найбільш популярних варіантів, AutoExpert, по суті змушує модель самостійно визначити, роль якого експерта вона має прийняти, вичленувати ключові слова із запиту та переписати питання у більш зрозумілу собі форму — і потім почати відповідати.
Нові GPT будуть являи собою запаковані заздалегідь версії таких «експертів». Наприклад OpenAI розробила кілька «агентів» з різними можливостями, наприклад, такими:
- пояснювати правила настільних та карткових ігор для людей різного віку;
- прочитати ваш текст і дати поради, як зробити його кращим;
- намалювати розмальовку на основі вашої ідеї;
- написати рецепт для страв на основі інгредієнтів, які у вас є;
- пояснити останні меми та молодіжний сленг.
На презентації показали кілька прикладів з інтеграцією у сторонні сервіси. Один «агент» підключився до календаря та робочого месенджера користувача, щоб знайти конфліктуючі плани та написати начальнику «Мені час бігти». Інший у зв'язці з платформою для дизайнерів Canva дозволив перетворити короткий запит "намалюй мені постер для DevDay, який пройде 6 листопада в Музеї де Янга" в пару варіантів плакатів - причому у користувача була можливість швидко перейти в Canva і доопрацювати дизайн, що сподобався.
GPT матиме свій App Store
Як оголосили на презентації, за кілька тижнів у користувачів з платною підпискою ChatGPT Plus з'явиться можливість створювати власні GPT. Причому знати програмування для цього необов'язково: «агент» налаштовуватиметься в діалозі, як за звичайної роботи з чат-ботом. Модель навіть сама запропонує собі назву та логотип.
Автор «агента» зможе завантажити в модель додаткові знання з теми — наприклад, серію лекцій — а також вказати, чи вона може використовувати розширені можливості ChatGPT (пошук по інтернету, аналіз даних і генерація зображень).
GPT можна буде використовувати в особистих цілях, поділитися ними з колегами або викласти у відкритий доступ. Незабаром OpenAI планує запустити «магазин додатків» для «агентів», а згодом — включити монетизацію, щоб розробники GPT могли заробляти.
Компанія прямо вказує, що запуск GPT — це ще один крок на шляху створення сильного штучного інтелекту (AGI), тобто штучного інтелекту без конкретної спеціалізації, здатного вирішувати будь-які завдання. OpenAI декларує своєю місією створення AGI та використання його на благо людства. Участь спільноти розробників у налаштуванні моделей та пошуках нових сфер застосування, вважають у компанії, дозволить зробити штучний інтелект безпечнішим, а також краще зрозуміти, що чекає на нас у майбутньому.
ChatGPT став трохи зручнішим
Для тих, кому поки що достатньо «класичного» ChatGPT без «агентів», теж є гарні новини: OpenAI покращила можливості платної версії, заснованої на GPT-4. По-перше, тепер база знань моделі обривається не вереснем 2021 року, як раніше, а квітнем 2023-го. По-друге, різні можливості моделі поєднали в один інтерфейс. Раніше користувач повинен був вручну перемикатися між звичайним ChatGPT, версією з пошуком по інтернету або версією, що генерує зображення за допомогою моделі DALL-E 3. Тепер такого вибору немає: модель сама вирішить, яку з можливостей потрібно застосувати у кожному конкретному запиті.
Ці та інші нововведення – можливість для OpenAI (знов) обійти конкурентів
Незважаючи на те, що GPT-4 залишається найпопулярнішим продуктом у галузі генеративних нейромереж, конкуренти пропонували рішення, які більш ефективно вирішували окремі завдання. Але новини на DevDay, можливо, дозволять компанії Сема Альтмана нівелювати і ці переваги.
Так, у липні 2023 року корпорація Meta випустила велику мовну модель Llama 2 – причому як проект із відкритим вихідним кодом. Це дозволяє розробникам налаштовувати модель під їх конкретні завдання (наприклад, донавчити її на додатковому масиві даних), тоді як у випадку GPT-4 доводилося покладатися тільки на тонке налаштування запитів до моделі. 6 листопада OpenAI анонсувала GPT-4 Turbo, яку, крім іншого, можна донавчати на власних даних - раніше така можливість була тільки у менш просунутої моделі, GPT-3.5. Та й вузькоспеціалізовані «агенти» GPT, яких має бути набагато простіше створювати, ніж доналаштовувати моделі з відкритим вихідним кодом, повинні зробити свій внесок.
Ще одна особливість GPT-4 Turbo – у розробників (але не користувачів ChatGPT) з'являється доступ до величезного контекстного вікна у 128 тисяч токенів. Інакше кажучи, модель буде здатна обробити набагато більший обсяг тексту в запиті, ніж існуючі GPT-3.5 і GPT-4 (там найчастіше йдеться про чотири-вісім тисяч токенів; спрощено можна вважати, що один токен дорівнює п'яти буквам тексту англійською мовою і двом буквам українською). До цього анонсу головним конкурентом із порівняно великим контекстним вікном, 100 тисяч токенів, була модель Claude 2 від компанії Anthropic, в яку вклали кілька мільярдів доларів Google та Amazon.