Google NotebookLM в один клік перетворює будь-який документ на подкаст

У вересні компанія Google представила Audio Overview — новий інструмент сервісу NotebookLM: тепер користувачі можуть перетворити будь-який документ, текст чи посилання на статтю на «залучену аудіодискусію» двох ШІ-ведучих. Оголошуючи про нову функцію, в Google, здається, не розраховували зробити фурор у світі подкастів, але саме так і сталося.

За останній місяць стрімінгові платформи заполонили сотні шоу зроблених за допомогою NotebookLM. Простота сервісу дозволяє за короткий час згенерувати десятки "аудіодискусій", причому програма примудряється створити осмислену розмову буквально з нічого (серед експериментів є навіть десятихвилинний випуск, створений із двох слів - "какати" і "пукати"). Одні подкастери надихнулись новими можливостями, інші побоюються, що їхні послуги не потрібні.

Сервіс NotebookLM, за задумом Google, повинен допомагати користувачам структурувати складну інформацію, виокремлювати головне дослідження, вибирати ключові цитати і так далі. Функція Audio Overview з'явилася як ще один спосіб узагальнити документи та виділити у них найважливіше – у форматі невимушеної розмови двох ШІ-голосів, чоловічого та жіночого.

Щоб створити «аудіодискусію», достатньо завантажити посилання або текст, натиснути кнопку Deep Dive Сonversation — і вже через кілька хвилин система видає аудіофайл з обговоренням вашої теми. При цьому, як зазначає редакційний директор Google Labs Стівен Джонсон, NotebookLM спирається лише на інформацію, яку завантажує користувач, і не шукає додаткового контексту ззовні, що відрізняє систему від інших чат-ботів. Поки «аудіодискусії» працюють у тестовому режимі лише англійською мовою, але завантажувати матеріали можна й іншими мовами.

«Ви можете перетворити на подкаст вашу домашню роботу, щоб послухати її у тренажерному залі. Або взяти засідання міської ради і розповісти про них широкому загалу у форматі подкасту, не витрачаючись на звукозаписну студію», — додає Стівен Джонсон.

«Це одна з найпереконливіших демонстрацій потенціалу штучного інтелекту», — вважає колумніст The Wall Street Journal Бен Коен. І захоплюється тим, що в розмовний формат тепер можна перетворити будь-що: дипломну роботу, нотатки з робочої зустрічі, рецепт лазаньї, чек із магазину чи банківський рахунок.

Користувачі швидко оцінили новий інструмент та почали активно експериментувати з форматом. За допомогою NotebookLM запустили історичний подкаст за мотивами статей «Вікіпедії». Серед інших прикладів епізод, у якому ведучі раптово усвідомлюють, що вони не справжні люди і переживають екзистенційну кризу. А також цілком серйозна дискусія, заснована на файлі зі словами poop і fart («какати» та «пукати»), написаними тисячу разів поспіль.

Чому продукт Google викликав такий ажіотаж?

Програми та різні інструменти з використанням нейромереж у сучасній аудіоіндустрії, зрозуміло, не рідкість. Штучний інтелект застосовують для клонування голосів, дубляжу відеороликів, для монтажу та розшифровок.

NotebookLM виділяється на цьому тлі тим, що, по-перше, це безкоштовно. По-друге, сервісом легко користуватися - подкасти створюються в один клік. По-третє, результат виходить дуже реалістичним — і це головна причина такого неймовірного інтересу до технології.

Google намагається робити розмови ШІ-ведучих схожими на живу розмову. За словами редакційного директора Google Labs Стівена Джонсона, якщо ведучі вимовлятимуть по черзі лише правильно написані речення з ідеального сценарію, ніхто не слухатиме. Тому гуглівські ведучі зупиняються, роблять паузи, перебивають один одного, емоційно дивуються, і вставляють у мову слова-паразити.

Невже подкасти, створені в NotebookLM, такі гарні?

Google попереджає користувачів, що NotebookLM "іноді може давати неточні відповіді" і рекомендує "перевіряти факти самостійно". Тому в «аудіодискусіях», хай вони на перший погляд і звучать дуже переконливо, досі чимало помилок. Ведучі можуть неправильно вимовляти імена, неправильно інтерпретувати завантажені матеріали та висловлювати дивні оціночні судження.

«Чи варто довіряти цій програмі?» — запитує оглядач The Washington Post Джеффрі Фаулер. Серед невдалих прикладів він наводить подкаст, який NotebookLM вийшов за підсумками дебатів кандидатів у віце-президенти США. У цьому епізоді ШІ-ведучі серед іншого заявили, що для демократа Тіма Волза критика на адресу республіканця Дональда Трампа — дуже ризикований хід.

Професор американського Університету Брауна Шрірам Крішнамурті розповів, що прогнав через NotebookLM анотації до своїх наукових робіт. Результат вчений оцінив на «трійку», тому що програма не змогла зрозуміти, на чому зосередитись та які дані виділити.

"Збої відбуваються на рівні узагальнень", - визнає старший менеджер з продукту Google Labs Райза Мартін. Вона пояснює, що ШІ-ведучі намагаються знаходити аналогії, які можуть бути більш менш вдалими залежно від того, наскільки серйозні матеріали завантажує користувач.

«Ви не почуєте від ведучих вигадані відповіді чи нісенітниці ні про що. Але нових ідей чи чогось по-справжньому смішного від них ви теж не дочекаєтесь», — додає колумніст The Wall Street Journal Бен Коен.

Яке майбутнє чекає на сервіс Google?

Детектор "фейкових" подкастів, створених через NotebookLM, який у жовтні запустила компанія ListenNotes, за перші дні роботи виявив уже майже 900 шоу, створених за допомогою штучного інтелекту. Втім, користувачів це не зупиняє, і кількість подкастів ШІ продовжує зростати.

І хоча деякі подкастери вже заявляють, що готові піти з професії, галас навколо нового інструменту Google скоріше нагадує недовгий зліт Clubhouse у 2021 році. Audio Overview - модна і кумедна розвага, але як довго вона буде популярною?

Враховуючи недосконалість алгоритму, автори та слухачі навряд чи повністю перейдуть на подкасти, згенеровані нейромережами, вважає дослідниця в галузі штучного інтелекту Варшита Шер. На її думку люди швидко втомляться на регулярній основі слухати однотипні шоу. «Якщо ви слухаєте епізоди щодня чи щотижня, незлічені аналогії ведучих та їх постійні вигуки „Точно!“ можуть вас втомити», — каже вона.

Втім, подкасти далеко не єдина сфера, в якій може стати у пригоді програма NotebookLM. Оглядач The Washington Post Джеффрі Фаулер бачить тут нові можливості для освіти та досліджень. На його думку, інструмент Google допоможе людям розібратися у наукових публікаціях чи юридичних документах.

Крім того, NotebookLM буде корисним для студентів, які звикли сприймати інформацію на слух, вважає професор Коледжу Сент-Пітерсберг у Флориді Крістіан Моріарті. При цьому він наголошує, що не варто сліпо вірити штучному інтелекту: "Не треба забувати розвивати критичне мислення". А професор Сара Ітон з Університету Калгарі пропонує ставитися до подкастів NotebookLM як до екранізацій класичної літератури: на її думку, це лише один спосіб пояснити людям складну інформацію.