Дякую за увагу

Чому ми робимо помилки і як ШІ допомагає цього уникнути.

Людям непросто утримувати увагу на кількох речах відразу, і необхідно час від часу відпочивати. При цьому нерідко нам доводиться займатися багатьма справами одночасно і працювати на межі можливостей організму. На допомогу приходить ШІ, здатний швидко обробляти гігантські масиви даних і при цьому помічати найдрібніші деталі. Розповідаємо, як влаштована людська увага, чому ми втрачаємо концентрацію та як алгоритми допомагають уникати помилок там, де це критично важливо, — у медицині.

Ми регулярно звертаємося за допомогою до алгоритмів — наприклад, коли дивимося прогноз погоди, шукаємо квитки або просто хочемо відпочити. Це така ж частина нашого життя, як одяг та взуття, автомобілі та смартфони. Проте штучний інтелект, який так глибоко проник у всі сфери нашого життя, досі може викликати недовіру та страх. 

Від пильності до сконцентрованості

У повсякденному житті під увагою ми, як правило, маємо на увазі зосереджений стан людини - це слово використовується як синонім пильності (vigilance), збудження (arousal) або сконцентрованості (alertness).

Сконцентрованістю у науковій літературі називають конкретний когнітивний стан, у якому людина зосереджена на вирішенні завдання. Однією з ознак такого стану є, наприклад, гамма-ритмічна активність головного мозку.

Коли серед робочого процесу ми втрачаємо можливість зосереджуватися на виконанні завдань, найчастіше йдеться саме про втрату концентрації. Цікаво, що за наявності мотивації цього не лише не відбувається, а й навпаки — концентрація зростає разом із ускладненням завдань.

Наприклад, чим важчі рівні в тетрісі, тим вищий рівень концентрації гравця: на початку гри він ще може вловити, що говорять по телевізору, але зі зростанням складності може і не помітити, коли його називають на ім'я. Цей феномен описаний за допомогою тесту на відповідь слухового відділу мозку. Дослідники показали, що у відповідь на фоновий звук у стовбурі нейронів спрацьовувало менше нейронів, коли завдання було важким, і більше — якщо легким. Інакше висловлюючись, якщо людина працює зі складним завданням, наш мозок компенсує це за рахунок збільшення концентрації — так нам вдається підтримувати бажаний рівень продуктивності. Але чому ми таки втрачаємо увагу, навіть якщо повністю зосереджені на завданні?

У Тетрісі концентрація гравця зростає разом із підвищенням складності гри.

Межі уваги

Найчастіше відповідь на це питання — відсутність реального інтересу. Але існують також і фізіологічні обмежувачі, наприклад, обсяг робочої пам'яті (working memory capacity — WMC). Для того щоб виміряти цей показник, дослідники комбінують завдання запам'ятовування та відволікаючі дії. Відомо, що люди з високим рівнем WMC менше відволікаються на фонові звуки під час виконання складних завдань і краще зберігають концентрацію.

Людська увага та концентрація значною мірою керуються регуляторними центрами сну. До них відноситься, наприклад, супрахіазматичне ядро – головний генератор циркадних ритмів та регулятор виділення мелатоніну в епіфізі. Крім цього, у регуляції концентрації та уваги бере участь дорсолатеральна префронтальна кора. У пацієнтів із синдромом хронічної втоми, одним із симптомів якого є втрата концентрації, обсяг сірої речовини у цьому відділі головного мозку був знижений та успішно відновлювався після когнітивно-поведінкової терапії.

Ключову роль у біохімічній регуляції сну та уваги відводять нейромедіатору аденозину. У процесі роботи мозок розщеплює аденозинтрифосфат (АТФ) – одну з основних енергетичних молекул нашого організму. При цьому утворюються молекули АМФ, які зв'язуються з аденозиновими рецепторами та викликають сонливість. Часто ми намагаємось подолати її за допомогою кофеїну. Він заважає АМФ зв'язуватися з аденозиновими рецепторами та не викликає їх активацію. Ефекту сонливості немає, а наша пильність і концентрація зростають.

Однак насправді регуляція циклів сну та неспання набагато складніша: різні відділи мозку реагують на аденозин по-різному. До того ж існують інші медіатори ЦНС, що впливають на регуляцію сну, наприклад, норадреналін або серотонін.

Необхідна вибірковість

Як правило, у повсякденному житті людину оточує велика кількість сигналів. Наш мозок захищає нас від сенсорного навантаження і не обробляє їх одночасно, і одним із способів захисту мозку можна назвати концентрацію — перерозподіл ресурсів із неважливих елементів на важливі. У психології такий механізм отримав назву селективної уваги. Саме він дозволяє нам успішно орієнтуватися за умов великої кількості інформації.

Найпростішою ілюстрацією селективної уваги можна назвати ефект коктейльної вечірки. Його суть полягає у здатності людини вихоплювати важливу інформацію (наприклад, чути власне ім'я) у потоці шуму. У 1953 році цей ефект був показаний вченим Едвардом Коліном Черрі на авіадиспетчерах, які могли почути голос свого пілота серед гомону всіх інших. Крім того, виборча увага пов'язана із здатністю дітей сприймати інформацію.

Класичний тест на селективну увагу - це тест Денієла Сімонса.

Мультитаскінг головного мозку

У міру розвитку медіа та економіки повсюдною стала медійна багатозадачність. Як правило, людина працює одразу з кількома потоками інформації: перевіряє робочу пошту, слухає музику, переписується у месенджерах. Коммодифікація нашої уваги призвела до розвитку кліпового мислення – сприйняття світу через короткі та яскраві тези.

Для оцінки медійної багатозадачності використовують метрику MMI (Media Multitasking Inventory), яка враховує паралельні взаємодії з різними медіа. У середньому молоді люди проводять близько 7,5 години у медіа, 30 відсотків цього часу займаючись мультитаскингом. Причому час, що проводиться у медіа, зростає з кожним роком. Виявилося, що люди з високим рівнем медійного мультитаскінгу працюють гірше при виконанні завдань, які потребують стійкої уваги, довготривалої та короткочасної пам'яті, терпіння. Більше того, багатозадачність загалом асоційована з підвищеною стомлюваністю та погіршенням якості роботи.

Недоліки мультитаскинга: людям майже завжди потрібно більше часу, щоб виконати завдання, якщо вони паралельно працюють над кількома з них. І роблять вони це з великою кількістю помилок, що підтверджується як даними психологічних досліджень, так і фМРТ.

Уважні алгоритми

Сучасні комп'ютери чудово справляються з кількома завданнями одразу. Обсяг робочої пам'яті комп'ютера (WMC) еквівалентний його оперативній пам'яті (RAM) і в сучасних умовах нічим не лімітований. Крім цього, комп'ютери здатні до реального мультитаскінгу - паралельним обчисленням. Завдяки цьому, не існує жодної обчислювальної задачі, що формалізується, з якою людина б справлялася краще комп'ютера. Проте для виконання специфічних завдань машинам довелося навчитися людському механізму уваги.

Один із процесів, для якого характерна висока концентрація, – це читання. Під час читання ми звертаємо увагу на контекст слів. Наприклад, людина може легко зрозуміти, що в пропозиції «Її коса була довгою і шовковистою» коса — це саме жіноча зачіска, а не сільськогосподарський інструмент. А ось для алгоритмів завдання обліку контексту, з яким люди справляються успішно, тривалий час була серйозною проблемою. Вони не вміли враховувати омоніми, і навіть невеликі відхилення від стандартних фраз із розмовника ставили автоматичний перекладач у глухий кут.

Тому однією з ключових віх у розвитку машинного перекладу можна назвати появу механізму уваги (attention). Принцип його можна описати так: при навчанні моделі з механізмом уваги додається ще одна ідея, яка полягає в тому, що не всі слова, які використовуються в процесі навчання, мають рівну вагу. Алгоритми навчили розуміти, що існують слова, які практично не впливають на зміст речення, наприклад вигуки або слова-паразити. Люди не мають жодних складнощів при аналізі таких пропозицій. Ми розуміємо, що пропозиції «Пішохід переходить дорогу» і «Ну, е-е, пішохід типу переходить щось на кшталт дороги, що б це не означало» несуть практично ідентичне смислове навантаження. При цьому ми не звертаємо уваги на вигуки і аналізуємо тільки ключові слова. Також поводяться і моделі машинного навчання, які використовують механізм уваги.

Так нейронна мережа LSTMN з додатковим шаром уваги читає фразу.

Значна варіація механізму уваги - це механізм self-attention, який дозволяє моделі вивчити закономірності між вхідними даними. Завдяки йому модель здатна розуміти, наприклад, до якого елементу речення відноситься займенник. У міру того, як модель обробляє кожне слово вхідного речення, внутрішня увага дозволяє їй поглянути на інші позиції вхідної послідовності та знайти підказку, яка допомагає краще закодувати те чи інше слово.

Коли людина дивиться на зображення, її погляд фокусується на окремих його частинах, які потім збираються мозком у єдину картинку. Рухи очей людини фіксуються за допомогою спеціальних приладів – айтрекерів. Відомо, наприклад, що рухи та фокус очей змінюються у професійних спортсменів у порівнянні зі спортсменами-аматорами. Такі обмеження не схильні для комп'ютера. При аналізі зображень він сприймає всю картинку цілком. Зображення при комп'ютерному аналізі подається у вигляді числової матриці, де кожен піксель охарактеризований своїм вектором кольору - наприклад, в класичній RGB-палітрі червоний піксель - це вектор з координатами [255, 0, 0]. Завдяки принципово іншому уявленню даних комп'ютери здатні одночасно аналізувати всю картинку цілком і пропускати деталі, які може помітити людина. На деяких завданнях аналізу зображень комп'ютери вже показують результат краще за людський.

Нарешті, існує закономірність, завдяки якій перевага машин стає лише питанням правильної формалізації: якість виконання завдань комп'ютером з часом тільки зростатиме. Людина має кінцеві можливості: обсяг її робочої пам'яті, здатність до концентрації та якість виконання завдань — константи, які майже ніяк не змінюються з кожним наступним поколінням. На відміну від людей, кожна наступна модель машинного навчання може використовувати дані, отримані з попередньої моделі, а до стадії реального використання добираються тільки ті моделі, які показали себе краще за попередні. Саме тому кожен лікар, який випуститься з медичного університету, в середньому так само добре проводитиме діагностику, як і попередній, але кожна комп'ютерна модель, яка буде створена і доведена до стадії використання, працюватиме краще за своїх попередників.

Робота для комп'ютера

Як ми з'ясували, люди постійно втрачають концентрацію і це нормально. Такою є наша природа. Але, на відміну від нас, нейромережі здатні працювати навіть із рутинними завданнями з постійною «увагою». І поки люди потроху звільняються від виконання простих, але трудомістких обов'язків там, де рутини не уникнути, їх замінюють алгоритми.

Одна з індустрій, де людська увага відіграє ключову роль, — це охорона здоров'я. Інновації, пов'язані зі штучним інтелектом, дістаються туди відносно повільно — там, де йдеться про життя та здоров'я людини, необхідно миритися із суворим державним регулюванням. Проте навіть у такій консервативній галузі існують розробки, які вже використовують переваги цифровізації та машинного навчання, щоб допомагати лікарям щодня.

Так, наприклад, перспективною галуззю вважається лабораторна автоматизація — створення роботів, які допомагають вченим з виконанням щоденних завдань. Цим займаються як великі компанії, наприклад, Thermo Fisher Scientific — найбільший виробник реагентів і витратних матеріалів, так і зовсім невеликі стартапи на кшталт Andrew Alliance.

Ще одне завдання, яке під силу штучному інтелекту, - це аналіз зображень. Згідно з останніми даними, алгоритми глибокого навчання справляються з цим не гірше, а іноді й краще за людей. Наприклад, сервіс MDDC Cardio, розроблений ОщадМедШІ, аналізує кардіограми і дозволяє швидше провести розшифровку ЕКГ, а «КТ Інсульт» розмічує на КТ-знімках голови зони порушеного кровообігу, які зустрічаються при інсульті, та допомагає оцінити завдані збитки. Мета таких алгоритмів, крім іншого, мінімізувати ймовірність лікарської помилки.

На жаль, при великому навантаженні навіть найдосвідченіші фахівці можуть помилятися. У зв'язку з цим активно розвиваються системи підтримки прийняття лікарських рішень (СППЛР). Мати альтернативне джерело інформації корисно, особливо якщо це програма, яка працює з масивом даних про пацієнта та великою базою даних про патології. Помічник лікаря «ТОП-3» аналізує інформацію, яку вводить лікар на прийомі з електронної картки або анамнезу пацієнта, та пропонує три найбільш ймовірні діагнози. Деякі наукові групи та компанії займаються діагностикою захворювань за гістопатологічними зображеннями.

Heatmap з прогнозами моделі на основі архітектури Inception-v3 для гістопатологічних зображень аденокарциноми шлунка.

Згідно з даними одного дослідження, яке провели експерти у сфері онкології та гематології, глибока нейромережа, навчена на вибірці з 60 тисяч унікальних зображень, вміє виявляти понад 100 типів клітин крові та кісткового мозку, характерних для різних типів лейкемії. Дослідники дійшли висновку, що медіанна точність виявлення варіюється від 83 до 95 відсотків залежно від типу клітин.

Колектив «Третя Думка» розробив та застосовує пул із дев'яти різних ШІ-сервісів, які об'єднані у мультимодальну платформу. Нейромережі аналізують як традиційні модальності, такі як рентген та КТ органів грудної клітки, та екзотичні за сучасними мірками види досліджень – знімки зубощелепної системи (ортопантомограми) та очного дна. Останні перевіряють щодо наявності ознак глаукоми, діабетичної та гіпертонічної ретинопатії.

Максим Папук, лікар-рентгенолог, розповідає:

«ШІ-алгоритми постійно ускладнюються, а їх компетенції розширюються. Наприклад, ШІ-сервіс розробників „Третя Думка“, який раніше використовувався для виявлення ознак пневмоній та інших COVID-асоційованих уражень на КТ грудної клітки, тепер навчили розпізнавати ще й ознаки серцево-судинних патологій: за наявністю та обсягом коронарного кальцію можна судити про атеросклеротичне ураження судин серця, певний обсяг кардіального жиру може бути предиктором кардіоваскулярного ризику, а діаметр грудної аорти говорити про аневризм аорти. Всі ці ознаки обслуговування комп'ютерного зору вже може розпізнавати на серйозному рівні».

Час на емпатію

Завдяки штучному інтелекту лікарі можуть берегти сили та приділяти увагу дійсно важливим речам, наприклад, спілкуванню з пацієнтами. За даними Інституту досліджень державної політики, застосування ШІ та високих технологій дозволить звільнити понад 25 відсотків часу лікарів (важливо: найрізноманітніших клінічних спеціальностей), який можна буде витратити на роботу з хворими.

Не варто переоцінювати можливості штучного інтелекту: машинне навчання – помічник, а не заміна лікаря. В основі відносин між пацієнтом та лікарем лежать у тому числі емпатія та чуйність —  те, що алгоритми ніколи по-справжньому не освоїть. На думку професора молекулярної медицини, кардіолога та дослідника Еріка Тополя, роботу з інформацією про медицину та пацієнтів потрібно передавати алгоритмам. На лікарів лягає обов'язок контролювати результат їхньої роботи, що потребує високої кваліфікації, але основною навичкою медика має бути розвинений емоційний інтелект, уміння спілкуватися з людьми.

У книзі «Штучний інтелект у медицині» Тополь пише:

«Якщо ви коли-небудь відчували по-справжньому сильний біль, то знаєте, якою самотньою і покинутою почувається при цьому людина: адже ніхто не розуміє, як їй насправді, який невимовний розпач її захльостує. Звичайно, вас може заспокоїти кохана людина, друг чи родич, і це, безперечно, допоможе. Але куди надійніше допоможе хворій страждущій людині підтримка з боку лікаря, якому він довіряє і який зміцнює його віру в те, що все минеться, що лікар завжди буде поруч, що все буде добре. Саме такої людської участі, людської турботи ми прагнемо, коли хворіємо. Саме ці стосунки може допомогти відновити штучний інтелект».

Читайте также


Выбор редакции
up