Як відкриті дані допомагають розвитку штучного інтелекту
Україна — одна з лідерів за темпами розвитку сфери відкритих даних у Європі. 2020 року рівень розвитку відкритих даних в Україні був вищим за середньоєвропейський на 6% і становив 84%. Розвиток відкритих даних — один із пріоритетів Мінцифри, адже він є основою прозорої цифрової держави, яку ми будуємо.
3 березня уряд ухвалив історичну постанову для розвитку сфери відкритих даних, яка розширює перелік обов’язкових до публікації наборів даних до понад 100. А сервіси на основі відкритих даних допомагають захиститися від рейдерських атак, перевірити інформацію про потенційних бізнес-партнерів, прогнозувати результати судових справ, виявляти підозрілі й незаконні об’єкти нерухомости. Щомісяця ними користуються від 1,5 до 5 мільйонів українців.
4 березня у світі відзначали Міжнародний день відкритих даних. Тож розповімо про їхню важливість, а також ті можливості, які в поєднанні зі штучним інтелектом відкривають українцям відкриті дані.
Штучний інтелект і галузі застосування
Штучний інтелект (AI) — це здатність комп’ютера розв’язувати завдання, які зазвичай є характерними для людини. Його важливими характеристиками є вміння постійно навчатися та швидко обробляти інформацію. Навчання полягає у вивченні закономірностей, які існують у даних, для вдосконалення результативности роботи. Штучний інтелект — це загальний термін, що об’єднує низку конкретних технологій, таких як машинне навчання, обробка природної мови, комп’ютерний зір і робототехніка.
Розвиток штучного інтелекту бере початок із середини ХХ століття. Однак тривалий час він стикався з різноманітними перепонами. Остання хвиля інтересу до цієї технології виникла з початком 2010-х років. Адже активно почали розвиватись обчислювальні можливості комп’ютерів, з’явилися великі масиви даних, що генеруються соціальними мережами, застосунками, сенсорами й датчиками, удосконалювались алгоритми та їх спрямування на розв’язання практичних проблем.
Сьогодні штучний інтелект використовується для розв’язання низки завдань у бізнесі й урядуванні: прогнозування та вибір найбільш оптимальних рішень, класифікація та пошук інформації, розпізнавання об’єктів на фото та відео, зокрема розпізнавання облич. Крім того, AI використовують для перекладу тексту, розпізнавання голосового мовлення, прокладення маршрутів, прогнозування часу прибуття транспорту та навіть для створення зображень, текстів, музичних творів і відео.
Наприклад, нещодавно празький театр «Шванда» вперше поставив спектакль, написаний штучним інтелектом. Щоб відзначити столітній ювілей із дня першого показу п’єси «R.U.R.», чеський інноватор Томаш Студенік ще 2019 року запропонував створити постанову, написану власне роботом. Він звернувся до експерта з обчислювальних технологій факультету математики та фізики Карлового університету Рудольфа Рози. Науковець написав текст за допомогою мовного модуля з відкритим кодом, створеного дослідницькою компанією Ілона Маска Open AI. Також компанія розробила нейронну мережу DALL · E, яка вміє генерувати картинки за текстом.
Можливості та обмеження штучного інтелекту для сфери відкритих даних
Є три основні підходи, які пов’язують відкриті дані та штучний інтелект. По-перше, відкриті дані використовуються для тренування моделей машинного навчання. Ці моделі потім можуть перетворювати неструктуровану інформацію (зображення, відео, звук) на структуровані дані, які застосовуються для потреб бізнесу або уряду. Наприклад, на основі супутникових знімків стартап OneSoil створив інтерактивну карту, на якій визначено межі сільськогосподарських угідь і типи культур, що вирощуються на них.
По-друге, алгоритми машинного навчання використовуються для передового аналізу відкритих даних. Це дає змогу заощадити час і зусилля людей, а також досягти вищої точности й ефективности аналізу. Адже алгоритми можуть знаходити шаблони в датасетах, робити прогнози, визначати оптимальні рішення й інформувати про їхній вплив. Наприклад, у США програмне забезпечення PredPol дає змогу виявити осередки злочинности й суттєво знизити рівень крадіжок і насильства. Британський застосунок CityMapper використовує АІ для складання оптимальних транспортних маршрутів руху та прогнозування часу прибуття.
По-третє, наявність відкритих даних стимулює зацікавлені сторони до дослідження й використання можливостей штучного інтелекту. Наприклад, Government AI Readiness Index оцінює передумови впровадження штучного інтелекту в публічних сервісах. Індекс містить три основних компоненти: урядову політику, спроможність технологічного сектору, потенціал даних та інфраструктури. У 2020 році до оцінки було залучено 172 країни, серед них і Україну.
Штучний інтелект створює низку нових можливостей для інноваційного використання відкритих даних, але водночас він має низку обмежень:
- якість і повнота даних є критично важливою. Для тренування моделей машинного навчання потрібні великі масиви даних. Датасети можуть містити від кількох сотень до мільйонів і більше записів. А неточні моделі несуть загрозу ухвалення помилкових рішень;
- сфера штучного інтелекту має значний ризик монополізації. Великі корпорації й уряди можуть стримувати розвиток інновацій і підвищувати ризик порушення етичних норм використання даних шляхом обмеження доступу до даних та алгоритмів. Хоча, на думку експертів, стимулювання розвитку штучного інтелекту має передбачати відкритий підхід, який охоплює відкриті дані;
- використання алгоритмів АІ вимагає високої цифрової грамотности. Зміни у вихідних даних можуть зменшити точність прогнозу. Роботу моделі подекуди доводиться перевіряти простішими методами аналізу. Адже інколи модель може надати результат опрацювання вихідних даних, але не може пояснити, чому саме такий результат було отримано.
Штучний інтелект і відкриті дані в Україні
У 2020 році Україна стала лідером у Східній Європі за динамікою розвитку штучного інтелекту, а галузь налічувала понад 150 компаній. Минулого року Україна посідала 57-ме місце серед 172 країн за Індексом готовности уряду до впровадження штучного інтелекту. Найвищу оцінку Україна отримала за доступністю та репрезентативністю даних. Це результат успішного впровадження політики відкритих даних протягом останніх 5 років.
У грудні 2020 року Кабінет міністрів України затвердив Концепцію розвитку штучного інтелекту в Україні, яку розробило Мінцифри. Серед іншого документ визначає низку заходів для підвищення якости відкритих даних:
- визначення напрямів конвертації даних в електронну форму, створення (у разі відсутности) або актуалізація та очищення наявних державних електронних інформаційних ресурсів;
- забезпечення в межах розвитку відкритих даних пріоритетности оприлюднення динамічних даних; оприлюднення таких даних у режимі реального часу через прикладний програмний інтерфейс (API);
- визначення переліку тематичних категорій наборів даних високої суспільної цінности, розпорядниками яких є органи державної влади. Розроблення та затвердження вимог щодо оприлюднення та періодичности оновлення таких наборів;
- розроблення механізмів анонімізації персональних та інших даних під час обробки в системах штучного інтелекту, що унеможливить ідентифікацію осіб.
Алгоритми штучного інтелекту використовуються в Україні для роботи з відкритими даними судового реєстру, виявлення ризиків у публічних закупівлях і моніторингу стану довкілля.
Наприклад, WINCOURT — аналізатор судових рішень, прогнозує результати судових справ і надає користувачам рекомендації на основі чинного законодавства й попередніх судових рішень. Він допомагає отримати всю інформацію, що нині доступна у відкритих реєстрах даних.
UrbanData – вебсервіс, телеграм-бот і застосунок для пошуку й аналітики даних у сфері містобудування. Проєкт надає можливість зручного та швидкого пошуку документів, виявлення підозрілих і незаконних об’єктів нерухомости за реєстрами ДАБІ та в державному земельному кадастрі.
Стартап DeepGreen Ukraine — це сервіс моніторингу лісових насаджень, що використовує відкриті супутникові знімки та дані Держлісагентства. Завдяки цьому він допомагає виявляти незаконні вирубки лісу.
Отже, штучний інтелект у поєднанні з відкритими даними забезпечують створення конкурентної переваги бізнесу та розвиток інноваційних проєктів. А громадяни завдяки цьому отримують сучасні якісні персоналізовані послуги.
Думка редакції може не збігатися з думкою автора колонки.