Спецпроєкти

Українські тусери навчили штучний інтелект говорити українською мовою. Ви можете випробувати його


Розробники із технологічної креативної агенції ISD Group навчили штучний інтелект говорити українською сленговою мовою. Тепер об’єктом дослідження може бути не лише сучасна українська мова, діалекти, сленг, суржик тощо, а й саме українська мова штучного інтелекту.

Креативники створили україномовний штучний інтелект, який генерує ідеї для шалених вечірок.

Як відбувався процес створення?

Розробники створили мовний корпус нейромережі за допомогою відкритих баз словників українських розробників.  Щоб штучний інтелект говорив живою та сленговою мовою, до мовного корпусу додали субтитри до серіалів та фільмів, сучасну українську літературу, блоги, твіти, контент Telegram-пабліків – майже 3 гігабайти обсягу!

Після цього генератор GPT-2 доповнили інструментами, які допомагають генерувати зв’язний текст, що максимально нагадує мову людей: Hugging Face Transformers, PyTorch, LanguageTool.

На першому етапі головним викликом було створити таку модель, яка зможе спілкуватися українською як звичайна людина, – зі сленгом і без цензури. Однак мова – це тільки 20% від усієї системи. Головне правило machine learning – «годувати» мережу тим, що потрібно мати в результаті.

«Ми запропонували користувачам навчити штучний інтелект відриватися, щоб він згодом навчив це робити нас самих – на новому, неймовірному і недоступному раніше рівні», – розповіла Наталія Тачинська, креативна лідерка ISD Group та артдиректорка проєкту.
«На другому етапі ми вирішили піти на експеримент. Не повторювати створення нейтральної системи, штучного порадника, а піти далі і надати йому характеру. Це поганий хлопець, навіть трохи божевільний, який постійно підштовухує своїх друзів на якісь шалені вчинки», – ділиться СЕО та креативний директор isdgroup Віктор Шкурба.

Для цього до збору датасету залучили молодь через відкриті ігрові телеграм-боти. Користувачі давали відповіді на питання та своїми відповідями годували нейромережу, «фаршируючи» її ідеями шалених вривів.

Як зазначають розробники, людське тренування – це 80% її навичок. Потім ця штучна свідомість генерує ідеї з нуля за своєю власною, дещо незбагненною, проте цілком адекватною логікою.

Подивитися, що вийшло, та випробувати перший штучний інтелект, який вміє «говорити» українською, можна тут. 

#bit.ua
Читайте нас у
Telegram
Ми в Телеграмі
підписуйтесь