На основі мовної моделі держава створюватиме ШІ-продукти – для зручності громадян і покращення внутрішніх процесів. Так, Мінцифра планує запустити AI-асистента в Дії, інструменти для аналізу законодавства, а також сервіси в Мрії для формування індивідуальних освітніх траєкторій для школярів. Усього в роботі WINWIN AI Center of Excellence при Мінцифрі, який займається розробкою AI-рішень для міністерства, понад 10 продуктів.

Українська LLM даватиме точніші відповіді, ніж глобальні моделі, бо буде додатково натренована на українських даних. Вона краще розумітиме мовні особливості й добре орієнтуватиметься в темах, пов’язаних з українською історією, культурою та суспільним досвідом. 

Національна LLM дає змогу зберігати й обробляти дані всередині країни, що критично важливо для безпеки у сфері оборони, державних установ, медицини та фінансів. Модель забезпечить захист персональних даних і національної безпеки України при інтеграції AI в різні сектори.

Мінцифра координуватиме процес розробки моделі та формуватиме технологічну й етичну візію створення LLM. Зокрема, створить усі ключові структури для якісної розробки моделі – координаційний комітет й етичний та технічний борди.

Координаційний комітет відповідатиме за візію і стратегію розробки. До нього увійдуть представники Мінцифри, WINWIN AI Center of Excellence, інших профільних державних інституцій, Київстару, технічного та етичного бордів. Етичний борд відстежуватиме відповідність законодавству та етичність моделі. Технічний борд відповідатиме за архітектуру, тренування моделі на даних тощо. Розробкою моделі займатиметься проєктний офіс, сформований компанією Київстар як операційним виконавцем розробки моделі.

Мінцифра забезпечуватиме збір даних для навчання моделі, для чого залучатиме державні та приватні інституції – університети, наукові структури, національні бібліотеки й інтелектуальні фонди. До навчання залучатимуть дані з відкритих джерел українською мовою, зібрані в датасетах. Персональні дані, дані з реєстрів та будь-яку іншу чутливу інформацію для pre-training не використовуватимуть. 

Стратегічним партнером держави у створенні національної LLM став Київстар – національний оператор електронних комунікацій. Компанія активно інвестує в нові технології та цифрові сервіси, має глибоку експертизу у сфері ШІ та інтегрує AI-рішення в довгострокову стратегію технологічної трансформації. Київстар поєднує мовні моделі та сучасні RAG-системи (Retrieval Augmented Generation) з реальними бізнес-процесами, сервісною підтримкою та аналізом даних, дотримуючись високих стандартів безпеки й етики.

Київстар має прямий доступ до міжнародного досвіду через материнську компанію VEON, яка вже реалізувала успішні національні AI-проєкти. Київстар стане надійним технологічним партнером на старті, допоможе забезпечити швидкий запуск і створити LLM, максимально адаптовану до мови й культури України.

Використання українськомовної моделі коштуватиме дешевше для українських користувачів порівняно з англомовними аналогами. Після розробки та тестового періоду модель стане власністю держави. З моменту готовності LLM держава одразу матиме до неї доступ для безоплатного використання.

Поява українськомовної LLM сприятиме появі нових AI-стартапів, залученню міжнародних інвестицій у країну та підвищуватиме ВВП завдяки розробці AI-рішень для різних секторів економіки.

Основа для національної моделі – одне з open-source рішень, без залучення державних коштів. Першу версію моделі планують запустити до грудня 2025 року.

До розробки можуть долучитися лінгвісти, науковці та ML-розробники. Щоб стати частиною проєкту, пишіть на пошту ai@thedigital.gov.ua.

За матеріалами Міністерства цифрової трансформації України.