☕️ Кава з пінкоюнотатки про ШІ, технології та творчість
Читати в Telegram →
18 липня 2025 · переглядів у Telegram

AI-моделі провалили українське ЗНО: тест ZNOVision по 13 предметах

AI-моделі провалили українське ЗНО: тест ZNOVision по 13 предметах

ChatGPT та інші ШІ-моделі не склали українське ЗНО

Українські дослідники створили ZNOVision - перший багатоформатний тест для ШІ, який перевіряє знання з 13 предметів ЗНО українською мовою. Результати: жодна з моделей не подолала поріг у 70%.

Найкращий бал — 67,5% у Gemini Pro, GPT-4o набрав лише 47%.

Найбільше проблем було в питаннях із візуальними елементами. Моделі не впізнавали українські слова на зображеннях, плутали одиниці виміру, ігнорували частину умов.

Бізнес Інсайдер

↗ Оригінал поста в Telegram
Довідка

ZNOVision — Перший багатоформатний бенчмарк для тестування AI-моделей на знання з 13 предметів ЗНО українською мовою, включаючи питання з візуальними елементами.

Яку оцінку набрав ChatGPT на українському ЗНО?
GPT-4o набрав лише 47% у тесті ZNOVision — найбільше проблем з питаннями, що містять зображення та українські слова на них.
Яка AI-модель найкраще склала українське ЗНО?
Gemini Pro з результатом 67.5% — найвищий бал серед усіх протестованих моделей, але нижче порогу 70%.

Сподобалось? Це лише один пост. Більше думок про ШІ, технології й творчість — щодня в каналі.

Підписатися в Telegram