Шкільні іспити у Техасі цього року перевірить та оцінить ШІ

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Техаські школярі скоро мають скласти важливий іспит State of Texas Assessments of Academic Readiness (STAAR), але оцінюватимуть їх не педагоги, а штучний інтелект. Тест перевірить велику мовну модель, схожу на GPT від OpenAI. Вчителів усунули не просто так: влада штату планує заощадити $15-20 мільйонів на рік, делегувавши контроль відповідей ШІ.

Витрати на оцінювання школярів — вічна проблема системи освіти у будь-якій країні та регіоні. У Техасі близько $20 мільйонів йдуть лише на тимчасових співробітників для оцінки результатів тесту STAAR, який допомагає зрозуміти, чи діти добре засвоїли шкільну програму.

Техаська агенція з освіти (TEA) зазвичай наймала 6000 вчителів для оцінки тесту, але тепер знадобиться лише 2000. У 2023 році STAAR змінили — прибрали частину закритих питань та класичних тестів з кількома варіантами відповіді, додали більше завдань, у яких потрібно міркувати та писати розгорнуто, аргументувати свою думку. Здавалося б, оцінити таке за допомогою ШІ буде важко, але великі мовні моделі чудово справляються. Крім того, вони перевіряють довгі відповіді в кілька разів швидше за вчителів-людей.

Для розробки системи автоматичної оцінки TEA зібрала 3000 відповідей учнів, які пройшли через 2 раунди перевірки людьми. Цей набір даних дозволив системі вивчити характеристики відповідей. Тепер вона надає ті ж оцінки, які дала б людина.

Цієї весни, коли учні завершать свої тести, комп’ютер спочатку оцінить усі отримані відповіді, а потім надішле чверть із них педагогам для повторної перевірки. Це допоможе уникнути помилок та несправедливості, а також краще натренувати систему.

Якщо ШІ буде не впевнений щодо того, яку оцінку привласнити, відповіді учня будуть автоматично надіслані людині. Те саме станеться, якщо модель зіткнеться з типом відповіді, яку програма не розпізнає, наприклад, з використанням сленгу або слів мовою, відмінною від англійської.

Співробітники TEA щодня переглядають зведення результатів, щоб переконатися, що вони відповідають очікуваним. Окрім спірних відповідей, люди також автоматично отримують випадкову вибірку готових тестів з оцінками ШІ, щоб зрозуміти, чи добре справляється система. У TEA впевнені, що їхнє рішення — це не зовсім штучний інтелект, оскільки роботу моделі не пускають на самоплив, а ретельно контролюють. Крім того, це ПЗ не має можливості навчатися в процесі обробки тестів — для оцінки він завжди покладається на вимоги, встановлені державою.

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Анатолій Шевченко12.04.2024

1 Час читання: 1 хвилина

Читайте далі

Шкільні іспити у Техасі цього року перевірить та оцінить ШІ

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Читайте далі

Доповнена реальність знизила тривожність донорів під час здачі крові

У Китаї запустили перший у світі поїзд метро з вуглецевого волокна

Станція швидкої заміни батареї Ample за 10 хв обслужить будь-який електромобіль (фото+відео)

Кремній доживає останні роки – йому вже знайдена заміна

Найбільші датські міста купуватимуть тільки електричні автобуси з 2021 року

NASA створює цілу когорту нових роботів для дослідження космосу

Японія проведе перші випробування концепції космічного ліфта

Перший супутник, який можна налаштувати у космосі

В Одеській області планується за рік побудувати три сонячні електростанції потужністю 86 МВт

Легко нанести, легко змити: розчинний тіоефірний гідроґель для “закриття” ран

Доповнена реальність знизила тривожність донорів під час здачі крові

У Китаї запустили перший у світі поїзд метро з вуглецевого волокна

Станція швидкої заміни батареї Ample за 10 хв обслужить будь-який електромобіль (фото+відео)

Кремній доживає останні роки – йому вже знайдена заміна

Найбільші датські міста купуватимуть тільки електричні автобуси з 2021 року

NASA створює цілу когорту нових роботів для дослідження космосу

Японія проведе перші випробування концепції космічного ліфта

Перший супутник, який можна налаштувати у космосі

В Одеській області планується за рік побудувати три сонячні електростанції потужністю 86 МВт

Легко нанести, легко змити: розчинний тіоефірний гідроґель для “закриття” ран

Залишити відповідь Скасувати коментар

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Підписуйтеся на нас в Гугл Новини, а також читайте в Телеграм і Фейсбук

Читайте далі

Доповнена реальність знизила тривожність донорів під час здачі крові

У Китаї запустили перший у світі поїзд метро з вуглецевого волокна

Станція швидкої заміни батареї Ample за 10 хв обслужить будь-який електромобіль (фото+відео)

Кремній доживає останні роки – йому вже знайдена заміна

Найбільші датські міста купуватимуть тільки електричні автобуси з 2021 року

NASA створює цілу когорту нових роботів для дослідження космосу

Японія проведе перші випробування концепції космічного ліфта

Перший супутник, який можна налаштувати у космосі

В Одеській області планується за рік побудувати три сонячні електростанції потужністю 86 МВт

Легко нанести, легко змити: розчинний тіоефірний гідроґель для “закриття” ран

Понимание тактической обуви: Необходимые вещи для активных профессий

Применение поисковой рекламы для развития бизнеса и ее важные особенности

Залишити відповідь Скасувати коментар