Дослідники з Массачусетського технологічного інституту розробили систему прогнозування, яка працює з будь-якими рядами тимчасових даних і доступна для використання неспеціалістами. Результати експериментів показали, що використовувані алгоритми ефективніше існуючих методів глибокого машинного навчання в передбаченні майбутніх значень різних показників і заповненні відсутніх даних.
Прогнозування значень показників, що змінюються з часом, таких, наприклад, як погода, ціна на акції або ризик розвитку захворювання, здійснюється на основі аналізу історичних даних. Щоб побудувати якісний прогноз, як правило, потрібно використовувати складні алгоритми машинного навчання. Такі алгоритми важко застосовувати неспеціалістам.
Щоб зробити інструменти прогнозування доступнішими, програмісти з Массачусетського технологічного інституту (МТІ) розробили систему, яка інтегрує функції прогнозування поверх існуючої бази даних часових рядів. Спрощений інтерфейс системи tspDB виконує все складне моделювання без участі користувача.
Користувачеві системи досить натиснути кілька клавіш, щоб отримати прогноз. При цьому розрахунок майбутніх значень здійснюється в середньому за 0,9 мс, відзначають автори. Для того, щоб неспеціаліст зміг прийняти рішення, система також розраховує довірчі інтервали, враховуючи ступінь невизначеності прогнозу.
“Одна з причин успіху tspDB полягає у використанні нового алгоритму прогнозування часових рядів. Наш алгоритм особливо ефективний при аналізі багатовимірних часових рядів, тобто даних, що містять більше однієї змінної, залежної від часу. Наприклад, в базі даних погоди температура, точка роси і хмарність залежать від своїх минулих значень”, – говорить Абдулла Аломар, аспірант факультету електротехніки та інформатики МТІ, співавтор розробки.
- Звуковий шум зменшив ризик зіткнення птахів з високими вежами
- Експерти назвали продукти, яких краще уникати
В якості основи для свого алгоритму дослідники взяли аналіз сингулярного спектра (SSA). З використанням цього методу можна обчислювати значення і будувати прогнози на основі окремих часових рядів. Програмісти з МТІ допрацювали алгоритм, щоб виключити необхідність ручного налаштування змінних.
Друга і ключова проблема, за словами розробників, полягала в тому, щоб адаптувати цей метод для аналізу декількох часових рядів. Рішення, запропоноване дослідниками, полягало в тому, щоб “скласти” матриці окремих часових рядів в одну велику матрицю, до якої може бути застосований SSA. Свій метод розробники назвали mSSA. Детальний опис дослідження і алгоритму вчені раніше опублікували в статті на ArXiv.
Вчені порівняли mSSA з іншими сучасними алгоритмами, в тому числі методами глибокого навчання, на реальних наборах тимчасових даних, що описують електромережі, дорожній рух і фінансові ринки.
За словами дослідників, результати тестування показали, що їх алгоритм перевершив всі альтернативи по відновленню пропущених минулих даних і всі альтернативи крім однієї в прогнозуванні майбутніх значень. Розробники також показали універсальний характер алгоритму: він може однаково ефективно застосовуватися до будь-яких часових рядів.
Дослідники кажуть, що продовжать вдосконалювати tspDB, додаючи в неї нові алгоритми, які ще більше підвищать точність прогнозів.
“Ми зацікавлені в тому, щоб зробити tspdb широко використовуваною системою з відкритим кодом. Аналіз часових рядів дуже важливий, а вбудовування функції прогнозування безпосередньо в базу даних здається нам найбільш зручним способом аналізу. Такого раніше ніколи не робили, і тому ми хочемо переконатися, що світ використовує наше рішення”, – говорить Деваврат Шах, професор факультету електротехніки та інформатики МТІ, співавтор розробки.