Робоча група з математичного моделювання проблем, пов’язаних з епідемією коронавірусу SARS-CoV-2 в Україні,
базова установа – Інститут проблем математичних машин і систем НАН України
Створена Розпорядженням Президії НАН України від 3 квітня 2020 р. № 118
Прогноз
розвитку епідемії COVID-19 в Україні у період
17–27 липня 2020 року
«Прогноз РГ-12»
17.07.2020
Із початку квітня 2020 року міжвідомча Робоча група (РГ) представників Національної академії наук України, Київського національного університету імені Тараса Шевченка та Національної академії медичних наук України – з урахуванням світового досвіду математичного моделювання розвитку епідемії COVD-19, на основі статистичних даних про динаміку епідемії в Україні та країнах Європи – створювала і тестувала математичну модель SEIR–U. За результатами проведеного моделювання Робоча група підготувала документи
«Прогноз розвитку епідемії коронавірусу SARS-CoV-2 в Україні». Президія НАН України офіційно представила прогнози до державних органів. На ці прогнози надавав посилання Кабінет Міністрів України під час брифінгів.
У новому документі «Прогноз РГ-12»:
• здійснено аналіз первинних статистичних даних розвитку епідемії в Україні;
• порівняно статистичні дані з попереднім прогнозом «Прогноз РГ-11»;
• представлено прогноз розвитку епідемії на наступний період 17 – 27 липня 2020 р.;
• проаналізовано динаміку поширення епідемії в регіонах України.
1. Аналіз статистичних даних щодо розвитку епідемії COVID-19 в Україні.
Робоча група аналізу використовує такі джерела даних:
1. Дані щоденних звітів Міністерства охорони здоров’я (МОЗ)України. Дані про кількість нових виявлень, одужань, летальних випадків і підозр для кожної області України оприлюднюються на щоденних брифінгах МОЗ, а також
на сайті Ради національної безпеки і оборони (РНБО) України.
2. Первинні дані Центру громадського здоров’я Міністерства охорони здоров’я (ЦГЗ МОЗ) України. До робочої групи надійшли статистичні дані від ЦГЗ МОЗ України станом на 15 липня 2020 року. Опис структури даних та їх інтерпретацію наведено у попередньому документі
«Прогноз РГ-9» від 26.06.2020 р.
3. Дані
Національної служби здоров’я України (НСЗУ) оновлюються щодня і містять дані про госпіталізації по кожній лікарні України.
На рис.1 показано динаміку зміни кількості нових інфікованих, нових одужалих і нових активних інфікованих за день згідно зі щоденними звітами МОЗ України для України в цілому.
Рис.1. Кількість нових зареєстрованих випадків за день в Україні згідно з даними МОЗ України; кількість осіб, які видужали за день; кількість нових активних інфікованих. Для відображення використовувалося зважене рухоме середнє з вікном 7 днів |
Із рис.1 видно, що середня кількість нових активних інфікованих (тих, хто не одужав) досягла нульової позначки 10 липня, коли було досягнуто рекорду з кількості видужалих. Кількість нових одужалих припинила різке зростання, що спостерігалося протягом останніх двох тижнів, і знову демонструє тижневі коливання. Середня за тиждень кількість нових інфікованих на 17.07.2020 р. становить 745 нових інфікованих на день для України. Середня за тиждень кількість нових летальних випадків на 17.07.2020 р. становить 16 нових смертей на день, що на 3 летальних випадки у середньому менше, ніж за попередній тиждень.
Рис.2. Кількість тестів на день на одного виявленого нового інфікованого згідно зі щоденними звітами МОЗ України. Показано кількість ПЛР-тестів і сумарну кількість ПЛР- та ІФА-тестів |
На рис.2 показано кількість тестів на день, віднесену до кількості нових виявлень за день згідно зі щоденними звітами МОЗ України. Із графіка випливає, що зростання кількості тестів, яка витрачається на одного нового інфікованого, зупинилося на рівні близько 15 тестів на одне виявлення.
Дані, наведені на рис.1, відображають інформацію на момент її оприлюднення. Тоді як інформація у даних ЦГЗ МОЗ України та НСЗУ наводиться зведеною до фактичних дат реєстрації, госпіталізації, одужання чи смерті. Графіки на рис.3-6 показують різницю між оприлюднюваними та фактичними даними, що сумарно збігаються, але можуть мати зсуви в часі.
Рис.3. Порівняння даних про щоденну кількість нових виявлень, зведу до дати оприлюднення (чорна крива) та дати реєстрації випадку (синя крива). Дані відображено згладженими 7-миденним рухомим середнім |
Рис.4. Порівняння даних про щоденну кількість нових летальних випадків, зведену до дати оприлюднення (чорна крива) та дати настання смерті (синя крива). Дані відображено згладженими 7-миденним рухомим середнім |
Рис.5. Порівняння даних про щоденну кількість нових госпіталізацій, зведених до дати оприлюднення (чорна крива) та дати настання смерті згідно з даними НСЗУ (синя крива) та даними ЦГЗ МОЗ України (червона крива). Дані відображено згладженими 7-миденним рухомим середнім |
Рис.6. Порівняння даних про щоденну кількість нових одужань, зведених до дати оприлюднення (чорна крива) та дати настання смерті (синя крива). Дані відображено згладженими 7-миденним рухомим середнім |
З рис.3-6 видно, що дані про нові виявлення за день і нові летальні випадки після рухомого осереднення добре узгоджені одне з одним. Можна зробити висновок, що дані про нові виявлення та смерті оприлюднюються з невеликими затримками і в середньому адекватно відображають реальну динаміку. Дані про госпіталізації та про нових одужалих мають суттєві відмінності. Зазначимо, що ми аналізували госпіталізації та одужання тільки осіб із підтвердженим діагнозом. Станом на 15 липня було госпіталізовано всього близько 14 тисяч осіб із підтвердженим діагнозом. Крім цього, ще близько 17 тисяч осіб було госпіталізовано з підозрою на коронавірус, але, зрештою, діагноз не підтвердився.
На інформаційній панелі НСЗУ відображається сумарна кількість госпіталізованих як із підтвердженим діагнозом, так і з підозрами.
Із рис.5 видно, що на початковій стадії розвитку епідемії (березень–квітень) інформація про госпіталізації оприлюднювалася зі значними затримками. Це призвело до того, що середньотижневе значення нових госпіталізацій, яке оприлюднювалося, піднялося до 200 людей в день на початку травня (рис.5, чорна крива). А насправді максимум госпіталізацій припав на другу половину квітня і середня кількість госпіталізацій не перевищувала 150 людей на день. Із початку червня дані узгодилися між собою, різницю в останні тижні можна пояснити затримкою у наповненні реєстру. На даних, зведених до дати госпіталізації, видно, що поточний рівень госпіталізацій уже значно перевищив максимум кінця квітня.
Якщо проаналізувати дані, які щодня оновлюються на інформаційних панелях НСЗУ, то можна знайти як кількість нових одужалих розподіляється за попередніми датами. На рис.7 показано осереднений розподіл кількості нових видужалих за величиною затримки в оприлюдненні. Тобто офіційне повідомлення про одужання може надійти зі значною затримкою відносно дати виписки.
Рис.7. Розподіл імовірності періоду часу від одужання (виписки) хворого до офіційного оприлюднення. Розподіл ґрунтується на статистиці інфікованих, які одужали в період 2–15 липня |
Із рис.7 випливає, що третина всіх одужалих потрапляє до офіційної статистики на наступний день, іще третина має затримку від одного дня до двох тижнів, а ще третина – затримку від двох тижнів до двох місяців. Розподіли, подібні до представленого на рис.7, можна побудувати для видужалих, про яких повідомляється щодня. Ці розподіли за кожень день досить подібні, але поступово еволюціонують у часі. Щоб продемонструвати їх зміну в часі, ми побудували середній час затримки повідомлення про одужання залежно від дати оприлюднення.
Рис.8. Середній час затримки від одужання (виписки) до оприлюднення. Дані відображено згладженими 7-миденним рухомим середнім |
Із рис.8 видно, що середня затримка оприлюднення кількості видужадлих становила кілька днів наприкінці квітня і поступово зростала з часом. На цей момент середня затримка становить близько 14 діб, а максимальна може перевищувати два місяці.
Структура випадків інфікування за датами та результатами хвороби. Летальність і її вікова структура
Структуру випадків інфікування за датами та результатами хвороби зображено на рис.9. При цьому області, що відповідають за одужання й летальні випадки, додаються, а отже, вся біла область, що лишається під синім графіком, – це випадки, щодо яких немає позначок про те чи інше завершення хвороби.
Рис.9. Розподіл випадків за результатами хвороби, поданий за датами реєстрації випадків |
Оскільки відомими є всі дати реєстрації летальних випадків серед хворих, для кожного дня можна знайти «спостережувану летальність» як відношення летальних випадків до всіх випадків. Такий розрахунок для згладжених даних виконано на рис.10. Зважене 7-денне згладження виконується з вагою 5%, 10%, 20%, 30%, 20%, 10%, 5%.
Рис.10. Розподіл випадків за результатами хвороби, поданий за датами реєстрації випадків |
Падіння нижче 1% для найактуальніших даних слід пов’язувати із часовою затримкою між реєстрацією випадку та його летальним результатом. Проте дані більш ніж двотижневої давнини можна вважати відносно надійними, і вони свідчать, що летальність серед виявлених випадків має тенденцію до зниження. Можливі причини цього явища – зростання ефективності виявлення хворих, зростання ефективності їх лікування або інші чинники.
На рис.11 подано порівняння летальних випадків за датами реєстрації хвороби та за датами смерті. Для розуміння контексту наводиться графік числа нових хворих із використанням правої шкали.
Рис.11. Зважене 7-денне середнє, побудоване для летальних випадків за датою реєстрації хворих і за датою смерті (ліва шкала), порівняно із загальною епідемічною динамікою (нові випадки хвороби, права шкала) |
Криві смертності, впорядковані за різним способом датування, добре збігалися протягом останнього місяця (за винятком останніх двох тижнів), що вказує на досягнення рівноваги. А отже, значне зростання денного числа летальних випадків упродовж наступного тижня малоймовірне.
На рис.12 зображено розподіл випадків хвороби за віком хворих, а також результат хвороби у разі наявності інформації про нього.
Рис.12. Вікова структура хворих за результатами хвороби |
На рис.13–14 зображено відношення числа летальних випадків до всіх випадків (червона крива) та до завершених випадків (зелена крива). Задля згладження при розгляді конкретного віку до даних застосовано рухоме зважене усереднення з вагою 25%, 50%, 25%. На рис.13 розглянуто віковий діапазон від 0 до 100 років, а на рис.14 – діапазон до 50 років.
Залежно від способу обрахунку, спостережувана летальність виявляється меншою відповідно за 0,5% та 1% для хворих віком до 40 років. Найбільшого значення вона набуває для пацієнтів віком близько 90 років, становлячи відповідно близько 30% та 45%, залежно від методу обрахунку. Аномальне падіння на графіку в районі 97-98 років спричинене слабким представленням даних: зафіксовано лише кількох хворих, старших за 96 років.
Рис.13. Спостережувана летальність за віком |
Рис.14. Спостережувана летальність за віком (серед інфікованих віком до 50 років) |
2. Порівняння з прогнозом від 10.07.2020 р.
Таблиця 1. Порівняння прогнозних значень кількості нових інфекцій від 10.07.2020 р. для кожної області України зі спостережуваними середніми за тиждень значеннями
У таблиці 1 наведено прогнозні інтервали, обчислені в «Прогнозі РГ-11» від 10.07.2020 р. для кожної області України, та дані спостережень на 17.07.2020 р., усереднені за тиждень. Із таблиці видно, що в цілому дані відповідають прогнозу. Майже всі області потрапили до прогнозованого інтервалу, незначне перевищення очікувань відбулося в Вінницькій та Чернівецькій областях. Львівська область лежить на верхній межі прогнозного інтервалу – це означає що динаміка у ній знову має тенденцію до зростання. Закарпатська область виявилася незначно кращою за нижню межу інтервалу, в ній триває стабільне згасання. По Україні в цілому середня кількість нових випадків відповідає прогнозованому середньому значенню, загалом країна має нейтральну тенденцію.
3. Прогноз розвитку епідемії в Україні на 17–27 липня 2020 р.
Обчислення прогностичних змінних здійснюються для окремих регіонів, а не для України в цілому, а значення для всієї країни обчислюються як сума всіх її регіонів. На рис.15–17 показано середні результати прогнозів для областей України на період до 27 липня. Прогнози не враховують впливу зміни кількості тестувань, кількості підозр і рішень щодо змін карантинних обмежень. При обчисленнях вважалося, що репродуктивне число та коефіцієнт летальності залишаються сталими впродовж прогностичного періоду. Репродуктивне число й коефіцієнт летальності обчислювалися з алгоритму калібрування математичної моделі, а для прогнозного сценарію використовувалися середні значення за останній тиждень.
Рис.15. Прогнозні криві кількості нових інфікованих за день для регіонів України, розраховані на період 17.07–27.07 2020 р., порівняно зі статистичними даними МОЗ України за передпрогностичний період (26.03–17.07.2020 р.) |
Рис.16. Прогнозні криві кількості нових летальних випадків за день для регіонів України, розраховані на період 17.07–27.07 2020 р., порівняно зі статистичними даними МОЗ України за передпрогностичний період (26.03–17.07.2020 р.) |
Рис.17. Прогнозні криві кількості нових активних випадків за день для регіонів України, розраховані на період 17.07–27.07 2020 р., порівняно зі статистичними даними МОЗ України за передпрогностичний період (26.03–17.07.2020 р.) |
Для врахування можливої зміни у часі кількості контактів додатково розглянуто два сценарії для кожної області: з поступовим збільшенням рівня контактності на 25% і зменшенням на 25%. Зміна відбувалася поступово протягом тижня. У таблиці 2 наведено прогнозні середні рівні виявлення нових інфікованих на день і діапазон їхніх значень на 17 липня 2020 р. Наведено також оцінку середнього за тиждень значення репродуктивного числа для кожного регіону, що використовувалося для обчислення прогнозу.
Таблиця 2. Прогнозні значення нових інфікованих за день для регіонів України та поточна оцінка репродуктивного числа на 10.07.2020 р.
Згідно із розглянутими сценаріями, регіонами з найбільшою очікуваною кількістю інфікованих є Львівська, Закарпатська області та Київ.
Якщо додати результати моделювання по всіх регіонах, то для України в цілому отримаємо такі числові показники:
Репродуктивне число – 0.97 (середнє за останній тиждень, має незначну тенденцію до збільшення)
Кількість нових інфекцій за день на 27.07: [518-1050] при середньому значенні 763
Кількість нових летальних випадків за день 27.07: [13-17] при середньому значенні 15.
Рис.18. Зміна в часі репродуктивного числа згідно з калібруванням математичної моделі SEIR-U |
На рис.18 показано зміну в часі репродуктивного числа для України в цілому, що отримано в результаті калібрування математичної моделі на статистичних даних. Із середини червня коефіцієнт репродукції мав стійку тенденцію до зниження. На початку липня (1–10 липня) коефіцієнт репродукції тримався на приблизно постійному рівні – близько 0.95. У період 10–17 липня коефіцієнт репродукції зріс до 0.99, середньотижневе значення сягнуло 0.97. При прогнозуванні тенденція до зміни репродуктивного числа не враховувалася. Прогнозні сценарії обчислювалися зі сталим середньотижневим значенням репродуктивного числа.
ВИСНОВКИ
1. Дані про кількість госпіталізацій і кількість одужалих можуть оприлюднюватися зі значними затримками відносно фактичних дат. Середня затримка оприлюднення кількості госпіталізацій на цей момент становить близько двох тижнів (рис.7,8).
2. Частка летальних хворих згідно зі статистичними даними має стійку тенденцію до зниження і на цей момент становить близько 1% (рис.10). Дані можуть уточнюватись, оскільки ще не всі випадки є завершеними.
3. Статистика по Україні за останній тиждень демонструє нейтральну тенденцію. Репродуктивне число для України в цілому коливається близько одиниці, середньотижневе значення – 0.97 (рис.18).
4. Стійку тенденцію до зростання кількості нових випадків демонструють Вінницька, Івано-Франківська, Одеська, Харківська області та Київ (таблиця 2).
5. Кількість ПЛР-тестів на кожне нове виявлення тримається на постійному рівні – близько 15-ти тестів на одне нове виявлення (рис. 2).