Статті

Чому варто ухвалювати рішення на базі даних і де їх взяти

Автор – Руслан Мініч, журналіст Центру спільних дій

Південнокорейська столиця Сеул вже давно навчилася підходити “з розумом” до вирішення проблем містян. У 2013 це місто впровадило “розумну мережу” нічних автобусів, яка всього лиш дев'ятьма маршрутами змогла забезпечити дешевим громадським транспортом 42% жителів. Також завдяки аналізу даних та місто впроваджує рішення, які зменшують кількість дорожніх аварій за участі пішоходів старшого віку.   

В той же час українська влада як національна так і місцева не часто використовує дані при формуванні нової політикиБа більше, їх навіть не завжди збирають.  

Наразі в Україні як уряд так і окремі органи самоврядування впроваджують багато змін в найрізноманітніших сферах від освіти і охорони здоров'я до транспортної інфраструктури та ринку землі Але як громадянам оцінити, наскільки дії влади є ефективними та чи діє влада в інтересах громадян в процесі реформ Для цього потрібні відкриті дані.  


Дешеве латання ям чи капітальний ремонт доріг: що економніше

У Івано-Франківську в 2019 році на капітальний ремонт доріг виділили на 34% менше коштів ніж в 2017-му  їх перекинули на поточний (ямковий) ремонт. Це створює для виборців ілюзію того, що дороги у місті завзято ремонтують. І в результаті  мер Руслан Марцінків має чималупідтримку мешканців міста,”  наводить приклад неефективної трати коштів аналітик Центру спільних дій Костянтин Шокало 

Разом з колегою аналітикинею Марією Квіцінською напередодні місцевих виборів, які відбудуться 25 жовтня, вони спробували проаналізувати  ефективність дій місцевої влади в обласних центрах  у семи сферах — освіта, медицина, екологія, житлово-комунальне господарство, соціальна сфера, громадський бюджет, дороги та транспорт. 

Проте у процесі дослідження вони зіштовхнулися з браком даних для аналізу. Завдяки OpenBudget кожен може побачити доходи та видатки своєї громади з розподілом по різних сферах. Утім, для оцінки ефективності витрат цього недостатньо. Наприклад, для оцінки ефективності витрачених коштів у сфері житлово-комунального господарства потрібно розуміти, скільки було відремонтовано дахів, теплотрас, водопроводів, електромереж, а не просто знати суму загальних витрат на сферу ЖКГ. Проте не всі міста, навіть великі, публікують таку статистику. Більше того, не всі готові її надати навіть на запит. 

Я надсилав запити на дані по індикаторах, які були в цільових програмах міст. У більшості випадків даних я не отримав, хоча міськради зобов’язані їх мати. Виникає питання, чому різні міста надсилають різні обсяги інформації. Можливо, вони не хочуть звітуватися про виконання програм, бо немає чим похизуватись, або потрібно приховати якісь дані. Або вони просто не збирають відповідну статистику, хоча мали би,”  додає Костянтин. 

Відповіді на запити від міськрад, які вони зобов’язані надати згідно з законом про доступ до публічної інформації, часто надходять із запізненням у місяць, або у форматі pdf, коли ти навіть скопіювати не можеш і маєш вручну переносити всі цифри до таблиці. Бувають випадки, коли на пошту приходить відсканована таблиця у настільки поганій якості, що взагалі не можна розібрати ні цифр, ні букв. 

От наприклад, деякі міськради, судячи з усього, мали потрібну нам excel-табличку. Але замість того, щоб просто її вислати, вони вирішили її роздрукувати, відсканувати, поправляючи папірці кожну секунду, стиснути якість зображення у кілька разів та відправити нам pdf-файл, де взагалі неможливо прочитати жодної цифри,”  зазначає Марія. 

А в ідеалі хотілося би мати портал відкритих даних на зразок EurostatКожен може туди зайти, знайти різноманітні набори даних в усіх можливих сферах життя, відфільтрувати за потрібними показниками і завантажити у потрібному форматі (наприклад, xls або csv). Замість того, щоб витрачати дні або тижні на запити та перенесення даних у таблицю вручну, аналітики можуть за кілька хвилин знайти та завантажити на комп’ютер потрібні показники для аналізу.  

Від цього виграли би й чиновники, адже їм не потрібно було би витрачати свій час на формування таблиць, їх сканування та надсилання відповідей. Звичайно, коли немає чого приховувати.  

Інакше ми можемо опинитися у ситуації зомбі-прозорості (zombie transparency), коли дані публікуються, але з запізненням, або вони неповні чи у незручному форматі, до прикладу, pdf. У результаті, хоча їх і публікують, ці дані мало хто використовує. 


Аналіз даних чи маніпуляція статистикою

Окрім моніторингу ефективності публічної політики, важливо, щоб ця ж політика і формувалась на базі фактів, а не інтересів окремих лобі. При поданні законопроєктів автори мають обґрунтувати впровадження чи зміну певної державної політики. Інколи нардепи використовують дані та навіть економіко-математичне моделювання. Проте не завжди саму модель  можна знайти у відкритому доступі, а фактами, трапляється, маніпулюють 

Наприклад, у законопроєкті щодо локалізації у державних закупівлях пропонують обмежити участь іноземних виробників. Це, на думку авторів, має підтримати українського виробникадодати 3,9% до ВВП у середньостроковій перспективі та привести до створення 62,5 тис. нових робочих місць. Проте модель Київської школи економіки показує, що його ухвалення приведе до втрати 642 млн доларів.  

Натомість у Європейському Союзі наразі розглядають питання уніфікації санкцій за порушення митних правил. Наразі вони відрізняються між країнами, що підвищує витрати для європейських експортерів та може порушувати правила Світової організації торгівліДо процесу залучили всіх заінтересованих сторін, а також провели аналіз різних альтернатив політики, а не лише потенційні вигоди від однієї та можливість її впровадженняЦе вимагає часу, але результат  зміна від впровадження якої буде більше зиску для всіх, а негативні наслідки будуть мінімізовані.   


Дешеві ліки, найкоротший маршрут та відключення світла

Відкриті дані потрібні не тільки, щоб ухвалювати глобальні рішення про реформи чи моніторити їхню ефективність. Вони можуть значно полегшити і щоденне життя кожного. Наприклад, у застосунку tabletki.ua кожен може порівняти ціни на ліки в різних аптеках та зекономити. А при попередньому бронювання отримати знижку. Часом це навіть кілька десятків гривень. 

Застосунок EasyWay дозволяє побачити в режимі реального часу, де зараз знаходиться певний тролейбус чи автобус, а також прокласти маршрутТут  інформація про всі маршрути та зупинки громадського транспорту у близько 60 містах України. Навіть якщо у вас немає цього застосунку, але ви користуєтесь Google картами, щоб доїхати в аеропорт чи зрозуміти час очікування наступного автобусу, то все одно ці дані їм надають саме розробники EasyWay. Ще є сітібот “Назар”. Він своєчасно повідомляє про поточний ремонт чи строки усунення аварії за конкретною адресою у ViberTelegram чи Facebook. Так можна завчасно дізнатися, коли вимкнуть світло або як довго ще не буде води. Та й диспетчери комунальних служб отримують менше дзвінків з одним і тим же запитанням. Наразі бот працює у восьми містах.  


Економічний ефект від відкритих даних

Відкриті дані уже принесли понад 700 млн доларів до економіки України у 2017 році. За умови активізації подальших кроків до 2025 року  це може бути 1,4 млрд доларів або 0,92% ВВП, згідно із дослідженням “Економічний потенціал відкритих даних для України.  Яким чином? Ось так відповідають автори дослідження:  

“Відкриті дані допомагають економіці зростати, підвищуючи ефективність окремих компаній, допомагаючи споживачам ухвалювати кращі рішення й уможливлюючи розвиток нових товарів та послуг”. 

Зараз ситуація з відкритими даними у нас значно краща, ніж 10 років томуУ 2015 році з’явився Єдиний державний веб-портал відкритих даних. Тоді ж уряд визначив перелік наборів даних, які мають опублікувати. Багато державних органів уже їх опублікували.  

Це хороший старт, але його слід продовжувати. Наприклад, аналітики Центру спільних дій при аналізі місцевих політик у різних сферах не знайшли потрібні набори даних у публічному доступі і змушені були надсилати запити до міських рад.  

Створення власного Eurostat чи покращення порталу відкритих даних  це непростий та недешевий процес. Водночас хоча би удосконалення процедури відповідей на запит про доступ до публічної інформації сприяло би ефективному громадському контролю та нагляду за державними та місцевими політиками, рішеннями та їхнім виконанням на різних рівнях. І головне  допомогло оцінити якість рішень, аби наступні були більш ефективними. А для цього потрібно, щонайменше, щоб аналітики могли отримати дані швидко та у зручному машинозчитувальному форматі (csvxlsjson), а не погано відскановану фотографію таблиці.  

І місцева, і національна влада мають працювати над спрощенням доступу для своїх громадян до даних. Адже тільки так громадяни можуть в своїх оцінках базуватися на фактах, а не на популістичних заявах тих, хто хоче стати владою в найближчому майбутньому.  

Водночас, Марія Квіцінська додає про потребу уніфікувати не лише формат даних, але і цільових програм, у яких органи місцевого самоврядування планують свою роботу на декілька років: “Цільові програми міст  у різних форматах. Немає єдиних вимог щодо єдиних індикаторів ефективності реалізації програми. Тому їх важко порівнювати. Треба мати певний типовий формат програми. 


Коли дані – необ’єктивні

Використовуючи дані при формуванні політики, варто розуміти обмеження та недоліки. Наприклад, дані про кількість неврегульованих мігрантів  це показник того, скільки неврегульованих мігрантів змогла виявити міграційна служба певної країни, і не більше. Ця цифра залежить не лише від реальної присутності таких іноземців, але й від активності роботи щодо їхнього виявленню, як-от операція “Мігрант”. 

Особливо важливо розуміти природу даних при створенні прогнозних моделей. Що вони можуть сказати, а що - ні. Тобто чи відобразить модель, заснована на таких даних, реальний стан речей. Розуміння якості даних та їх обмежень не менш важлива, ніж їх наявність. 

Наприклад, програма PredPol використовує лише три набори даних: тип, місце та час скоєння злочину. На їхній основі модель продукує прогноз, де ймовірніше буде скоєно злочин найближчим часом, і спрямовує туди поліцейських. Це дія на випередження.  

Розробники стверджують, що модель нейтральна щодо раси та не порушує права людини, оскільки не використовує демографічну, етнічну чи соціально-економічну інформацію про конкретних злочинців у минулому 

Проте навіть дані про минулі злочини можуть бути необ’єктивними. Адже вони не розповідають про ті вчинені злочини, які не відомі поліції. Натомість це таблиця із арештами або звітами про інциденти під час патрулювання. І якщо поліцейський схильний до расизму, він арештовує представника іншої раси. Відповідно алгоритм, який натренували, щоб розпізнавати потенційні місця злочину на базі такої статистики, теж буде схильний направляти патрулі до районів, де проживає більше темношкірих людей.  


***

Відкриті дані дозволять робити зважені рішення як на рівні держави, так і кожному з нас. Особливо ключові рішення. Такі як купівля квартири у законній новобудові, щоб потім не протестувати під вікнами недоброчесного забудовника. Або купівля авто, яке не розшукує поліція. Або для того щоб перевірити, наскільки чисте повітря та вода у місті, щоб спільно з іншими громадянами вимагати від місцевої влади рішень для покращення екологічної ситуаціїВодночас доступ до інформації є частиною такого принципу хорошого врядування Ради Європи як відкритість та прозорість.