21.11.2024

Журналистика данных (Data driven journalism)

Журналистика данных (data driven journalism)Журналисты уже признались: успеть за блоггерами невозможно. Но способ остаться конкурентоспособными есть: сориентировать аудиторию в потоке информации. И называется это журналистика данных (data driven journalism).

Как быстро без помощи Google вы назовете, какое количество знаков в цифре 295 экзабайт? Между тем именно такой величиной определяется запас суммарных данных человечества за период 1986-2007 (оценка Университета Южной Калифонии). К 2020 обещают 40 000 экзабайт. Чтобы сориентироваться в этом массиве, необходимость помощи «специально обученных людей» очевидна.

Естественно, не вся информация открыта, не вся полезна конкретной читательской аудитории. Но практика показывает самое «страшное» не то, что информация появляется, а то, что она появляется внезапно.

Данные как вызов

Когда возникла Wikileaks, на журналистов обрушился невероятно большой ком из данных. Редакция The Guardian, которая тогда наиболее активно занялась их разбором и переработкой, сейчас является одним из лидеров дата-журналистики.

Украинских коллег сейчас «накрыло» волной информации из захваченных революционерами архивов Януковича. 200 папок документов превращаются в архив Януковичликс, который будет доступен журналистам всего мира, а пока делается двигателем развития украинской дата-журналистики.

В России уже действует национальный портал открытых данных и существует законодательство, которое вводит понятие открытых данных в чиновничий лексикон. Не без недостатков, но ведь есть.

Найти человека в цифрах

Журналисты всегда пользовались статистикой, данными. Однако по большей части графики, таблицы и схемы были иллюстрацией к истории / тезисам. Журналистика данных сами цифры делает историей. Источником информационных поводов, фундаментом расследования, экспертом.

И тут последний аргумент «за». В наших широтах доверие к СМИ нельзя назвать высоким. Хотя проблема на самом деле мировая. Авторы Руководства по дата-журналистике (Data Journalism Handbook, есть в русскоязычной версии, подготовленной РИА) отмечают, что данные дают СМИ шанс вернуть себе авторитет. Цифрам всегда верят больше, чем мнениям и прогнозам. Качественная инфографика может подкрепить тезисы статьи лучше комментариев эксперта. Особенно, если она интерактивная и читатель может сам «покрутить» показатели.

Таким образом, мы плавно переходим к тому, как формулируются новые принципы работы с данными. Британский журналист Пауль Брэдшоу выложил их в знакомой форме перевернутой перамиды: собрать, очистить, комбинации, донести до читателя.

Сбор данных. Помимо традиционных источников здесь открывается бесконечный источник интерактива с читателями и возможность замутить свой Росстат с тайм-лайн и схемами. Посчитать, какова на самом деле средняя зарплата по стране, какой средний чек в магазинах разных регионов, скорость обслуживания в поликлиниках, количество спортивных дворцов, используемых под ярмарки, где школьников чаще всего посылают на картофель и т.д.

Кроме того сейчас появилось огромное количество технических примочек. Начиная от платформ, которые позволяют отслеживать восстановления на сайтах и заканчивая обработкой документов путем программирования. Это тема отдельной статьи, а пока, как советует один из крупных российских специалистов по работе с данными Иван Бегцин, — учите Html.

Очистка. Завет про 3 источника информации для подтверждения никто не отменял. Но и правдивые данные могут быть в непригодных для использования программах. Поэтому, опять же, учите Html. И работу с Excell.

Магия (комбинирование). Заново ссылаясь на Ивана Бегцина, лучше иметь несколько небольших, но связанных наборов данных (датасетов), чем один большой. Вот где начинается магия.

Возьмем данные МЧС по количеству пожаров, найдем даты постройки домов (этот датасет готовится и в скором времени станет доступным), накладываем на границы ЖЭСов (этот датасет волонтеры формировали руками, вам же нужно только взять готовое), украшаем это в интерактивную карту и вуаля — читатель может установить зависимости, выбирать в каком районе лучше купить квартиру, прийти с вашей Инфографикой на прием к депутату или отправить ее своему руководителю ЖЭСа. Можно соединить даты постройки домов с количество школ в районах, количество произвольных возгораний с количеством домов с мусоропроводами.

Донесение до читателя. Данные, обработанные и представленные в удобном для читателя виде, раскрывают контекст. Инструменты дата-журналистики позволяют приблизить цифры к конкретному человеку. Классический пример — бюджетный калькулятор, который раскрывает перед читателем, как распределяются его налоги.

Бюджетный калькулятор от РИА-новости

Бюджетный калькулятор от РИА-новости. Журналистика данных (data driven journalism)

 

Команда New York Times, которая занимается работой с данными, составляет 35 человек. Бывший отдел Инфографика Риа-Новости (ныне перешел в «Афиша-Рамблер-SUP») насчитывал 37 человек. Но по большому счету количество штата влияет в первую очередь на скорость. One man army также имеет все шансы сорвать главную награду дата-журналистов. Свободно доступного инструментария в мировой паутине хватает, но это тема другой статьи. А пока учите Html. И да. 295 экзабайт — это 21-значное число.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *