По мере развития общества всё большую роль начинают играть данные: на их основе работают крупные компании и мелкие стартапы, их анализ позволяет улучшать городское пространство и делает жизнь людей проще, а также дает возможность регулировать деятельность госорганизаций. Рассказываем о том, что такое открытые данные, какую пользу они приносят обществу и какие проекты существуют в этой области на сегодняшний день.
Открытые данные — что это?
Открытые данные — это концепция, основанная на идее о том, что определенные данные должны быть доступны широкому кругу лиц. Данные обязательно должны предоставляться в машиночитаемом формате — CSV, XML, JSON, ODS — что обеспечивает возможность их автоматической обработки. Под использованием открытых данных подразумевается как распространение материалов, так и работа с информацией: выделение определённых отрывков, поиск и т. д.
Основными критериями открытости данных являются их доступность, удобство чтения, возможность повторного использования или распространения, а также отсутствие ограничений, в том числе в области авторского права, поэтому в большинстве случаев открытые данные размещаются под открытыми лицензиями. Не менее важной чертой открытых данных является интероперабельность — универсальность языка, на котором должна предоставляться информация.
Открытые данные могут включать в себя как текстовые, так и нетекстовые материалы, например, статистические данные, карты, формулы, инфографика, инструкции и т.п.
Чем отличаются большие данные, публичные данные и открытые данные?
Большие данные – это термин, принятый для обозначения структурированных и неструктурированных данных, основными характеристиками которых являются большой объем, скорость прироста и многообразие. Большие данные необязательно будут открытыми: машиночитаемыми, интероперабельными и доступными, как и открытые данные необязательно обладают большими объемами и высокой скоростью роста.
Открытые данные отличаются и от публичных данных, то есть тех, доступ к которым можно получить по специальному запросу. Использование публичных данных определяется законодательством, и их раскрытие обусловлено соответствующей потребностью общества.
Как зарождалась концепция?
Термин «открытые данные» впервые прозвучал в 1995 году в документе американского научного учреждения. Он касался раскрытия геофизических и экологических данных, которое, по мнению авторов доклада, способствовало обмену научной информацией между разными странами и являлось основой для понимания глобальных явлений.
Основные инициативы в области открытых данных начали появляться после 2007 года. Толчком к развитию движения стала встреча теоретиков и активистов интернета, которая состоялась на севере Сан-Франциско. Тим О'Рейли, сторонник движения за открытое программное обеспечение, и Лоренс Лессинг, основатель лицензий Creative Commons, сформулировали основные идеи распространения данных в открытом доступе.
Уже в 2009 году начали появляться первые крупные законодательные инициативы. Одним из них стало подписание Бараком Обамой президентских меморандумов, которые относились к открытому правительству, чьей основой являются открытые данные.
На данный момент государственные порталы, на которых осуществляется публикация правительственных данных, существуют в большинстве европейских стран, а также в США, Канаде, Австралии, Новой Зеландии. Публикация открытых данных осуществляется согласно местному законодательству, однако существуют и глобальные инициативы: например, в 2015 году была принята Хартия открытых данных, предусматривающая публичное раскрытие информации государственных органов в интернете. Согласно документу, «доступ к данным позволяет частным лицам и организациям совершать новые открытия и создавать инновации, которые могут улучшить жизнь других людей и помочь оптимизировать поток информации внутри стран и между странами. Несмотря на то, что государственные органы и бизнес собирают широкий спектр данных, они не всегда делятся ими таким образом, чтобы данные были легко обнаруживаемыми, полезными или понятными для общественности». Также в Хартии были сформулированы основные принципы публикации и повторного использования данных, в частности, их качественность и возможность многократного использования для оптимизации управления и роста инноваций.
Зачем открывать данные?
Целью движения за публикацию открытых данных является облегчение доступа к материалам и информации, которые необходимы пользователям. Открытые данные способствуют улучшению деятельности правительственных органов, позволяют людям отслеживать работу государственного аппарата, повышая ее прозрачность. В некоторых странах открытой бывает информация о бюджетах, данные о конфликтах и войнах, криминальная статистика. Так, например, компания Air&Space Evidence с помощью открытых данных ловит нарушителей, а компания SpotCrime собирает и анализирует статистику преступлений, подсказывая жителям городов, в каких районах безопаснее всего жить
С помощью открытых данных улучшают состояние общества и другие организации — Open Government Partnership, International Budget Partnership, Open Knowledge Foundation. Они анализируют бюджеты правительственных организаций с целью повышения эффективности управления и снижения уровня нищеты.
Открывая данные о транспортной системе, образовании, здравоохранении, городские власти помогают разработчикам приложений и некоммерческим организациям найти инновационные пути решения проблем городов и содействовать экономическому развитию страны. Кроме этого, они значительно упрощают жизнь людей: например, компания NextBus использует данные о транспортной системе, благодаря чему люди узнают, сколько ждать автобус, и экономят свое время.
Кто занимается развитием концепции открытых данных?
Если говорить о развитии концепции открытых данных за границей, то следует начать с США. Там действует специальный меморандум, регулирующий публикацию информации в открытом доступе. В отдельных городах также реализуются местные проекты по продвижению практики размещения данных в открытом доступе. Например, администрация Нью-Йорка проводит конкурсы приложений на основе открытых данных. Один из проектов-участников — программа Work +, с её помощью можно найти компанию и должность, на которой наиболее комфортно работать в зависимости от требований пользователя.
В Великобритании также реализуется множество проектов на основе открытых данных. Один из них — Fix My Street — призван наладить диалог между обществом и властью. С его помощью жители уведомляют власти о городских проблемах: плохих дорогах, сломанных светофорах и т. д. Проект был активно поддержан муниципальными властями.
Одной из немногих организаций, которые развивают тему открытых данных в России, является АНО «Информационная культура». «Инфокультура» сотрудничает с российскими и зарубежными проектами, занимается исследованиями в области открытости государства, создаёт открытые базы данных, организует мероприятия, оказывает поддержку по вопросам открытого доступа. Организацией были реализованы многие общественно-полезные проекты, например, BudgetApps (конкурс по финансовым данным), «Хаб открытых данных» (хранилище открытых данных для русскоязычных пользователей), а также «Данные НКО»ç — портал для публикации открытых данных от некоммерческих организаций.
Зачем был создан проект «Данные НКО»?
Проект «Данные НКО» был создан «Инфокультурой» с использованием гранта Президента Российской Федерации на развитие гражданского общества, предоставленного Фондом президентских грантов. Сейчас НКО оказывают существенное влияние на развитие общества, однако данные, которые они производят, остаются в пределах одной организации. Проект «Данные НКО» дает возможность публиковать результаты деятельности организаций из некоммерческого сектора, например, структурированные базы данных, инструкции, инфографику, отчеты о результатах исследования, методички, памятки, библиографии и т. п. На данный момент чаще всего участники проекта публикуют результаты исследований (например, исследования читательской среды от Фонда проектного развития «Поколение ЗЕТ») и методические пособия (например, «Белая книга популяризации науки»). Материалы публикуются под лицензиями Creative Commons, то есть копировать и распространять их может любой желающий.
Для публикации данных необходимо зарегистрироваться и создать страницу на портале «Данные НКО». Размещать информацию могут только участники проекта, при этом зарегистрироваться на портале может любая некоммерческая организация вне зависимости от типа и масштаба. Для того, чтобы материалы появились на сайте, нужно заполнить метаданные и проставить теги для более простого поиска (инструкцию можно прочитать здесь). Уже сейчас активное участие в проекте принимают 16 организаций, среди которых АНО «Левада-центр», благотворительные и просветительские фонды, Ассоциация юристов России и другие.
Статья опубликована в рамках проекта «Данные НКО». Проект реализуется АНО «Информационная культура» с использованием гранта Президента Российской Федерации на развитие гражданского общества, предоставленного Фондом президентских грантов.
Читать @chaskor |
Статьи по теме:
- Почему Википедия превосходит остальные энциклопедии.
История, факты и статьи. - Карантин не закончится никогда.
Почему коронавирус навсегда изменит наш образ жизни. - Жар земной.
Как производятся климатические данные. - Вы отдаете бесплатно самое дорогое.
Вот какие ваши персональные данные хранятся в интернете. - «Главная цель библиотеки — продвижение книг и чтения».
О развитии современных библиотек и оцифровке библиотечных архивов . - Исходный код.
Как работают сервисы открытого доступа? . - 10 виртуальных коллекций и архивов .
Теперь все можно посмотреть, не выходя из дома . - Как мы теряем нашу интернет-историю.
Почему наши блоги пропадают? . - Архивы в цифровую эпоху.
Ближе к людям, организациям и Интернету. - Хранители Интернета?
«Некоторые называют нас хранителями — мне нравится говорить, что мы архивариусы».