Подписаться на обновления
24 сентябряПонедельник

usd цб 66.2497

eur цб 78.0753

днём
ночью

Восх.
Зах.

18+

ОбществоЭкономикаВ миреКультураМедиаТехнологииЗдоровьеЭкзотикаКнигиКорреспонденция
Печать  ТВ и радио  Новые медиа  Медиабизнес  Стартапы  Кризис в СМИ  Информационное право  Facebook  Живой Журнал  Экономика знания  ВКонтакте  Общественное достояние  Ноосфера. Запуск 
Евгений Механцев   пятница, 30 июня 2017 года, 21:00

Жизнь и смерть в цифре
О проблеме архивации и резервирования информации


   увеличить размер шрифта уменьшить размер шрифта распечатать отправить ссылку добавить в избранное код для вставки в блог




По оценкам исследователей International Data Corporation, количество информации удваивается в мире каждые два года. На данный момент ее объем составляет несколько тысяч эксабайт, и лишь один процент из этого объема так или иначе проанализирован. Однако даже эта информация сохранена ненадежно: хрупкость аналоговых носителей и развитие ПО увеличивают риски ее потери.

Сумасшедшие оценки экспертов воспринимаются уже как статистические выкладки из учебника астрономии: миллиарды звёзд и планет складываются во вселенскую бесконечность, которую невозможно себе представить. Но пока что среди известных науке галактик нас главным образом волнует судьба родного Млечного Пути. Вот и среди астрономических цифр Big Data нам в первую очередь интересна сохранность сравнительно небольшого количества данных: литературы, музыки, фильмов, живописи – наиболее ценных достижений человеческой культуры.

В отличие от ситуации со статистическими данными, объёмы даже крупнейших мировых библиотечных фондов воображение не поражают: например, более 150 миллионов единиц хранения Библиотеки Конгресса США в оцифрованном виде будут «весить» смешные по меркам «больших данных» 20 терабайт. Однако для оцифровки даже этих объемов информации требуются очень большие усилия.

Исторический контекст

Разнообразные программы по оцифровке аналоговых носителей появились в 1990-х годов. Чуть позже были запущены национальные программы оцифровки в странах Европы, Северной Америке, Новой Зеландии, Австралии, Китае. Появились и частные инициативы, такие как Open Library и Google Books. Казалось бы, дожившим до компьютерного века произведениям уже ничего не угрожает. Но в 2003 году ЮНЕСКО приняла Хартию цифрового наследия, основной посыл которой – не расслабляться: несмотря на удобство цифровой копии, вариантов гибели для неё ещё больше, чем для аналоговой – от банального сбоя на носителе до атаки зловредным вирусом. Живучесть электронной книги зависит главным образом от возможности хранить множество копий (желательно – в разных странах или даже на разных континентах).

Ситуация усложняется еще и тем, что оцифровка – дело небыстрое: за один рабочий день специалисты успевают обработать не более нескольких сотен носителей. Процесс растягивается на многие десятилетия, и случайного пожара или наводнения достаточно, чтобы миллионы уникальных произведений пропали безвозвратно – что уж говорить о более крупных техногенных катастрофах.

Ещё большая опасность грозит аналоговым видео- и аудиозаписям: их носители – плёнки, магнитные ленты, пластинки – разрушаются даже без внешнего воздействия, просто от старости. Так, 80% фильмов, снятых в 1920-е годы, до нашего времени просто не дожили, потому что не дождались своей очереди на оцифровку. И с каждым годом таких записей становится больше.

Ресурсы для сохранения наследия

Один из способов ускорить процесс оцифровки – распределить фронт работ между библиотеками разных городов и стран. Однако, как показывает практика, человечество справляется с этим плохо: даже запущенная с 2009 года при поддержке ООН Мировая Цифровая Библиотека содержит всего лишь 16 тысяч неочевидно подобранных файлов. Например, по запросу «Лев Толстой» посетитель найдёт несколько фотографий из Ясной Поляны начала XX века, но не текст «Анны Карениной».

Отдельную сложность представляет сохранение веб-ресурсов – они не нуждаются в оцифровке, но при этом постоянно обновляются, меняются и исчезают. В начале 2000-х годов возник Северный веб-архив, объединивший библиотеки Дании, Швеции, Финляндии, Норвегии и Исландии. Позже к нему присоединились библиотеки США, Франции, Великобритании, Австралии и Канады, образовав Международный консорциум сохранения интернета.

Впрочем, в области архивации веб-сайтов пионером стал не государственный ресурс, а некоммерческая организация «Архив интернета», создатель которой, Брюстер Кейл, с 1996 года пытается сохранить веб-страницы, формируя своеобразный «слепок» состояния всемирной паутины. «Архив» действует по принципу поисковой системы, сканируя сеть, добавляя страницы в своё хранилище и периодически их обновляя – но, в отличие от поисковиков вроде Google и «Яндекса», не удаляя старые версии. В результате пользователь «Машины времени» может наблюдать, как менялось содержимое сайта, перемещаясь не только по ссылкам, но и между датами в календаре.

В 2005 году «Архив интернета» запустил проект по сканированию бумажных изданий Open Library, фонд которого уже сейчас составляет более 1 миллиона книг. Кроме того, доступна функция сохранения конкретной страницы в конкретный момент по запросу пользователя.

Сохранение по запросу предоставляют и другие частные проекты, например, Archive.is и WebCite – алгоритмы их работы отличаются друг от друга, поэтому если у вас не получилось сделать качественную копию на одном из сервисов, имеет смысл попробовать другой.

Ответственность каждого

Поддержка глобального библиотечного проекта, кроме денег и заинтересованности, требует ещё и преодоления множества юридических трудностей. Во многих странах действующие нормы авторского права не только закрывают доступ к произведению, но мешают даже простому копированию и архивации. Немудрено, что каждый из перечисленных выше сервисов не раз подвергался блокировкам не только со стороны обеспокоенных правообладателей, но и по политическим причинам. В эпоху «постправды» и информационных войн подобные проекты работают не только «на вечность», но и позволяют противодействовать любой цензуре и сохранять многообразие точек зрения по остросоциальным проблемам. Блокировку обойти при минимальном желании может любой, но проекты с централизованным хранением данных на собственных серверах в принципе потенциально уязвимы. Поэтому борцы за свободу обмена информацией в сети создают веб-архивы нового поколения, основанные на принципе p2p («от пользователя к пользователю»), где информация хранится во множестве копий. Идея таких сервисов, как LOCKSS и LBRY, проста: не стоит ждать, пока государство или могучая организация сохранит информацию за тебя. Если то или иное произведение необходимо людям – они сами способны его сохранить во множестве копий, защитив таким образом от небытия.

В то же время бумажная книга, глиняная табличка или царапины на камне можно прочитать, пока жив хотя бы один человек, владеющий языком, на котором они написаны. Цифровая информация – лишь набор нулей и единиц, для чтения которого требуется определённое программное обеспечение и аппаратная составляющая. Технологии эволюционируют стремительно, и обратная совместимость сохраняется не всегда – чтобы просто прочитать данные с пятидюймовой дискеты или запустить программу двадцатилетней давности, требуется совершить множество действий. Форматы устаревают, и многие аналитики всерьёз опасаются не столько за физическую сохранность данных, сколько за саму возможность работы с ними в будущем.

В 2010 году в швейцарских Альпах участники научного проекта PLANETS заложили "капсулу времени", содержащую файлы распространённых сейчас форматов, записанные на современных носителях. К файлам приложены инструкции по чтению форматов и копия операционной системы, к носителям – оборудование для воспроизведения. Но при этом сами исследователи задачей эксперимента называют даже не проверку надёжности цифровых методов хранения информации, а демонстрацию того, как быстро они устаревают. Надеяться остаётся лишь на то, что разработчики операционных систем будущего позаботятся о совместимости ПО с «древними» форматами JPG или PDF.

В любом случае, сохранность цифровых данных зависит в первую очередь от человеческих усилий – а значит, от ценности информации для потребителей. Жизнь произведения в этом случае становится делом не только международных консорциумов и национальных библиотек, но и конкретных людей. Скан редкой книжки из бабушкинрй библиотеки сегодня потребует пары часов личного времени – но как знать, вдруг этот файл станет единственным источником текста завтра.

Публикация в рамках проекта «Ноосфера. Запуск». При реализации проекта используются средства государственной поддержки, выделенные в качестве гранта в соответствии c распоряжением Президента Российской Федерации от 05.04.2016 №68-рп и на основании конкурса, проведенного Общероссийской общественной организацией «Российский Союз Молодежи».




ОТПРАВИТЬ:       



 




Статьи по теме:



Битва за открытый доступ

Олигополия научных издательств, ситуация со Sci-Hub и будущее открытого доступа. Часть 2

Крупнейшие архивы открытого доступа, функционирование пиратских площадок и будущее научной коммуникации.

29.06.2017 19:10, Аса Сигурэ


Новые медиа, старые проблемы

Олигополия научных издательств, ситуация со Sci-Hub и будущее открытого доступа. Часть 1

Один из персонажей в пьесе Бернарда Шоу «Врач перед дилеммой» говорит: «Профессия есть заговор против мирян». По словам профессора Джона Нортона, чтобы понять ситуацию в сфере научной коммуникации, нужно просто заменить слово «профессии» на «издатели академических журналов». Это справедливое утверждение: удивительно, но в эпоху развития интернета знания оказываются закрытыми, и на пути к ним стоят корпорации, получающие огромную прибыль за труды других людей.

28.06.2017 19:00, Аса Сигурэ


Проект European Open Science Cloud

Европа создает крупнейший научный репозитарий открытых данных

Ведущие европейские исследовательские институты договорились о совместной работе со спонсорскими организациями и законодателями над созданием European Open Science Cloud – крупнейшего открытого репозитория данных в истории науки. Идея проекта European Open Science Cloud заключается в том, чтобы предоставить каждому ученому и всем желающим открытый доступ к результатам исследований, проведенных за счет государственного финансирования.

20.06.2017 16:00, Benedict O'Donnell


Путь в ноосферу

Запущена Федеральная резервная система банков знания

В рамках Третьего международного профессионального форума «Книга. Культура. Образование. Инновации» состоялись специальный семинар «Открытый доступ» и пресс-конференция «Федеральная резервная система банков знания: настоящее и будущее», проведенная Ассоциацией интернет-издателей (АИИ) совместно с НП «НЭКИОН». Ключевыми темами для обсуждения стали открытый доступ к научным исследованиям и планы по развитию Федеральной резервной системы банков знания, которая была запущена в рамках проекта «Ноосфера. Запуск» весной 2017 года в тестовом режиме. На пресс-конференции был анонсирован ее официальный запуск.

07.06.2017 15:00, Агент Ноосферы


Пять вопросов об открытой науке и ответы на них

Кратко о главном: что такое открытая наука, почему это важно для исследователей и почему – для всех остальных

Под термином «открытая наука» понимается практика, когда научные исследования и их результаты становятся открытыми и доступными для людей за пределами узкого круга исследователей. Среди прочего, открытая наука подразумевает доступность исследовательских материалов, данных и лабораторных протоколов для всех желающих. Многие ученные также поддерживают открытый доступ – параллельное движение, сторонники которого считают, что научные статьи должны быть бесплатно доступны для чтения без необходимости платить за подписку или разовый доступ.

02.06.2017 14:00, Elizabeth Gilbert, Katie Corker, The Conversation


«Каждый человек имеет право свободно участвовать в культурной жизни общества, наслаждаться искусством, участвовать в научном прогрессе и пользоваться его благами»

О Sci-Hub, научном издательстве и барьерах на пути к знаниям

Стремление к знаниям – сложная задача. Для этого нужны усилия, ресурсы, а сегодня еще и деньги. В настоящий момент доступ к научной литературе серьезно ограничен, поскольку большинство академических издателей требуют непомерной платы за чтение статей ученых. Это требование не только мешает общественности искать доступную информацию, но и не позволяет другим ученым полагаться на эту информацию в собственных исследованиях.

24.05.2017 19:00, Joel Rindelaub, исследователь и кандидат химических наук, Миннесота


Новые научные медиа

Всё, что вы хотели сделать с научными журналами, но считали невозможным

Открытое рецензирование, большие данные, путь от идеи до научных результатов – всё это свойства новых крутых платформ, за которыми, без сомнения, будущее научных медиа.

22.05.2017 16:00, Ольга Кареева


Бои за информацию

Elsevier потребовал от Sci-Hub и Libgen 15 миллионов долларов

Издатель академической литературы Elsevier подал иск к «пиратским» ресурсам Sci-Hub и Libgen, которые, по утверждению истца, своим «поистине вопиющим поведением» и «ошеломляющим» нарушением причинили ему ущерб в 15 миллионов долларов.

20.05.2017 19:11


Гранит науки для народа

Как получить доступ к научным статьям

Публикация научной статьи — одно из главных событий в научном процессе. С публикацией открытие выходит в мир — его обсуждают и критикуют коллеги, пиарщики пишут пресс-релизы, а СМИ — новости: ученые, мол, доказали. Так открытие в конце концов доходит до широкой публики. К сожалению, исходная публикация для этой самой публики обычно не предназначена: если вы не сидите в институте, у которого есть подписка на журнал, или в крупной библиотеке типа Ленинки, доступ к статье часто будет платным.

19.05.2017 14:00, Екатерина Боровикова


«Мы предвестники апокалипсиса для коммерческих издателей научных статей»

Как браузерные расширения помогают развитию открытого доступа

Сторонники открытого доступа праздновали несколько значительных побед в последнее время. Сначала Фонд Билла и Мелинды Гейтс объявил о запуске собственной издательской платформы открытого доступа, а Европейская комиссия сообщила, что собирается последовать его примеру. Потом стало известно, что Open Access Button – ресурс, который помогает исследователям получить доступ к бесплатным копиям научных статей – будет интегрирован в существующие соглашения межбиблиотечных займов. Наконец, в начале апреля было запущено расширение Unpaywall, которое, по мнению его создателей, вполне может изменить статус кво академического издательства.

17.05.2017 16:00, Lindsay McKenzie






 

 

 

 

Календарь

Олег Давыдов

Колесо Екатерины

Ток страданий, текущий сквозь время

7 декабря православная церковь отмечает день памяти великомученицы Екатерины Александрийской. Эта святая считалась на Руси покровительницей свадеб и беременных женщин. В её день девушки гадали о суженом, а парни устраивали гонки на санках (и потому Екатерину называли Санницей). В общем, это был один из самых весёлых праздников в году. Однако в истории Екатерины нет ничего весёлого.

Ив Фэрбенкс

Нельсон Мандела, 1918-2013

5 декабря 2013 года в Йоханнесбурге в возрасте 95 лет скончался Нельсон Мандела. Когда он болел, Ив Фэрбенкс написала эту статью о его жизни и наследии

Достижения Нельсона Ролилахлы Манделы, первого избранного демократическим путем президента Южной Африки, поставили его в один ряд с такими людьми, как Джордж Вашингтон и Авраам Линкольн, и ввели в пантеон редких личностей, которые своей глубокой проницательностью и четким видением будущего преобразовывали целые страны. Брошенный на 27 лет за решетку белым меньшинством ЮАР, Мандела в 1990 году вышел из заточения, готовый простить своих угнетателей и применить свою власть не для мщения, а для создания новой страны, основанной на расовом примирении.

Молот ведьм. Существует ли колдовство?

5 декабря 1484 года началась охота на ведьм

5 декабря 1484 года была издана знаменитая «ведовская булла» папы Иннокентия VIII — Summis desiderantes. С этого дня святая инквизиция, до сих пор увлечённо следившая за чистотой христианской веры и соблюдением догматов, взялась за то, чтобы уничтожить всех ведьм и вообще задушить колдовство. А в 1486 году свет увидела книга «Молот ведьм». И вскоре обогнала по тиражам даже Библию.

Максим Медведев

Фриц Ланг. Апология усталой смерти

125 лет назад, 5 декабря 1890 года, родился режиссёр великих фильмов «Доктор Мабузе…», «Нибелунги», «Метрополис» и «М»

Фриц Ланг являет собой редкий пример классика мирового кино, к работам которого мало применимы собственно кинематографические понятия. Его фильмы имеют гораздо больше параллелей в старых искусствах — опере, балете, литературе, архитектуре и живописи — нежели в пространстве относительно молодой десятой музы.

Игорь Фунт

А портрет был замечателен!

5 декабря 1911 года скончался русский живописец и график Валентин Серов

…Судьба с детства свела Валентина Серова с семьёй Симонович, с сёстрами Ниной, Марией, Надеждой и Аделаидой (Лялей). Он бесконечно любил их, часто рисовал. Однажды Маша и Надя самозабвенно играли на фортепьяно в четыре руки. Увлеклись и не заметили, как братик Антоша-Валентоша подкрался сзади и связал их длинные косы. Ох и посмеялся Антон, когда сёстры попробовали встать!

Юлия Макарова, Мария Русакова

Попробуй, обними!

4 декабря - Всемирный день объятий

В последнее время появляется всё больше сообщений о международном движении Обнимающих — людей, которые регулярно встречаются, чтобы тепло обнять друг друга, а также проводят уличные акции: предлагают обняться прохожим. Акции «Обнимемся?» проходят в Москве, Санкт-Петербурге и других городах России.

Илья Миллер

Благодаря Годара

85 лет назад, 3 декабря 1930 года, родился великий кинорежиссёр, стоявший у истоков французской новой волны

Имя Жан-Люка Годара окутано анекдотами, как ни одно другое имя в кинематографе. И это логично — ведь и фильмы его зачастую представляют собой не что иное, как связки анекдотов и виньеток, иногда даже не скреплённые единым сюжетом.

Денис Драгунский

Революционер де Сад

2 декабря 1814 года скончался философ и писатель, от чьего имени происходит слово «садизм»

Говорят, в штурме Бастилии был виноват маркиз де Сад. Говорят, он там как раз сидел, в июле месяце 1789 года, в компании примерно десятка заключённых.

Александр Головков

Царствование несбывшихся надежд

190 лет назад, 1 декабря 1825 года, умер император Александра I, правивший Россией с 1801 по 1825 год

Александр I стал первым и последним правителем России, обходившимся без органов, охраняющих государственную безопасность методами тайного сыска. Четверть века так прожили, и государство не погибло. Кроме того, он вплотную подошёл к черте, за которой страна могла бы избавиться от рабства. А также, одержав победу над Наполеоном, возглавил коалицию европейских монархов.

Александр Головков

Зигзаги судьбы Маршала Победы

1 декабря 1896 года родился Георгий Константинович Жуков

Его заслуги перед отечеством были признаны официально и всенародно, отмечены высочайшими наградами, которых не имел никто другой. Потом эти заслуги замалчивались, оспаривались, отрицались и снова признавались полностью или частично.