Подписаться на обновления
16 сентябряПонедельник

usd цб 64.4711

eur цб 71.5307

днём
ночью

Восх.
Зах.

18+

ОбществоЭкономикаВ миреКультураМедиаТехнологииЗдоровьеЭкзотикаКнигиКорреспонденция
Печать  ТВ и радио  Новые медиа  Медиабизнес  Стартапы  Кризис в СМИ  Информационное право  Facebook  Живой Журнал  Экономика знания  ВКонтакте  Общественное достояние  Ноосфера 
Натан Маттис, theidealist.ru   суббота, 15 декабря 2018 года, 16:00

Хранители Интернета?
«Некоторые называют нас хранителями — мне нравится говорить, что мы архивариусы»


   увеличить размер шрифта уменьшить размер шрифта распечатать отправить ссылку добавить в избранное код для вставки в блог




Как бы сервисы подписок не убеждали вас в том, что всё можно найти на Amazon или Netflix, это не так. Хотите, например, почитать старую книгу Бретта Кавано (или их теперь печально известный ежегодник)? Любопытно посмотреть кучу винтажных объявлений с сигаретами? Как насчет просмотра самой большой коллекции тибетской буддийской литературы в мире? Есть лишь одно место в сегодняшнем мире, где это доступно, и это не Google или какие-то пиратские сайты.

«У меня есть правительственное видео о том, как мыть руки или готовиться к ядерной войне» — говорит Марк Грэм, директор Wayback Machine, интернет-архива. «Мы могли бы легко составить список .ppt-файлов на всех сайтах .mil, Military Industrial PowerPoint Complex».

Грэм недавно беседовал с несколькими группами участников конференции Online News Association 2018, и Ars Technica повезло быть частью одной из групп. Позже он сделал полную презентацию конференции, которая теперь доступна в аудио форме. И главный вывод заключается в том, что масштаб интернет-архива сегодня может быть так же трудно понять, как масштаб самого Интернета.

А вот физическое пространство некоммерческой организации вполне простое, во всяком случае по мнению Грэма. Основная зона находится в старой церкви (скамьи по-прежнему нетронуты) в Сан-Франциско, всего в организации работает около 200 сотрудников. В архиве также находится склад для хранения физических носителей — не только книг, но таких вещей, как виниловые пластинки. Вот где основной единицей измерения информации служит «контейнер для доставки», шутит Грэм. Архив получает огромное количество материалов каждые две недели.

В настоящее время компания является вторым по величине хранилищем отсканированных книг в мире, после Google. Грэм говорит, что их количество больше четырех миллионов. В архиве даже есть список пожеланий для следующих 1,5 миллионов сканирований, включая все, что цитируется в Википедии. Да, Wayback Machine также ищет то, что удалено в Wiki (Грэм недавно рассказывал BBC, что боты Wayback восстановили почти шесть миллионов потерянных и удалённых страниц). Сегодня книги, опубликованные до 1923 года, можно бесплатно скачать через Интернет-архив, и многие из них могут быть использованы как цифровая копия.

Конечно, в наши дни Интернет-архив предлагает гораздо больше, чем текст. К примеру, в нём есть архив более 1,6 млн. записей программ новостей с возможностью упорядочивания и доступа, по ключевым словам (трансляции становятся доступны через 24 часа в виде двухминутных кусов с возможностью поиска). Растущая аудио- и музыкальная часть интернет-архива охватывает радионовости, подкасты и физические медиа (например, сборник из 200 000 пластинок, недавно пожертвованный библиотекой Бостона). А ещё организация может похвастаться обширной классической коллекцией видеоигр, которую каждый может загрузить в эмулятор в браузере для исследований или развлечений. Официально этот раздел включает в себя более 300 000 игр и программ, «поэтому вы можете фактически играть в Oregon Trail на старом компьютере Apple C через браузер прямо сейчас — без рекламы и отслеживания ваших действий» — говорит Грэм.

«Некоторые называют назвать нас хранителями» — говорит он. «Мне нравится говорить, что мы архивариусы».

В целом, по оценкам Грэма, в Internet Archive добавляется четыре петабайта информации в год. Текущий архив организации составляет 22 петабайта, но в Интернет-архиве по факту 44 петабайта. «Потому что мы параноики, — говорит Грэм. «Хранилища информации могут выйти из строя, а у нас есть репутация». Эта «паранойя» помогла организации пережить пожар, нанесший ущерб в 600 000 долларов — без потери каких-либо архивных данных.

Универсальный доступ к знаниям (и фактам, огромному количеству фактов)

Цель создания и ведения интернет-архива не меняется на протяжении последних 22 лет: «универсальный доступ ко всем знаниям». Это в эпоху Интернета означает, конечно, использование небольшой армии ботов, и Грэм отмечает, что в Internet Archive постоянно используется подобное программное обеспечение. Примерно 7 000 одновременных процессов обрабатывают сеть, охватывая 1,5 миллиарда страниц в неделю. Некоторые вещи, такие как домашняя страница Google или сайт The New York Times, могут просматриваться много раз в день; к другим вещам обращаются гораздо реже.

«Мы пытаемся получить все, но это сложно» — отмечает Грэхем. «встроенный Javascript, интерактивные приложения — мы не можем получить некоторые из этих материалов, но мы работаем над этим».

В архив добавляются такие вещи, как эфемерные медиа вроде Snapchat или публичные чаты Telegram, а Wayback Machine поддерживает локальные контакты в местах, где некоторые медиа-архивы или серверы могут подвергаться риску (в последнее время Грэхем отмечает партнеров в Египте, например).

Результатом всего этого является то, что Wayback Machine превратилась во что-то гораздо более полезное, чем просто забавные ностальгические путешествия в прошлое. Мы использовали его много раз. К примеру, совсем недавно, в 2018, президент Трамп заявлял в твиттере что Google перестал публиковать Обращение Президента США (State of Union Address – прим.ред.) на своей главной странице (как это происходило в прошлом). Прежде чем Google ответила, мы обратились к интернет-архиву с простым вопросом — есть ли копия?

«Я люблю Google, но в их обязанности не входит создание копий своей домашней страницы каждые 10 минут» — говорит Грэм. «Это наша работа».

Грэм рассказывает, что Wayback Machine сделала 835 копий главной страницы Google в январе 2018 года. «Таким образом, мы смогли помочь установить правду прямо. Мы не становимся на чью-либо сторону, но помогаем установить правду».

Сайт сыграл аналогичную роль, когда Белый дом недавно удалил свои архивы рассылок, а ряд организаций (а не только новостных, но и такие организации, как экологические компании или ACLU), оказались без соответствующих копий. И доказательства Wayback Machine были приняты в суде. «Существует много событий, которые со временем приобретают большую важность» — добавляет Грэм. Как бывший вице-президент NBC News, он также с гордостью указывает на то, что сайт цитируется средствами массовой информации примерно пять раз в день.

Чтобы улучшить эту репутацию, Грэм рассказывает, что Wayback Machine тонко работает над совершенствованием своих пользовательских инструментов. В нижней левой части главной страницы Wayback Machine вы найдете, например, общедоступные API. Грэм указывает на то, что люди используют их для создания таких вещей, как дифференциатор, где вы можете сделать две копии определённой страницы и сравнить их. Другой инструмент, созданный пользователем, который привлек его внимание, позволяет взглянуть на сайт и сделать радиальный древовидный график, чтобы увидеть, как его структура меняется со временем.

Хотя, возможно, самый простой и эффективный инструмент для всех — это сама технология Wayback Machine — сайт позволяет кому-либо вручную отправлять ссылку на интернет-архив для архивирования прямо из дома. «Если я гуляю со своей кошкой в саду, и вижу историю в Новостях Google, я могу отправить страницу на печать. Но сегодня вы также можете отправить её в Интернет-архив» — говорит Грэм. По его оценкам, это до миллиона снапшотов в неделю.

«Мы сохраняем всё подряд, без какой-либо конкретной цели» — говорит он. Что-то находят боты, что-то волонтёры. В результате мы можем увидеть многое, например оригинальный сайт Ars Technica. (К счастью, 20 лет спустя, никто еще не сообщил нам о «плохих, плохих вещах, таких как NT, Linux и BeOS-контент в одном разделе».)

Источник: theidealist.ru




ОТПРАВИТЬ:       



 




Статьи по теме:



Не сразу строится

История проекта «Ноосфера» и глобальные перспективы открытого доступа

Ассоциация интернет-издателей была создана в 2010 году объединением единомышленников, которые считали важным обеспечить русскоязычным пользователям доступ к культуре и знаниям. Ключевыми направлениями работы стали поддержка в России открытых лицензий Creative Commons и привлечение внимания к вопросам общественного достояния и сохранения культурного наследия. Опыт и результаты исследований привели к «Ноосфере» — проекту, вобравшему в себя все теоретические наработки в области авторского права и новомедийных практик.

31.05.2019 21:50


Библиотека по-новому

Современное учреждение культуры — это не только книги, но и мероприятия

Алексей Емельянов, директор Костромской областной универсальной научной библиотеки, рассказал «Частному корреспонденту» о важности цифровизации и модернизации библиотек.

31.05.2019 16:00, Татьяна Струкова



Открытый – значит, нужный

О музеях и библиотеках, открывших доступ к своим архивам для широкой общественности

Все больше организаций культуры предоставляют пользователям возможность безвозмездно использовать материалы своих архивов и экспозиций. Политика открытости помогает музеям и библиотекам интегрироваться в цифровое общество и привлекать новых пользователей. Видимость коллекций при таком раскладе только растет, как и известность организаций культуры.

30.05.2019 16:37


«Главная цель библиотеки — продвижение книг и чтения»

О развитии современных библиотек и оцифровке библиотечных архивов

Заместитель директора по внедрению новых информационных технологий Магаданской областной универсальной научной библиотеки им. А. С. Пушкина Николай Бабиченко рассказал «Частному корреспонденту» о сложностях оцифровки произведений, защищённых авторским правом, и о важности присутствия библиотеки в медиа-пространстве.

28.05.2019 16:00, Татьяна Струкова


Исходный код

Как работают сервисы открытого доступа?

Сегодня стала очевидной потребность в открытости не только в области результатов деятельности исследователей и разработчиков, но и в области исходных данных. «Частный корреспондент» рассказывает о десяти успешных сервисах открытого доступа и о моделях их монетизации.

27.05.2019 16:00


«Библиотека должна использовать любые площадки, которые могут повысить эффективность её деятельности»

Какой должна быть современная библиотека

Заместитель директора по библиотечной работе Ставропольской краевой универсальной научной библиотеки им. М. Ю. Лермонтова Татьяна Москвитина считает, что современная библиотека должна быть удобной, мультиплатформенной и доступной любому пользователю вне зависимости от его географического положения. Но для достижения этого библиотекам еще многому предстоит научиться.

26.05.2019 16:00, Татьяна Струкова


Оцифровка культуры

Как работают национальные проекты по оцифровке культурного наследия в России и за рубежом

С начала года в России должна была развернуться обширная работа государственных структур по цифровизации культурной среды. В планах развития до 2024 года — строительство новых центров культуры, виртуальных концертных залов, улучшение качества культурной среды, проведение фестивалей детского творчества и многое другое.

25.05.2019 16:00, Татьяна Струкова


«Государство должно вывести учреждения культуры из сферы услуг»

О важности библиотек как культурно-просветительских учреждений и их трансформации в современном мире

«Частный корреспондент» поговорил с директором МБУК Иркутская «Централизованная библиотечная система», заслуженным работником культуры РФ Натальей Кустовой и узнал, каким будет будущее библиотечного дела и как на него повлияют государственные реформы.

24.05.2019 14:15, Татьяна Струкова


Надежный доступ

О функциях библиотек в современном обществе и представлении об идеальной электронной библиотеке

Куратор проекта электронной библиотеки, заведующий сектором Центральной городской публичной библиотеки имени В. В. Маяковского Иван Прозоров считает, что библиотека остается идейно прежней и в электронную эпоху. Присутствие в интернете — прямое продолжение «вечных задач» любой библиотеки: создания фонда документов и обеспечения доступа к информации.

15.05.2019 19:00, Татьяна Струкова






 

 

 

 

Календарь

Олег Давыдов

Колесо Екатерины

Ток страданий, текущий сквозь время

7 декабря православная церковь отмечает день памяти великомученицы Екатерины Александрийской. Эта святая считалась на Руси покровительницей свадеб и беременных женщин. В её день девушки гадали о суженом, а парни устраивали гонки на санках (и потому Екатерину называли Санницей). В общем, это был один из самых весёлых праздников в году. Однако в истории Екатерины нет ничего весёлого.

Ив Фэрбенкс

Нельсон Мандела, 1918-2013

5 декабря 2013 года в Йоханнесбурге в возрасте 95 лет скончался Нельсон Мандела. Когда он болел, Ив Фэрбенкс написала эту статью о его жизни и наследии

Достижения Нельсона Ролилахлы Манделы, первого избранного демократическим путем президента Южной Африки, поставили его в один ряд с такими людьми, как Джордж Вашингтон и Авраам Линкольн, и ввели в пантеон редких личностей, которые своей глубокой проницательностью и четким видением будущего преобразовывали целые страны. Брошенный на 27 лет за решетку белым меньшинством ЮАР, Мандела в 1990 году вышел из заточения, готовый простить своих угнетателей и применить свою власть не для мщения, а для создания новой страны, основанной на расовом примирении.

Молот ведьм. Существует ли колдовство?

5 декабря 1484 года началась охота на ведьм

5 декабря 1484 года была издана знаменитая «ведовская булла» папы Иннокентия VIII — Summis desiderantes. С этого дня святая инквизиция, до сих пор увлечённо следившая за чистотой христианской веры и соблюдением догматов, взялась за то, чтобы уничтожить всех ведьм и вообще задушить колдовство. А в 1486 году свет увидела книга «Молот ведьм». И вскоре обогнала по тиражам даже Библию.

Максим Медведев

Фриц Ланг. Апология усталой смерти

125 лет назад, 5 декабря 1890 года, родился режиссёр великих фильмов «Доктор Мабузе…», «Нибелунги», «Метрополис» и «М»

Фриц Ланг являет собой редкий пример классика мирового кино, к работам которого мало применимы собственно кинематографические понятия. Его фильмы имеют гораздо больше параллелей в старых искусствах — опере, балете, литературе, архитектуре и живописи — нежели в пространстве относительно молодой десятой музы.

Игорь Фунт

А портрет был замечателен!

5 декабря 1911 года скончался русский живописец и график Валентин Серов

…Судьба с детства свела Валентина Серова с семьёй Симонович, с сёстрами Ниной, Марией, Надеждой и Аделаидой (Лялей). Он бесконечно любил их, часто рисовал. Однажды Маша и Надя самозабвенно играли на фортепьяно в четыре руки. Увлеклись и не заметили, как братик Антоша-Валентоша подкрался сзади и связал их длинные косы. Ох и посмеялся Антон, когда сёстры попробовали встать!

Юлия Макарова, Мария Русакова

Попробуй, обними!

4 декабря - Всемирный день объятий

В последнее время появляется всё больше сообщений о международном движении Обнимающих — людей, которые регулярно встречаются, чтобы тепло обнять друг друга, а также проводят уличные акции: предлагают обняться прохожим. Акции «Обнимемся?» проходят в Москве, Санкт-Петербурге и других городах России.

Илья Миллер

Благодаря Годара

85 лет назад, 3 декабря 1930 года, родился великий кинорежиссёр, стоявший у истоков французской новой волны

Имя Жан-Люка Годара окутано анекдотами, как ни одно другое имя в кинематографе. И это логично — ведь и фильмы его зачастую представляют собой не что иное, как связки анекдотов и виньеток, иногда даже не скреплённые единым сюжетом.

Денис Драгунский

Революционер де Сад

2 декабря 1814 года скончался философ и писатель, от чьего имени происходит слово «садизм»

Говорят, в штурме Бастилии был виноват маркиз де Сад. Говорят, он там как раз сидел, в июле месяце 1789 года, в компании примерно десятка заключённых.

Александр Головков

Царствование несбывшихся надежд

190 лет назад, 1 декабря 1825 года, умер император Александра I, правивший Россией с 1801 по 1825 год

Александр I стал первым и последним правителем России, обходившимся без органов, охраняющих государственную безопасность методами тайного сыска. Четверть века так прожили, и государство не погибло. Кроме того, он вплотную подошёл к черте, за которой страна могла бы избавиться от рабства. А также, одержав победу над Наполеоном, возглавил коалицию европейских монархов.

Александр Головков

Зигзаги судьбы Маршала Победы

1 декабря 1896 года родился Георгий Константинович Жуков

Его заслуги перед отечеством были признаны официально и всенародно, отмечены высочайшими наградами, которых не имел никто другой. Потом эти заслуги замалчивались, оспаривались, отрицались и снова признавались полностью или частично.