«Старый» интернет быстро исчезает

В 2005 году студент по имени Алекс Тью устроил мозговой штурм на миллион долларов.

20-летний парень искал идею, чтобы заплатить за учёбу. Поэтому он набросал на блокноте простую фразу: «Как стать миллионером».

Двадцать минут спустя у него появился ответ.

Тью создал сайт под названием «Домашняя страница за миллион долларов». Бизнес-модель была непристойно простой: на ней располагался миллион пикселей рекламного пространства, причем пиксели можно было купить в блоках по 100 штук -1 доллар за штуку. Как только вы покупали их, они оставались вашими навсегда. Когда миллионный пиксель будет продан, Тью станет миллионером. По крайней мере, таков был план.

Домашняя страница за миллион долларов открылась 26 августа 2005 года, после того как Тью потратил 50 евро на регистрацию домена и настройку хостинга. Рекламодатели покупали пиксели и вставляли ссылку, крошечное изображение и небольшой объем текста, которые появлялись когда курсор пользователя наводился на него.

Спустя немногим более месяца, благодаря сарафанному радио и постоянно растущему вниманию средств массовой информации, домашняя страница Тью собрала более 250 000 долларов (140 000 фунтов). В январе 2006 года последние 1000 пикселей были проданы с аукциона за 38 100 долларов США (21 500 фунтов стерлингов); Тью действительно заработал миллион.

Домашняя страница за миллион долларов все еще находится в сети, спустя почти полтора десятилетия после ее создания. Многие клиенты, среди которых были такие, как британская газета The Times, туристический сервис Cheapflights.com, интернет-портал Yahoo! и рок-дуэт Tenacious D – получили 15 лет рекламы за единовременный платеж. Сайт по-прежнему имеет несколько тысяч посетителей каждый день; вероятно, это были очень хорошие инвестиции.

Тью, который сейчас продаёт приложение Calm для медитации и осознанности, действительно стал миллионером. Но созданная им домашняя страница также стала чем-то другим: живым музеем более ранней эпохи Интернета. Пятнадцать лет могут показаться небольшим сроком, но с точки зрения интернета это похоже на геологический век. Около 40% ссылок на домашней странице Million Pixelтеперь ссылаются на мертвые сайты. Многие другие теперь указывают на совершенно новые домены, их оригинальные URL-адреса продаются новым владельцам.

Домашняя страница за миллион долларов показывает, что этот ранний период Интернета почти незаметен. В офлайновом мире часто говорят о закрытии, скажем, местной газеты. Но онлайн-сайты умирают, часто без фанфар, вы обнаруживаете это когда щелкаете по заголовку и попадаете на пустую страницу.

***

Около десяти лет назад я провел два года, работая над блогом о рок-музыке для музыкальной секции AOL, пионера Интернета, который сейчас принадлежит американской телефонной компании Verizon. Я отредактировал и написал сотни живых обзоров, музыкальных новостей, интервью с художниками и музыкантами. Фейсбук и Твиттер уже были массовыми драйверами аудитории, а смартфоны связывали нас с Интернетом между работой и домом; серфинг в Интернете уже стал круглосуточным занятием.

Если бы Брюстер Кале не настроил Интернет-архив и не начал бы сохранять вещи, не ожидая чьего-либо разрешения, мы бы все потеряли — Дам Венди Холл

Вы можете вполне разумно предположить, что, если мне когда-нибудь понадобится показать доказательства моего труда, надо будет только выполнить поиск в Google. Но вы ошибаетесь. В апреле 2013 года AOL внезапно закрыла все свои музыкальные сайты, исчез архив за многие годы — коллективная работа десятков редакторов и сотен авторов. Мало что осталось, кроме нескольких статей, сохраненных в интернет-архиве, некоммерческом фонде в Сан-Франциско, созданном в конце 1990-х годов инженером-компьютерщиком Брюстером Кале.

Это самая заметная из организаций по всему миру, пытающаяся спасти некоторые из последних остатков первого десятилетия присутствия человечества в Интернете, прежде чем оно полностью исчезнет.

Дам Венди Холл, исполнительный директор Института веб-науки в Университете Саутгемптона, однозначно оценивает работу архива: «Если бы не они, у нас не было бы ничего» из раннего материала, говорит она. «Если бы Брюстер Кале не настроил Интернет-архив и не стал бы сохранять вещи — не дожидаясь чьего-либо разрешения — мы бы все потеряли».

Дам Венди говорит, что в архивах и национальных библиотеках был опыт сохранения книг, газет и периодических изданий, потому что печать существует давно. Но появление Интернета – и то, как быстро он стал массовой формой общения и самовыражения — возможно, застало их врасплох. С тех пор стали предприниматься попытки архивировать Интернет«В Британской библиотеке должна быть опубликована копия каждой местной газеты» — говорит она. По мере того, как газеты переходят от печати к Интернету, архивирование приобретает другую форму. Являются ли эти сайты столь же важным ресурсом, как и бумага, которая им предшествовала?

Газетные архивы также могут быть утеряны, когда издательства закрываются или сливаются с другими. «Я полагаю, что у большинства газет есть какой-то архив» — говорит женщина. «Но они всё равно могут быть утеряны без соответствующей централизации».

Кто за это заплатит? Мы производим гораздо больше материалов, чем раньше»

Одна из основных проблем при попытке архивирования Интернета заключается в том, что он никогда не стоит на месте. Каждую минуту — каждую секунду — все больше фотографий, сообщений в блогах, видео, новостей и комментариев. Хотя цифровые хранилища резко упали в цене, архивирование всего этого материала все еще стоит денег. «Кто за это заплатит?» — вопрошает Венди. «Мы производим гораздо больше материалов, чем раньше».

В Великобритании роль цифрового хранителя частично пала на Британскую библиотеку. Библиотека управляет Британским веб-архивом, который собирает веб-сайты по разрешению с 2004 года. Менеджер по работе с архивами Джейсон Уэббер говорит, что проблема намного значительнее, чем думает большинство людей.

«Это не только ранний материал. Большая часть интернета не сохранилась» — говорит он.

«Веб-архив впервые начал создавать архивы в 1996 году, через пять лет после создания первых веб-страниц. В ту эпоху не было ничего, что когда-либо копировалось из живой сети». Даже первой веб-страницы, созданной в 1991 году, больше не существует; страница, которую вы можете просмотреть в Консорциуме World Wide Web, является копией, сделанной годом позже.

Большая часть первых пяти лет в британском сегменте сети материалы публиковались в субдомене .ac.uk – это были академические статьи, написанные учеными. Только в 1996 году в Интернете стали появляться более общие сайты, и коммерческих сайтов стало больше, чем академических.

Британская библиотека выполняет один «обход домена» каждый год, сохраняя все, что публикуется в Великобритании. «Мы пытаемся получить все, но делаем копию лишь раз в год. Ограничение для многих из этих сайтов составляет 500 МБ; этого хватает для небольших страниц, но всего несколько видео – лимит исчерпан». Однако новостные сайты, такие как BBC News, сканируются чаще. Библиотека, говорит Уэббер, постаралась составить как можно более полную картину таких событий, как Брексит, Олимпийские игры 2012 года в Лондоне и 100-летие Первой мировой войны.

«Я думаю, что был очень низкий уровень понимания того, что чего-то не хватает» — говорит Уэббер. «Цифровой мир очень эфемерен, мы смотрим на наши телефоны, материал на экране меняется, и мы не думаем об этом. Но теперь люди все больше осознают, сколько мы можем потерять».

Стоит учитывать, что собираются и сохраняются только публичные материалы; еще большее количество важных с культурной или исторической точки зрения данных хранится в архивах людей, например на их жестких дисках. Но немногие из нас думают об архиве для потомков.

«Британская библиотека полна писем между людьми. Письма политиков друг другу, например, представляют историческую ценность».

Мы рассматриваем материал, который мы публикуем в социальных сетях, как нечто, что всегда будет рядом, стоит всего лишь щелкнуть мышью. Но недавняя потеря около 12 лет музыки и фотографий на сайте MySpace — некогда самом популярном в США — показывает, что даже материалы, хранящиеся на самых крупных сайтах, могут быть утеряны.

И даже сервисы Google не застрахованы. Google+, попытка поискового гиганта создать социальную сеть, конкурирующую с Facebook, закрылась 2 апреля. Все ли пользователи создавали резервные копии фотографий и воспоминаний, которыми они поделились на нем?

«Размещение ваших фотографий на Facebook не архивирует их, потому что однажды Facebook не будет»— говорит Уэббер. Если у вас есть какие-либо сомнения по поводу временного характера Интернета, потратьте несколько минут на просмотр домашней страницы за миллион долларов. Это свидетельство того, как быстро исчезает наше онлайн-прошлое.

Есть и другая сторона утери данных. Венди отмечает, что не архивирование историй с новостных сайтов может привести к избирательному взгляду на историю — например, новые правительства могут решить не сохранять истории или архивы, которые выставляют их в плохом свете.

Политика часто связана с технологиями — Джейн Уинтерс

«Как только происходит смена руководства или владельца, сайты могут закрыться», — говорит Джейн Уинтерс, профессор цифровых гуманитарных наук в Лондонском университете. «Или посмотрите на сайты предвыборной агитации, которые по своей природе временны».

Иногда утраченные участки отражают еще большие сейсмические изменения; смерть и рождение целых народов. «Это случилось с Югославией; .yu был доменом верхнего уровня для Югославии, и всё закончилось, когда страна рухнула. Есть исследователь, который пытается восстановить то, что было там до распада» — говорит она.

Венди Холл проводит видит параллели с физическим миром. Когда ей было 15 лет, в конце 1960-х годов она появилась в массовке  в записи музыкального шоу BBC Top of the Pops.

Шоу было показано на Рождество. «Телевизор был включен, и моя мама сказала: «Смотри, смотри! Но я пропустила это. А потом пошла Би-би-си и попыталась получить копию материала – но она оказалась утерянной, они переписали изначальную копию. Я никогда так и не увидела данное событие».

«Старый» интернет быстро исчезает