“Google wrote its mission statement in 1999, a year after launch, setting the course for the company’s next decade: “Google’s mission is to organize the world’s information and make it universally accessible and useful.” ¶
For years, Google’s mission included the preservation of the past. In the last five years, starting around 2010, the shifting priorities of Google’s management left these archival projects in limbo, or abandoned entirely. ¶
After a series of redesigns, Google Groups is effectively dead for research purposes. The archives, while still online, have no means of searching by date. ¶
Google News Archives are dead, killed off in 2011, now directing searchers to just use Google.” • #архивисты - urbansheep@gmail.com
“There are a couple things you can do to help combat link rot for your own bookmarks moving forward. ¶ First, donate to the Internet Archive: http://archive.org/donate/ ¶ Second, if you use a bookmark storage service like Pinboard or others, ask them to support adding submitted URLs to the Wayback Machine. Their bookmarklets or plugins could also submit to the Wayback Machine's "Save Page Now" endpoint. Or that could be done by the service on the back-end. For services that provide full page archives, they could capture a full WARC (network headers plus content), so every successfully cached page could be donated to the Internet Archive and integrated into the Wayback Machine. Or all of the above.” • #архивисты - × × ×
СЯУ (с печалью), что «Внутри и вне помойного ведра» Фрица Перлза в интернетах есть только в виде сырого doc-файла (в лучшем случае), с OCR-артефактами, номерами страниц в тексте, и всем таким. Опять делать ебук вручную. (
Дико не хватает сервиса по оцифровке всего бумажного во всё партизанско-цифровое, а-а-а. Вот ведь дикое время, в которое выпускали бумажные книги издательства, которых часто больше не осталось, права от которых переуступлены (или проэтосамлены) непонятно кому. И никто ведь не возьмётся цифровать в ближайшие 10-15 лет, потому что бой за копирайт идёт кровавый, а истечения прав переводчиков/издательств не произойдёт ещё дооолго. Это единственное, кажется, почему приходится держаться руками-ногами за бумажные книги. Не потому, что они лучше, а потому что других нет. ( #прокниги - #архивисты - × × ×
(С другой стороны, придут вот нормальные OCR-инструменты для офисных потребителей на базе статистического гугл-корпуса, тогда мы, ебучные склеиватели, корректоры и оцифровщики, натурально похохочем. Опять же, гугл-букс.) - × × ×
а вот интересно, grayzone-фриланс «сделай ебуку из OCR» мог бы быть смешной. я бы таким занимался для души, как-то мне нравится (ну и плюс как немножечко программист мог бы слегка оптимизировать). - обречённый зверёк¹
Мне кажется, это надо делать, как биржу-краудфандинг. Выгружаем список книжек, которые есть только в бумаге, участники книжного базара туда заносят денег «мне не жалко на оцифровку», кто-то видит, что книжка интересная или деньги интересные, берётся, получает деньги себе, книжку на базар финансировавшим, а потом и всем. Работает всё исключительно на доброй воле, потому что работа рутинная и унылая, денег все платить зажмотятся, дедлайны, как в кикстартере, не сработают, потому что все такие книжки по умолчанию узконишевые — у меня к таким относится вся психология, которую хрен найдёшь в цифре, или там Хайнлайн, на которого ни у кого нет прав благодаря козловству наследников. - × × ×
Запускать такой в России нельзя, по понятным причинам, делать его открытым нельзя по тем же понятным причинам, вот и будет, как с Флибустой, только сложнее — у Флибусты нет элемента вознаграждения оцифровщикам/редакторам. - × × ×
Новый релиз Wayback Machine: теперь с АПИ, проверкой битых ссылок, подписным сервисом и «сохранением страниц по запросу» — Internet Archive: Wayback Machine - https://archive.org/web/
“NewsDiffs archives changes in articles after publication. Currently, we track nytimes.com, cnn.com, politico.com and the bbc.co.uk.” • #архивисты • #таймлайны - × × ×
“An update is simply a post with a history. But because data plus time almost always reveals a story, that history is rich with possibility.” (“The Update” — http://contentsmagazine.com/article...) - × × ×
The Morgue Lives! — Welcome to the archives repository of the most respected newspaper in the world. • Storyboard - http://storyboard.tumblr.com/post...
"It is a cramped basement annex, stacked high with metal filing cabinets, full of three-fourths of a million pounds of old newspaper clippings and photos, going back 160 years. It’s simply called “the morgue.” • To get here, a reporter must leave the shiny glass tower that is the 40th Street headquarters of the New York Times, walk a half-block down the street, and descend three levels below the sidewalk. There, in a nondescript tower, she will emerge from a dirty elevator, walk past a janitor’s closet, then past a giant, rusted pump contraption with running water, and finally reach a pair of metal doors. There are glue traps with belly-up cockroaches in the corner. • “I swear, we haven’t taken you to a torture chamber,” jokes my guide, a Times photo editor, leading me through the double doors. There is no computer in the morgue. No internet service. No cell reception. If we were to die here — perhaps by an improperly secured two-ton cabinet — it’s safe to say it would take days for anyone to find our bodies. • Welcome to the archives repository of the most respected newspaper in the world." #архивисты - × × ×
(Жаль, что за все годы парни в тамблере не научились делать в своих темах нормальные тайтлы страниц.) - × × ×
“Roth didn’t have what you might have called a traditional reporting background. He joined the morgue in 1993, after visiting to research his distant cousin, Times reporting great Meyer Berger. He says he’s worked as a stockbroker, landscaper, art dealer, cross-country truck driver, and a narcotics search agent at JFK — a skill that came in handy for the Times when TWA Flight 800 went down (he knew the onboarding and offboarding procedures). •
Ask Roth about almost anything — New York City explosions, feminist history, Yeats, Iran — and he will know the answer. It’s as if the wisdom of the morgue has filtered into his blood.” - × × ×
“We want to collect one copy of every book,” said Brewster Kahle, who has spent $3 million to buy and operate this repository situated just north of San Francisco. “You can never tell what is going to paint the portrait of a culture.” As society embraces all forms of digital entertainment, this latter-day Noah is looking the other way. A Silicon Valley entrepreneur who made his fortune selling a data-mining company to Amazon.com in 1999, Mr. Kahle founded and runs the Internet Archive, a nonprofit organization devoted to preserving Web pages — 150 billion so far — and making texts more widely available. But even though he started his archiving in the digital realm, he now wants to save physical texts, too. “We must keep the past even as we’re inventing a new future,” he said. “If the Library of Alexandria had made a copy of every book and sent it to India or China, we’d have the other works of Aristotle, the other plays of Euripides. One copy in one institution is not good enough.” #архивисты - × × ×
«Меня беспокоит что мы не можем использовать наше золотое наследие, которое закрыто, если мы говорим о звуке, как раз, вот этой глупостью с авторскими правами. Потому что никто не придет сегодня и не возьмется издавать наше наследие, потому что на нем заработать нельзя, - коммерсантам это неинтересно. Оно выпадает полностью из оборота, потому что еще и нельзя транслировать, потому что за это нужно заплатить. А кто будет платить?» #архивисты - × × ×
«— Так вот, подходя к проблемам архивов, представим сколько таких архивов по всей России? А это еще и радиоархивы. Есть Омская государственная телерадиокомпания, Норильская, Сибирская, какая угодно. У всех свои архивы. Мы должны это все закопать на помойку? Оцифровки никакой не ведется. То, что погибло – погибло, но то, что спасти можно, оно лежит сейчас. ¶ И вот эта псевдопрограмма «Цифровая Россия» ничего не делает. Я посмотрел, деньги, отпущенные на оцифровку на 2010-2011 годы, непотрачены. Никто не возьмется за эту проблему. ¶ — Я пришел в «Центральный дом литераторов» к директору и говорю: «У вас есть архивы, денег на оцифровку нет, времени нет, специалистов нет и ничего нет. Я вам это дело оцифрую бесплатно, с гарантией качества, и отдаю ее вам на хранение». ¶ Но это просто оцифровка, толку от нее никакого (как лежала так и будет лежать на диске), нужно вытащить это на информационную поверхность, завести страницу «Центрального дома литераторов» на проекте, и начать выставлять материалы. Соответственно, в шапке нашего проекта видно кто и что, есть информация о ЦДЛ и вся она будет в индексироваться в поисковиках интернета, она будет работать. А мне для проекта это тоже очень интересно, потому что не существует другой площадки, куда можно положить эти материалы.» - × × ×
«— Вот такие совместные проекты позволят всем архивным организациям перейти на технологическую работу, что у меня и происходит. Во всем мире это происходит плановым и осознанным порядком, а у нас осознания этой проблемы даже у людей, которые руководят архивами, толком нет. Отдельные граждане понимают, но в системе – ничего не происходит. Тут деньги, может быть, и выделяются, но на что и как они уходят – нет системы. Поэтому я и говорю, что нужен центральный агрегатор, который всем этим будет заниматься. Например, Министерство оцифровки, условно говоря.» - × × ×
"Once, we stored our photos and other mementos in shoeboxes in the attic; now we keep them online. That puts our stuff at the mercy of companies that could decide to throw it away—unless Jason Scott and the Archive Team can get there first." #архивисты - × × ×
“Scott also evangelizes for data preservation on the tech-conference circuit, where his affinity for the old is sometimes reflected in his wardrobe. For example, he has been known to deliver a presentation in steampunk regalia—aviator-style goggles, a velvet jacket, and the top hat.” - × × ×