"Пришла в голову смутная мысль. Почти все такие интерфейсы-указатели работают с повышением формализации и понижением содержательности, то есть богатым содержательным текстам ставится в соответствие формальная простая система - каталог, указатель, метка и пр. Идет сильнейшее вырождение смысла - потому и трудно искать-то. Потому в одном смысле искать легко, а в другом трудно. Может быть, делать не столь вырожденные системы? Например, краткий текст, нечто вроде резюме, но не формальный, целостный текст, почти каждая фраза которого служит отсылкой на текст или совокупность текстов в ленте. Сам такой текст содержательно и внятно объясняет, что говорится во всей совокупности подчиненных текстов, и является одновременно оглавлением - своеобразным, совмещенным с содержательным рассказом." - × × ×
Тут хорошо посмотреть на активное сопротивление Левенчука системам организации, которые не соответствуют его ментальным картам — http://friendfeed.com/ailev... (он их называет «теги», но на их место можно что угодно поставить — фасетный рубрикатор, классификатор, глоссарий, индекс и пр.). - × × ×
Вот у Левенчука на всё ответом является связка «ключеслова + поиск». А Лилия Ефимова в рассказе про всякие выводы из закрытых интранетных исследований (т.е на активных, но не массовых сообществах) рассказывала как раз обратный кейс работы с накопленным — в поиск люди не ходят, потому что нужно *сформулировать запрос*. Эта когнитивная нагрузка уже срезает всю основную массу запросов. Поэтому поиск там умирает. Но контент-то надо использовать! Тогда пошли классическим путём — горизонтальная навигация, страницы по теме, «а не это ли вы искали». Так и вышло, что все технологии нетфликса и амазона по коллаборативной фильтрации в итоге оседают (вернее, пока медленно, но движение именно в ту сторону) в энтерпрайзовых «шахтах со знаниями», потому что там эти знания не просто влияют на продажи, а определяют выживание. - × × ×
Про выживание здесь удачно ложится история, которую напомнила Промета: http://friendfeed.com/prometa... — о том, как американцы проэтосамили рецепт фогбанка, специфического компонента боеголовок для ракет Трайдент. Потеряли из-за того, что кто знал, ушёл на пенсию или умер, а все остальные не в курсе, потому что секретность и ключевые компоненты и процедуры не документированы. - × × ×
Сквадетт, это всё ещё и к нашему с тобой разговору про живую документацию и про обучение работой — в частности, что происходит, когда учить некому, когда приходится изучать по факту мертвый язык. Тут много всяких таких вещей интересных всплывает (например, принцип неопределённости Гейзенберга для документации: невозможно одновременно и производить и анализировать — ты или формулируешь и описываешь, или производишь, две роли в одном не совмещаются). - × × ×
Мы тут недавно были на митапе про семантический веб в музее современнго искусства в Сан Франциско, и слушали музейных работников, которые, не имея на это бюджета, скооперировались по всей стране, чтобы в свободное от работы время разобраться вместе с компьютерным народом почему посетители музейных сайтов не могут ничего находить в огромных онлайновых коллекциях. Оказалось, вот тоже ровно потому, что искусствоведы описывают артефакты в коллекциях абсолютно не теми словами, по которым те же картинки пытаются найти нормальные люди. И всё движение там сейчас — в сторону модерируемых искусствоведами тагов, вводимых народом. - earlyadopter
Ага, классификация должна говорить на языке того, кто будет в ней искать, а не того, кто её будет составлять. И это всегда самостройная штука, набрать её даже всякими фокус-группами — глухое дело, потому что время меняется, культура в каждой отрасли пластична. - × × ×
В больших объёмах суховатых текстов, написанных не на олбанском языке толпой блогеров, а в корпоративной, например, переписке, или в архивах новостей, смыслы уже вполне получается выделять. Для юридического рынка есть, например, продукт конторы, на которую я сейчас тружусь. Он помогает большим юридическим компаниям существенно сокращать время на поиски имеющих отношение к делу документов в документо-хранилищах стороны-ответчика по делам своих клиентов. По закону тут участники судебных разбирательств обязаны предоставлять доступ ко всем имейлам, например, но просмотреть их все глазами — задача нереальная (не только потому, что за это с клиента берут по 400 долларов в час — они бы рады заниматься этим бесконечно, но просто времени столько нет), потому систему обучают на отобранной руками выборке, чтобы потом она автоматом нашла остальные документы, даже когда там не употребляется искомых слов, и никто заранее ничего не обтагивал. Но на весь интернет такое распространить пока кажется нереальным — и из-за тематической широты, и из-за не всегда хорошего языка, и потому, что технология не очень здорово понимает короткие тексты. - earlyadopter
Это — очень интересная для меня тема. Любопытно, что классификация и навигация часто путаются, хотя это (вообще говоря) разные вещи. Хороший пример тут — википедия с её эффектом «одну вкладку закрыл, десять открыл». Де факто навигация осуществляется «по ссылкам из текста» и по кластерным признакам, то есть любая гиперссылка становится частью навигационного механизма, неопределимого и постоянно расширяющегося, тогда как выделимая классификация там по сути отсутствует (она тоже ведется по кластерным признакам и формально классификацией считаться не может). - Неягл☀в
@bylin: я в Сан Франциско. Компании, занимающиеся поиском в корпоративных data repositories — Recommind, Autonomy, Clearwell, Guidance, Kazeon, StoredIQ, ZyLab, и т.п. - earlyadopter
Хе, для меня эта тема — тема-фикс. Есть несколько мутных веб-сервисов в голове. Например, тулза для делания аннотаций, пометок в любых веб-страницах. Типа как в Вордовском рецензировании и Макосовском аноттировании PDF-ов. Но + к ихним инструментам — выделение важности (неважности) кусков текста. Что с этим потом делать — отдельная история: от показывания другим пользователям самого важного в статье и сохранении всего на сайте сервиса, до создания статей-обзоров всяческих отраслей знаний. Идея плавно перетекает в новый формат Wiki: с обзорными статьями (а-ля портал к самым важным материалам по этой теме в интернете), а то и со статьями, составленными прямо из цитат. - samlowry
Кстати, в инициировавшей топик (или как тут в ФФ зовётся начальное сообщение?) статье речь идёт практически об автоматическом создании авторефератов (summarization), в чём и на обычных веб-текстах уже неплохие успехи есть. Я даже жил с американо-индийским профессором по соседству, который как раз на этом специализируется, пытался осилить в своих злостных SEO-целях его книги — но было лень. А вот пример реализованного суммаризатора: http://www.novoteka.ru/ - samlowry