ONLINE

www.reklama.ru. The Banner Network.
А ты сходил на мой bookmark?

НАВИГАЦИЯ ВНУТРИ
Index.html
Текущая заметка
Поиск по сайту
Архив
Источники
Гестбука
Доп. выпуски
СИМПАТИЧНЫЕ МНЕ ПРОЕКТЫ
ФОРУМ.МОСКВА.РУ
Русский журнал
Неткульт
Газета.RU
Анекдоты из России
Русская Рулетка
Журнал Internet
Паравозов News
Вечерний Интернет
ЭхоНет
Спорт сегодня
МобилТелеком News
РЕКЛАМА
RB2 Network. RB2
RB2 Network.
ПОИСК В СЕТИ
Яndex
Апорт
Ау!
Rambler
RamblerTop100
AltaVista
HotBot
Lycos
Yahoo
FTPSearch
FTPSearch.Ru
ЕЖЕ ДВИЖЕНИЕ
ЕЖЕweeka
ЕЖЕдневки
ЕЖЕнедельки
ЕЖЕ ПРАВДА
ФРИ: лица РУНЕТа
Доска Позора
СТАТИСТИКА

Rambler's Top100

TopList



SAVE AS ПОДПИСКА

Достаточно будет указать Ваш E-mail

КНОПКИ

галерея Гельмана Скрипты CGI-BIN -бесплатные скрипты, газета, рейтинг, трюки на css, javascript, html, форум FortuneCity
Дядя Леша на тропе войны Ссылка дня Русского Журнала Ресторанный поиск, критика Ледоколов-News

А это - наша
кнопка

25.08.99 - Заметка 49
Сегодня - несколько коротких заметок и большой текст из прошлого "бумажного" выпуска "Итогов".

Cпичек не найдется?
В феврале этого года Save As уже обращал внимание читателей на самый маленький в мире (на тот момент) Web-сервер, сооруженный, почти в качестве развлечения, исследователями изСтэнфордского университета (wearables.stanford.edu/). Этот рекорд довольно быстро переплюнул сотрудник универститета штата Массачусетс, построив действующий Web-сервер размером... со спичечную головку! Крохотный прибор (на фото)

является полнофункциональным компьютером, имеющим процессор, память, файловую систему и последовательный порт. С детальным описанием проекта можно ознакомиться по адресу www-ccs.cs.umass.edu/~shri/iPic.html, а сам сервер, запущенный в эксплуатацию 14 июля текущего года, обслуживает страницу www-ccs.cs.umass.edu/~shri/iPic-demo.html.

Заметим, что таких размеров компьютеры пока не способны  "работать" большими, серьезными Web-серверами. Да это и не нужно, с куда большим успехом потомки этих прототипов будут применяться в других областях. Например, Web-сервер такого размера без труда поместится не только в консоли домашнего тостера, но даже в патроне обычной электролампочки. Проще говоря, в недалеком будущем любым прибором в доме можно будет управлять из единого командного пункта - браузера на экране компьютера. А домашний сервер получит возможность управлять не системами (допустим, системой электроснабжения в целом), но и любым самым маленьким прибором или даж узлом прибора в отдельности. Еще более ценным приобретением крохотные сервера станут для высокоточной промышленности. О последствиях такого рода нововведений пусть помечтают фантасты - но только пусть поторопятся, в наше время сказка слишком быстро становится былью.

Microsoft-блюз
"Музыкальная" война, начавшиеся с изобретением стандарта сжатия аудиофайлов MP3, не только не утихает, но разгорается все жарче. Напомним, что в боевых действиях участвуют, с одной стороны, онлайновые распространители записей, которым выгоден новый стандарт (он позволяет сильно и с приемлемым качеством сжимать аудиозаписи, что позволяет достаточно быстро скачивать их через Интернет)  и производители MP3-плейеров; с другой - звуозаписывающие компании, желающие, чтобы первые немедленно исчезли с лица земли; и, наконец, сами исполнители, воюющие то за одну сторону, то за другую. В середине августа в самый разгар битвы ворвался авангард компании Microsoft, предложив желающим вооружиться новым стандартом Windows Media Audio. WMA, в отличие от MP3, теоретически не позволяет свободно копировать файлы (таким образом, Microsoft надеялся обуздать пиратов). Однако уже на следующий день после официального представления WMA хакеры выложили в Сеть новую программку-"патч" (точное название и адрес которой мы здесь приводить не станем), позволяющую перехватить аудиопоток от плейра к наушникам и записать его в обычный незащщенный файл. Представитель Microsoft Сара Мерфи заявила, что "Случившееся - не вина разработчиков WMA. Виновата операционная система". Windows, надо полагать - производства той же компании. Арьегард отступил с большими потерями.

Секса у нас нет
Поисковая машина "Яндекс" запустила новый интерфейс по адресу family.yandex.ru. Называется он, естетсвенно, "семейный Яндекс" и отличается от обычного лишь тем, что при поиске игнорируются "взрослые" ресурсы. "Семейный" режим можно включить принудительно - то есть при входе на www.yandex.ru компьютер будет автоматически переключаться в "безопасный" режим. Впрочем, современный девятилетний ребенок при желании легко обойдет этот запрет. Да что там - в мире есть множество других поисковых систем, если уж приспичило найти порносайт. Но это - если приспичило. А вот если в ответ на вполне невинные запросы вроде "игрушка", "подарок", "видео" выпадает до 20 процентов "взрослых" ссылок, нужно ли это ребенку? Скорее всего, он искал действительно игрушку...

ПРОСТО ССЫЛКИ:
- В Рунете наконец появилась профессиональная психодиагностическая площадка (PSYCHOLOGY.RU). Кажущаяся легкость разработки теста привела к вульгаризации культуры тестирования. Лаборатория предоставляет всем желающим бесплатную возможность прохождения ряда психометрических методик и получения развернутой интерпретации результатов.
- 22 августа начался конкурс среди авторов сайта "Творчество неизвестных авторов". В данный момент идет свободная регистрация соискателей и судей. Победителям конкурса будет вручены призы от виртуального магазина WebShop (www.webshop.spb.ru). Подробнее - на konkurs.art.ru.
- Каталог @Rus (бывший "Ау") обьявил о создании специализированного раздела "Рекомендованные сайты" Российского Интернета (путеводитель для начинающих пользователей). А точнее, оговаривается представитель @Rus Андрей Травин, для тех, кто первый месяц пребывает в Сети. Ну-ну... Я там обнаружил сайты вроде Сooler или DZonline. Достойнейшие ресурсы - но явно не для первоклассников. Впрочем, "рекомендованные" вполне годятся для создания локального букмарк-файла, если вы еще этим не озаботились.
- Если вы собрались изготовить первую в своей жизни Web-страничку (или как раз отерли пот со лба, окончив сей труд), зайдите вот сюда - english.phys.msu.su/EngLang/messages/16.html. Действительно ОЧЕНЬ смешно.

Взгляд сверху вниз

Потеряться в Интернете - легче легкого. Выручить сможет только умная "искалка"

ПОДКЛЮЧЕННЫЙ К ИНТЕРНЕТУ КОМПЬЮТЕР - это глубокий колодец с малоизученным содержимым (название самой большой в Интернете поисковой машины Altavista так и переводится - "взгляд сверху"). Изучить же его, понятное дело, страшно хочется, и неофит идет самым простым путем - набирает в окне свежеустановленного браузера интуитивно понятный адрес www.playboy.com или www.politika.ru (разумеется, могут быть и другие варианты - в зависимости от индивидуальных предпочтений нашего героя) и, попробовав на вкус содержание наугад выбранного сайта, пытается поступать дальше самым простым способом. А самый простой способ - это "кликать" наугад в линки и в баннерную рекламу. Его хватает ровно на два дня - пока мелькание картинок и текстов на экране завораживает. Потом очарование первым "сетевым" причастием проходит, а между тем вы так и не узнали, где же в этой чертовой Сети лежит и ждет вас то, что нужно.

Не расстраивайтесь. Во-первых, даже если знакомство с Сетью и произошло недавно, более умудренные коллеги и члены семьи (скажем, семилетний сын) подскажут вам несколько адресов "искалок". Во-вторых, и профессионалу подчас нелегко найти позарез нужную ему информацию - ведь на сегодняшний день, по оценкам специалистов, количество доступных через Интернет документов достигает как минимум 800 миллионов, и выловить из такой гигантской горы плевел жемчужное зерно - задача вовсе не легкая. К тому же даже наиболее мощные "искалки" охватывают по отдельности не более 16 процентов имеющихся документов; совокупный же охват, то есть процент документов, проиндексированных хотя бы одной машиной, не превышает 40 процентов всего объема информации. Оставшиеся 60 процентов алчущий как можно более полного результата поиска сможет найти лишь по случайности или по наитию. Ну и ладно - ведь, как показывает практика, из 129 документов, выскочивших в ответ на запрос (+Ельцин +биография) на www.yandex.ru, вашим чаяниям удовлетворит если не первый, то второй или третий.

Сама форма приведенного выше обращения к "искалке" может вызвать некоторое недоумение. Здесь явно был использован язык запросов! Ужас! Не проще ли взять да и набрать "Ельцин", чем запоминать, какие значки куда ставить? Нет, не проще - тогда ответом на запрос будут 96 657 документов, причем первые восемь являются анонсами книги Коржакова "От рассвета до заката" и располагаются на сервере "Открытый Томск". Не то, о чем мечталось, верно? Тогда, может быть, "искалка" понимает естественный язык, давайте же попробуем набрать "биография Ельцина"? В итоге найдены опять 129 документов, но - других. Из первых десяти запросу корректно удовлетворяет, судя по описанию "Яндекса", лишь один, да и тот не открывается. Вывод: надо ценить свое время, а для этого стоит немного узнать о том, как работают эти самые "искалки", что, где и как они ищут и какой язык понимают. Кстати, совершенно необязательно держать в голове операнды булевой алгебры (хотя, может, и желательно) - важно лишь представить себе весь процесс в общих чертах и получить нужные ссылки. Этим мы сейчас и займемся.

Помочь бедному, замороченному начальником ("Ну-ка, быстренько нашарь мне там в этом, как его... Интернете официальную биографию президента") пользователю найти нужную информацию призваны поисковые системы (search engines). Базовая схема их использования выглядит так: пользователь вводит одно или несколько ключевых слов, которые, по его мнению, лучше всего отражают суть интересующего вопроса, а поисковая система за считанные секунды просматривает свой каталог web-страниц, состоящий из десятков и сотен гигабайт информации. На выходе мы обнаруживаем список страниц, в которых встретились указанные слова. На деле современные поисковые системы далеко ушли от "базовой" схемы, приладив к ней, в соответствии с желаниями, финансированием и талантом создателей, разнообразные улучшения и расширения. Так, существуют системы, позволяющие вводить запрос на естественном языке ("Что известно о покорении Крайнего Севера"), системы, в которых реализованы тематические каталоги для облегчения поиска, и пр. Кроме того, почти все системы так или иначе предпринимают попытки интеллектуального анализа содержимого страниц для улучшения качества поиска.

На этом месте мы распрощаемся с термином "поисковые системы" и выясним, что на самом деле они подразделяются на две большие группы: поисковые машины (роботы) и поисковые каталоги. Они различаются не скоростью или качеством, а тем, что предназначены для выполнения разных задач. Понимание этой разницы очень поможет при выборе инструмента поиска.

Поисковые машины - это системы, состоящие из трех частей. Первая, Spider (он же Bot или Robot) - программа, которая посещает веб-страницы и считывает (индексирует) полностью или частично их содержимое. Вторая - это сам индекс поисковой системы, представляющий собой гигантское вместилище данных, в котором хранятся копии всех посещенных роботами страниц. Наконец, третья - это программа, которая в соответствии с высказанным вами пожеланием "просматривает" индекс в поисках нужной информации и выдает "на-гора", обычно в порядке убывания релевантности, найденные документы. При этом роботы каждой поисковой системы, как и живые служащие, обладают собственной индивидуальностью и повадками, индексы в каждой системе составляются собственным способом, обработка запроса тоже сильно отличается от системы к системе, а о надлежащем толковании понятия "релевантность" (степень соответствия запросу) вообще нет двух одинаковых мнений. Поэтому, увы, одинаковый запрос в www.aport.ru, www.yandex.ru и www.altavista.com даст разные результаты. Они и в одной-то системе могут заметно отличаться неделю спустя - после очередного обновления индекса.

В отличие от поисковых машин информация в поисковые каталоги добавляется только по инициативе редактора (служащего каталога), который обычно пишет и краткую аннотацию к занесенному в каталог сайту. Сайт попадает в определенный раздел каталога. Допустим, в каталоге list.ru, содержащем примерно 10 тысяч ресурсов, сайт журнала "Итоги" попал бы в подраздел "Журналы" раздела "СМИ". Но это довольно простой пример - в крупнейшем международном каталоге www.yahoo.com, содержащем на порядок больше записей, адрес "Итогов", скорее всего, выглядел бы так - News_and_Media/By_Region/Countries/Russia/Complete_Listing. Тем не менее какой бы многоступенчатой ни была иерархия разделов в каталоге, она в большинстве случаев интуитивно понятна. Двигаясь по такому мощному рубрикатору, можно с 90-процентной вероятностью обнаружить сайт по интересующей вас теме. А можно и не двигаться, коли лень, - в любом солидном каталоге есть система поиска, похожая на ту, которую мы видели на поисковых машинах. Мало того - в последнее время поисковые машины и каталоги все чаще кооперируются - так, машина Yandex.Ru может искать как в собственном индексе, так и в каталоге List.Ru. Когда же нужно пользоваться каталогами, а когда машинами (списки смотри в таблице)? В общем случае каталог нужен, когда разыскиваются сайты определенной тематики (политика, животные, развлечения), а машина - когда нужна совершенно определенная информация. Например - ясно, что человеку, ищущему новостные ленты, лучше открыть популярный каталог, в нем - раздел "Политика", после чего остается только просмотреть аннотации и выбрать нужный сайт. Если же разыскиваются журнальные статьи о Московском кинофестивале, каталог вряд ли поможет (по крайней мере, придется затратить немало усилий). Кому придет в голову искать их в разделе "Онлайновые магазины"? Между тем полная подборка обзоров кинофестивалей пера обозревателя "Итогов" Юрия Гладильщикова лежит на сайте сетевого магазина "Озон" - ее для вас отыщет поисковая машина. Если вы ее правильно попросите.

Серьезным преимуществом поисковых машин является огромный объем их индексов - в то время как даже очень большие каталоги содержат в лучшем случае сотни тысяч записей, www.altavista.com, например, индексирует более 100 миллионов страниц, причем индекс пополняется и обновляется достаточно часто. Поисковые машины обычно учитывают все слова на странице, даже не относящиеся к ее теме. Для определения релевантности слов анализируется частота их употребления и место расположения на странице - однако тут возможны частые ошибки, которые и были продемонстрированы выше на примере "биографии Ельцина". Существуют машины, создатели которых пытаются потеснить каталоги в их рыночной нише, используя сложные эвристические методы для определения темы страницы по ключевым словам. Тем не менее нет лучше помощника в сложном поиске, чем вы сами.

Составляя грамотный запрос к "искалке-находилке", всегда нужно помнить о том, что робот, который бросится исполнять ваши пожелания, не разумен и не умеет отвечать на вопросы. Он всего лишь будет искать в индексе те слова, которые вы ему задали. Однако слова вопроса далеко не всегда содержатся в ответе, не правда ли? Итак, всегда нужно постараться сразу представить себе возможный ответ на вопрос - и вот его-то в сжатой форме предложить поисковой машине. Кроме того, не стоит рассчитывать, что во всех случаях можно обойтись лишь одним запросом. Например, вы интересуетесь ролью жены американского президента в каком-то скандале, произошедшем в допрезидентский период. А то, в чем заключалась суть скандала, вы, конечно, знаете, но сейчас забыли. На запрос +Clinton +Hillary (плюсы обозначают лишь, что в искомом документе должно присутствовать как первое, так и второе слово) Altavista выдаст более 300 тысяч документов, в большинстве из которых будет идти речь не столько о Хиллари, сколько о самом Клинтоне. Однако уже из второй ссылки (официальная биография миссис Клинтон на сайте Белого дома) вы узнаете, что второе имя Хиллари - Родэм, где она родилась, где училась и где работала. Добавив нужные слова в запрос (например, +Clinton +Hillary +Rodham +Arkansas +70), получаем всего 2650 ссылок. В числе первых десяти - страница "Pro White Water". Вот оно! Видоизменяем запрос следующим образом - +Clinton +Hillary +Rodham +"White Water" +Arkansas (кавычки означают, что мы ведем поиск точного словосочетания, а не просто обязательного присутствия в документе слов white и water). Готов поспорить, что из полученных в итоге 105 ссылок большая часть в высшей степени релевантна.

Если же вас интересует не определенная информация, а тема (или если вы не в состоянии сформулировать точный запрос из-за недостатка данных), обратитесь в каталог. Причем в том случае, если тема достаточно узка, есть смысл искать в каталоге не сайты нужной направленности (может, редактор этого каталога как раз их еще не занес), а частные линклисты (например, в разделе "Классификаторы" или "Каталоги"). Существует большая вероятность того, что владелец частной странички, фанатично увлекающийся приемами машинного доения коров или нюансами программирования на Perl, собрал такой отличный и обширный набор ссылок (линклист) по этой теме, что куда там неповоротливому каталогу!

В любом случае поиск информации в безднах Интернета - дело нелегкое. Вне всякого сомнения, создатели Web-ресурсов еще долго будут обгонять индексаторов, а индексаторы изо всех сил будут стремиться сократить этот разрыв. Понятно, почему: разнообразные "искалки" - самые посещаемые сайты Интернета. А посещаемость приносит прибыль. Вот, например, Yahoo.Com, начавшись четыре года назад с домашней странички двух аспирантов, превратился сейчас в компанию стоимостью в несколько миллиардов долларов и с 30 миллионами посетителей в месяц. Самая популярная "искалка" русской части Сети Yandex.Ru, принадлежащая компании CompTek, никому пока не продается. Однако примерно ее стоимость все же можно оценить по стоимости других сетевых проектов, делающих деньги на посещаемости, - так, Mail.Ru c его 400 тысячами пользователей стоит никак не меньше 10 миллионов долларов. А чем компания больше стоит, тем больше она обычно вкладывает денег в исследования по своему профилю. Так что, надо полагать, компьютерщики рано или поздно придумают что-нибудь новенькое, и искать станет еще легче и приятнее.

ПОЛЕЗНЫЕ ССЫЛКИ ПО ПОВОДУ:
webclub.ru/materials/marketing/search.html
www.promo.ru
vampire.ami.nstu.ru/internet_search/
www.comptek.ru/yandex/info.html
www.chat.ru/~sergiek/guide2.htm
photophilia.net/isearch
searchenginewatch.com
         

25.08.99 - Заметка 49
Copyright © 1996-1999 Егор Быковский (составление, тексты, HTML)
Copyright © 1998-1999 NSever (дизайн)