• Мнения
  • |
  • Обсуждения
Евгений Демченко Профессионал

Как избежать мук поиска?

«В Интернете есть все, кроме того, что вам действительно нужно». Не раз приходится слышать подобную фразу. В ответ всегда хочется сказать одно — «невежда». Но стыдно смеяться над чужими недостатками, а недостаток один — недостаток знаний. Позвольте же дать страждущим знаний. Знания о том, как быстро и эффективно искать в Internet необходимую информацию. Она там есть, просто нужно уметь найти.

Искушенным в сетевом поиске гуру все нижеописанное может показаться скучным, как ряд Фибоначчи и старым как процессор z80, но, я уверен, даже опытные пользователи Интернета могут почерпнуть для себя крупицы истины.

На этом прелюдия и апофеоз закончены, впереди теория, подтвержденная многолетней практикой.

У кого спрашивать?
Прежде чем что-то искать в сети, необходимо определиться, прежде всего, для себя самого — «что ищу» и систематизировать все имеющиеся данные по объекту поиска.

Искать «танки» в оригинале (я про японскую литературу, а не про военную машину) — прямой путь в японский поисковик или в самый раз спрашивать у лидера мирового поиска fGoogle.com. А вот для запросов на русском языке или на языках народов xUSSR лучше всего воспользоваться популярными «местными» Yandex.ru, Rambler.ru или Aport.ru.
Мало того, что информации на родных языках в них больше, так они еще и рода с падежами понимают, в отличие от «забугорных» гигантов. Тот же хваленный Google, хоть и обладает русификацией и «казафикацией», знанием грамматики похвастать, к сожалению, не может. Хотя, если вы обладаете чуть большим знанием об объекте поиска, умением задавать правильные поисковые запросы и упорством, и он найдет все, что вам нужно. А если знаете, что искомые танки были изданы европейским или американским издательством, то лучше всего спрашивать не у Яндекса, а у Yahoo.com или Google.com.

Наиболее популярные у пользователей Рунета Яндекс, Рамблер и Апорт различаются не только по фамилии и внешности, но и по механизмам и алгоритмам поиска. Например, Rambler делая упор на количестве найденных документов, выносит на верхушку результатов поиска все документы, которые содержат все слова запроса. Yandex же в первую очередь показывает страницы, где все слова запроса находятся рядом и именно в указанном порядке. И это всего лишь одно из многочисленных отличий, поэтому знать, как и на каком языке разговаривать с каждым поисковиком, очень важно. Полностью рассказать об отличиях в алгоритмах поиска в рамках одной статьи не удастся ввиду большого объема информации и «секретности» некоторых нюансов механизма поиска.

Я спросил у Яндекса…
Начнем с языка запросов самого популярного поисковика на постсоветском пространстве - с Yandex.ru. К сожалению, в рамках одной статьи невозможно рассказать обо всех возможностях мощного поискового механизма этой системы и раскрыть все возможности его языка запросов. Остановимся только на основных операторах. Научившись пользоваться ими, вы очень легко найдете и остальные — как два байта переслать.
Как уже рассказывалось выше, данный поисковик прежде всего пытается найти документы, в котором все введенные слова встречаются одновременно и в нужном порядке. Отсюда первый оператор «пробел» — выполняет функцию логического оператора «И», действующего на уровне фразы. Аналогичную функцию выполняет символ «&». Удвоенные амперсант «&&» обозначает логическое объединение на уровне документа — его использование может заметно увеличить число найденных ссылок, но, как правило, здесь количество в ущерб качеству. Синоним амперсанта в языке запросов Yandex — знак «+». Вертикальная черта «|» объединяет и включает в результаты поиска все документы, которые содержат любое слово из запроса (из слов разделенных этим символов). Тильда «~» означает отрицание и позволяет исключить из результатов заведомо ложные документы. По аналогии с амперсантом, двойная тильда расширяет область действия на весь документ, а не на одну фразу. Именно благодаря амперсанту вы можете избавиться от кучи лишних ссылок при поиске книги — лишь добавив к поисковому запросу «~~ купить». Объединенная скобками или кавычками фраза понимается Яндексом как одно целое (очень полезная вещь, если надо найти фразу в первозданном виде — ищем «на поле танки грохотали» и находим песню, а не японскую поэзию или описание технических характеристик военной техники).

Есть более сложные операторы языка запросов. Например, с помощью символа «/» можно указать максимально допустимое расстояние между двумя любыми словами запроса (в цифрах). А добавление к «/» знаков «+» или «-» сможет помочь Вам, когда вы знаете не только расстояние между словами в предложении, но и порядок («+» прямой, «-" — обратный). Например, Вы забыли отчество Владимира Ленина — запрос «Владимир /+2 Ленин» выведет в результате документы, где между словами Владимир и Ленине есть ровно одно третье слово.

А еще не забывайте о падежах и родах, все это доступно профессионалу — Яндексу. А если же надо, чтобы было найдено только слово в определенной форме (род, число, падеж), то поможет восклицательный знак «!» перед словом.
Вот вам коротко о верхушке поискового механизма поисковика Yandex.

Я спросил у Рамблера…
Rambler — старший брат Яндекса. Обладает более скромным арсеналом операторов. В Рамблере нет разделения области действия оператора на фразу и документ. Однако все основные правила написания запросов остаются неизменными. Операторы могут быть записаны как в виде символов: «&» — логическое «И», «|» — «ИЛИ», «!» — отрицание «НЕ», так и в виде понятных эквивалентов на английском языке — соответственно, AND, OR, и NOT. Значение кавычек и скобок аналогично Яндексу. Но было бы несправедливо не упомянуть о достоинствах и отличительных полезных особенностях Рамблера. Rambler имеет более продвинутую систему подстановки искомых слов, этот поисковик считает родственными даже такие непохожие слова, как «человек» и «люди».

И еще важное замечание — Rambler по-разному учитывает слова, набранные с маленькой и большой буквы. Например, если запрос состоит из двух, трех или четырех слов с большой буквы, то предполагается поиск по именам собственным, и автоматически производится изменение ограничения расстояния между слова запроса, для того чтобы внутри результата не было более одного «лишнего» слова или знака препинания, например «Баден-Баден», «А.Пушкин», «Иванов Иван Иванович». Слова же «дом» и «ДОМ» для Rambler одинаковы. Некоторые слова при поиске с помощью Rambler автоматически исключаются из результатов поиска. Это так называемые стоп-слова — предлоги, союзы, частицы, артикли. Если же необходимо их учитывать то рекомендуется использовать двойных кавычки. Ограничение расстояния между словами в Рамблере составляет 40 слов и производится поисковой конструкцией «(число, запрос)». Учитывая все особенности Rambler и его огромную популярность, не стоит сбрасывать его с арены битв поисковиков.

Я спросил у Яблока…
Хотел написать «у Апорта», но не было бы рифмы. Апорт — тоже весьма сильный поисковик. Язык поисковых запросов в целом схож с Рамблером. Основные отличия: «И» и «НЕ» могут быть заменены не только английскими словами, но и символами «+» и «-». Восклицательный знак используется, чтобы в спорных вопросах подчеркнуть принадлежность к родительному падежу. А еще независимо от того, в какой грамматической форме было указано слово в поисковом запросе — оно найдется во всех своих формах. Также поддерживается рамблероподобная система стоп-слов (предлогов, союзов и др.). Еще одно качественное отличие от других поисковиков — использование метасимволов «*» и «?», позволяющих заменять произвольное количество произвольных символов в запросе. Еще одной полезной особенностью Апорта является возможность поиска документов по дате создания — запрос «hotfix date:31/12/06−01/01/07» покажет вам все документы, созданные в праздник Нового года. Значение кавычек и скобок аналогично описанным выше поисковикам.

Краткий обзор языков поисковых запросов популярных поисковых машин закончен. Теперь, зная основы искусства поиска, вы сможете найти все остальные операторы, тем самым сделав свой поиск еще более эффективным. А если еще и будете постоянно тренироваться, то рано или поздно сможете победить в ежегодном чемпионате по поиску. На IV Кубке Яндекса по поиску, например, главным призом был автомобиль «Пежо 206», так что искать эффективно вдвойне выгодно, для того, кто это умеет. Я в Вас верю.
P. S. Учаcтник IV Кубка по поиску в Интернете Pavel_krsk за 21 секунду дал ответ на вопрос «Каков был тираж изданной в 1995 году книги — цикла стихотворений Тимура Кибирова по материалам воспоминаний родных и близких Володи Ульянова о детстве будущего вождя?»

Статья опубликована в выпуске 2.01.2007
Обновлено 4.04.2009

Комментарии (18):

Чтобы оставить комментарий зарегистрируйтесь или войдите на сайт

Войти через социальные сети: