ЯндексРазработка системы Яндекс как алгоритма поиска в текстовых документах
началась в начале девяностых годов прошлого века. В 1993 году родилось слово
«Яndex», еще никак не связанное с поиском в Интернете. Придумал его Илья
Сегалович, один из главных разработчиков поискового механизма, сейчас —
технический директор компании Яндекс. Изначально «Яndex» означало «Языковой
index», или, по программистской традиции, «yandex» — «Yet Another indexer», как,
говорят, «yahoo» — это в том числе «Yet Another Hierarchicall Organized Oracle».
Позже была разработана технология, позволяющая осуществлять поиск с учетом
морфологии русского языка. До 1996 года на основе существующей технологии
создавались прикладные программы для поиска в различных справочниках и текстовых
массивах (например, Библии). В 1996 году добавилась возможность строить гипотезы
о морфологии слова. То есть, даже если слово не содержится в словаре, система в
состоянии предположить, как выглядят различные формы этого слова. 21 ноября 1996
года впервые была установлена система Яndex.Site — система полнотекстового
поиска на веб-сервере. В апреле 1997 года на сайте yandex.ru заработала система
поиска по русскому Интернету. Основные разработчики — Сергей Ильинский, Михаил
Маслов, Илья Сегалович, Дмитрий Тейблюм — до сих пор работают в компании Яндекс.
Облегченный вариант - http://ya.ru
В 2003 году Yandex научился искать документы в форматах RTF, PDF и DOC. На
сегодняшний день он хранит информацию о более чем 150 миллионах документов, что
составляет больше 4000 Гбайт.
Подсказки в поиске Яндекса
В поиске Яндекса появились подсказки. Подсказки возникают под поисковой
строкой по мере набора букв и заметно ускоряют ввод запросов. Например,
достаточно набрать сочетание букв «я па» для ввода «я памятник себе воздвиг
нерукотворный». Среди дополнительных возможностей — исправление опечаток в
запросе и автоматическое распознавание раскладки клавиатуры. Так, по сочетанию
букв «vepsrf» в подсказках появится «музыка», а вместо «атистат» Яндекс
предложит «аттестат».
При этом, в отличие от подсказок у Google, часть подсказок в Яндексе (около
10 тысяч) содержат ссылки на сайты — то есть перейти на найденный сайт можно
сразу же из подсказки, не нажимая на кнопку «Найти».
50.000.000 поисковых запросов в день
Яндекс сообщает о достижении рубежа в 50.000.000 поисковых запросов,
обрабатываемых за день (с учетом mail.ru, tut.by и других XML-партнеров).
Это в пять раз больше, чем в июне 2004 года, когда этот показатель достиг 10
миллионов, и в 25 раз больше, чем в апреле 2002 года, когда количество
ежедневных запросов к поисковой машине Яндекса превысило 2 миллиона. Рубеж в
миллион запросов Яндекс перешел весной 2001 года.
Сейчас каждый поисковый запрос "перелопачивает" массив информации в 20
терабайт на географически распределенном кластере из нескольких тысяч
серверов.
|