Энциклопедия
24.04.2008Рады представить вашему вниманию энциклопедию оптимизатора, которая постоянно будет пополняться
Рады представить вашему вниманию энциклопедию оптимизатора, которая постоянно будет пополняться
Анализатор доли переходов с поисковых машин не является “качественным” анализатором, а отражает популярность и используемость поисковых машин. Для его построения используются данные счетчика Liveinternet.ru. Таким образом, учитываются переходы только на те сайты, на которых установлен счетчик Liveinternet.ru.
Данный анализатор отражает процентное соотношение переходов с поисковых машин на сайты Рунета. Используются данные статистики счётчика LiveInternet по переходам с поисковиков. Здесь необходимо сделать несколько поясняющих комментариев:
А. Здесь взят срез статистики счётчика LiveInternet по российским пользователям (то есть пользователям с российским адресом IP). Это сделано, чтобы отфильтровать шум, возникающий из-за так называемых idiot clicks, то есть случайных переходов западных пользователей из “больших” поисковых машин, таких как Гугл, MSN Live Search, Yahoo. Эти пользователи не являются настоящими пользователями поисковиков Рунета, но могут довольно сильно искажать статистику (так как западный Интернет большой и таких случайных пользователей много).
Б. Принято считать эти цифры долями рынка поисковых машин, но это не вполне корректно. Дело в том, что:
а) счётчик www.liveinternet.ru показывает переходы только на те сайты, на которых установлен счётчик. Некоторые крупные сайты не ставят счётчик, что может давать смещение статистики при экстраполяции на весь Рунет.
б) точно неизвестно, что именно показывает процент переходов с поисковика, и как он связан с истинной популярностью поисковика. Можно предположить, что посещаемость поисковика и количество переходов с него коррелируют, но это только предположение. Вдруг, например, в “плохом” поисковике пользователь вынужден много раз щёлкнуть по результатом поиска, пока он найдёт нужный сайт, а в “хорошем” он находит нужный сайт с одного клика? Тогда “плохой” поисковик будет генерировать много переходов на одного пользователя, а “хороший” - только один переход. В общем, точно это соотношение популярности и переходов неизвестно, и именно поэтому мы назвали данный параметр техническим.
Вероятно, сильное изменение процентной доли переходов (скажем, на 5-10 пунктов и более) может отражать реальное изменение посещаемости поисковика. Про малые флуктуации (1-2%) этого утверждать наверняка нельзя.
В. Нужно не забывать, что эти цифры - не абсолютная посещаемость или количество переходов, а процентные доли (сумма которых постоянна и равна 100%). Именно это вызывает эффект ясно видимых на месячном графике зеркальных ям Яндекса и наведённых выступов Гугла: посещаемость Яндекса в выходные падает, а посещаемость Гугла, похоже, падает не так сильно (мы не знаем, почему). Поэтому оттого, что доля Яндекса велика, то из-за её падения пропорционально увеличивается процентная доля Гугла по выходным (ведь сумма долей всех поисковиков постоянна). У Рамблера же, очевидно, падение в выходные также ярко выражено, так что его процентная доля не подскакивает так, как у Гугла.
Лучшим по данному анализатору считается поисковик с наибольшей долей переходов. Именно в таком порядке сверху вниз отсортированы поисковики в информере данного анализатора.
Статья и анализатор взяты тут analyzethis.ru
Человек - не робот и может ошибиться. В том числе и при вводе поискового запроса в поисковую строку поисковой машины. Он может просто допустить опечатку, введя соседний символ (и тогда вместо “запрос” получится “звпрос”), он может по ошибке ввести символ дважды или пропустить вовсе (и тогда вместо “запрос” получится “зпрос” или “заппрос”), наконец, он может не знать правильного написания слова и ввести его “как слышится” (и тогда вместо “яндекс” получится “яндыкс”).
Поисковик в этом случае может придерживаться одной из трех стратегий -
1) никак не обрабатывать эти случаи и искать строго то что ввел пользователь
2) понять что имела место опечатка, тем не менее найти то что введено и рядом предложить правильную по мнению поисковой машины форму - “возможно, вы имели ввиду [правильное написание запроса]”
3) понять что имела место опечатка, не искать ошибочное написание а сразу искать правильную форму
В зависимости от выбранной стратегии, пользователь либо не увидит что он ошибся при написании, либо увидит это и сделает лишний клик (если захочет), либо даже не догадается о собственной опечатке.
В данном анализаторе сравнивается поисковая выдача по “правильному запросу” и по нескольким формам возможных его опечаток. Оценивается степень близости поисковой выдачи по запросу с опечаткой к выдаче по “правильному” запросу
Кроме сознательного исправления опечаток, совпадения могут возникать в четырех случаях:
1) случайно
3) страница содержит как правильную форму, так и форму с опечаткой
4) ложное срабатывание морфологии поисковика (например, приведение неизвестного поисковику слова “гриби”, которое есть опечатка слова “грибы” к слову “гриб”)
5) продвижение одних и тех же сайтов как по запросам в правильном ниписании, так и по запросам с опечатками
Все эти случаи в рамках данного анализатора дают шум - случайное совпадение результатов.
Степень близости оценивается аналогично тому как это делается в анализаторе апдейтов, только сравниваются другие запросы.
Чем большее совпадение результатов зафиксировано, тем выше результат поисковика по данному анализатору. Именно в этом порядке сверху вниз отсортированы поисковики в информере данного анализатора.
В дальнейшем будет введена ротация групп запросов с опечатками из большого массива групп.
Статья, а так же анализатор к очепят… тьфу, взяты и есть в наличии на сайте analyzethis.ru