Шпионские страсти-2

Страсти, как и положено, бушуют. Власть предержащие привычно хмурятся в объективы, обещая разобраться как следует и наказать кого попало. На Roem.ru роют землю, на Searchengines.ru изорвали три баяна и исписали 80 страниц. Сергей “Gray” Петренко на Серче стоит насмерть, потому что отступать ему некуда, как и всему Яндексу — позади добродушная бульдожья улыбка Google.

Кстати, о Google — на том же Roem немедленно появилась трогательная история о корпоративном сайте на офисном сервере, который в Сети не виден и живет только для своих. И о том, как подлый spyware по кличке Google Chrome прикинулся радисткой Кэт и передавал страницы в Центр на невозбранное индексирование, хотя боту там был сплошной No pasaran и “500 Internal Error”.

Прочтение сказки про офисный сайт меня доконало — пошел смотреть на живые примеры и сравнивать чужую сказку со своей былью. Еще в 2005 году я рисовал скрипт закрытого «клубного» форума для узкого круга. Там есть небольшая открытая часть и поисковики ее невозбранно индексируют. Прочее скрывается за формой логина. Зашел туда освежить память и улыбнулся — да, проблема, о которой сейчас гудит рунет, там давно решена, очень просто и эффективно. Нет, в robots.txt вообще ничего не запрещено. Скрипт просто проверяет наличие GET-параметра с идентификатором сессии. Заметьте, предполагаемые читатели, не намертво закрывает все страницы от бота, а только если ссылка с хешем авторизации. Мало ли, вдруг кто-то где-то спьяну уронит такую ссылку на радость ботам...

С помощью Хрома туда хожу не только я. Но в индексе Гугла нет ни единой строчки из закрытой части. О чем нам это говорит? — О том, что содержание просмотренных страниц браузер в Центр Юстасу не передает, иначе вылезли бы эти страницы в индексе. Возможно, он передает адреса, но по ссылке без идентификатора сессии залогиненного юзера боту туда не попасть. А по ссылке с идентификатором страница формируется с лишним мета-тегом, который твердо говорит: котам роботам нельзя! И этого хватает.

Вот насчет Яндекс-бара не знаю. На форуме не та публика, чтобы его ставить, не нужен им Яндекс-бар, так что вопрос для меня остается открытым.

Что вы спрашиваете? Почему не защищаю Яндекс? :-)
Сам влез, теперь пускай сам и защищается. Потому что предупреждать надо. Когда ты снимаешь с браузерного тулбара посещенные адреса и посылаешь по этому следу бота, надо просчитывать последствия. И предупреждать всех, что одноразовые адреса страниц с уникальным хешем у них больше не секретные, потому что Яндекс изволит шпионить через плечо посетителя. Если я 6 лет назад в полном одиночестве просчитал возможность такого сценария и подстраховался, то большому и талантливому коллективу разработчиков поиска грех было не догадаться, чем кончится затея с баром.

Впрочем, переживать за Яндекс нечего, он выкрутится и мне его жалеть глупо. И вообще я Гуглу подыгрываю, ага. Попозже расскажу, почему. :-)

Top

Категория: Оптимизация

Комментарии Отключены