Справочник функций

Ваш аккаунт

Войти через: 
Забыли пароль?
Регистрация
Информацию о новых материалах можно получать и без регистрации:

Почтовая рассылка

Подписчиков: -1
Последний выпуск: 19.06.2015

Вопросы по клоакингу

16K
21 июня 2007 года
unplugged
21 / / 27.11.2006
Здравствуйте.
После изучения различных источников по клоакингу возникла небольшая каша в голове :) и пара вопросов.
1). Необходимо запретить поисковым ботам переходить по некоторым ссылкам на сайте.
Т.е. при клике по ссылке будет проверяться айпишник\юзерагент и в случае соответствия списку айпи ботов, ему будет отдаваться 404 ошибка.
Можно ли за такие вещи схлопотать бан от поисковиков за клоакинг или лучше отказаться от греха подальше?
2). Считается ли клоакингом локализованный по стране юзера контент сайта?
Т.е. опять же - смотрим по айпи страну\язык и отдаем в зависимости от этого разный контент.
Хотелось бы увидеть более-менее точное определение клоакинга, тк имхо формально под него можно подвести очень много чего :)
337
21 июня 2007 года
shine
719 / / 09.06.2006
Цитата: unplugged
1). Необходимо запретить поисковым ботам переходить по некоторым ссылкам на сайте.
Т.е. при клике по ссылке будет проверяться айпишник\юзерагент и в случае соответствия списку айпи ботов, ему будет отдаваться 404 ошибка.
Можно ли за такие вещи схлопотать бан от поисковиков за клоакинг или лучше отказаться от греха подальше?


По стуку вполне могут забанить. Поэтому лучше делай так:
[HTML]
<noindex>
<a rel="nofollow" href="http://skagem_botam.net">Бот не пройдет</a>
</noindex>
[/HTML]

Цитата: unplugged
2). Считается ли клоакингом локализованный по стране юзера контент сайта?
Т.е. опять же - смотрим по айпи страну\язык и отдаем в зависимости от этого разный контент.


За это тоже может влететь со стороны поисковиков хотя бы потому, что они проиндексируют одно, а пользователи которые будут приходить на твой сайт могут видеть совсем другое.

Цитата: unplugged
Хотелось бы увидеть более-менее точное определение клоакинга, тк имхо формально под него можно подвести очень много чего :)


http://www.searchengines.ru/articles/004479.html

16K
21 июня 2007 года
unplugged
21 / / 27.11.2006
Спасибо за ответ.
Цитата:
За это тоже может влететь со стороны поисковиков хотя бы потому, что они проиндексируют одно, а пользователи которые будут приходить на твой сайт могут видеть совсем другое.


Хм, тогда получается всем владельцам сайтов с локализованным по странам контентом так или иначе влетает от поисковиков :)
Получается, перевод сайта на родной язык пользователя подпадает под клоакинг - может, тогда и не стоит его делать? ;)
Это можно как-нибудь легально обойти, без последствий со стороны поисковиков?

337
21 июня 2007 года
shine
719 / / 09.06.2006
Наверное я не совсем точно выразился. Если у тебя разделены локализованные версии по разным доменам/поддоменам или еще как-нибудь, то все хорошо. Если же ты будешь пытаться определять язык по IP, то это не очень хорошо.
344
22 июня 2007 года
Delpher
493 / / 14.08.2005
Цитата: unplugged

1). Необходимо запретить поисковым ботам переходить по некоторым ссылкам на сайте.
Т.е. при клике по ссылке будет проверяться айпишник\юзерагент и в случае соответствия списку айпи ботов, ему будет отдаваться 404 ошибка.
Можно ли за такие вещи схлопотать бан от поисковиков за клоакинг или лучше отказаться от греха подальше?



через скрипт ставь ссылки, например через JS, поисковики такие ссылки не индексируют.

Цитата:
2). Считается ли клоакингом локализованный по стране юзера контент сайта?



нет
поисковик будет индексировать ту страницу которая ему выдалась.

Цитата:
Хотелось бы увидеть более-менее точное определение клоакинга, тк имхо формально под него можно подвести очень много чего :)



посетителю и поисковику выдается разная информация.

832
22 июня 2007 года
Carpus
390 / / 14.04.2005
Цитата: unplugged

при клике по ссылке будет проверяться айпишник\юзерагент и в случае соответствия списку айпи ботов, ему будет отдаваться 404 ошибка.
Можно ли за такие вещи схлопотать бан от поисковиков за клоакинг или лучше отказаться от греха подальше?


Однозначно - бана не последует, т.к. нет никакого клоакинга, поисковой системе не отдается вообще никакого контента. Страница просто не проиндексируется, а если была проиндексирована ранее, то в скором времени будет удалена из базы.
Но запретить индексацию определенных страниц и каталогов можно проще - в файле robots.txt, также можно запретить индексацию части документа Яндексом, заключив ее в <noindex>...</noindex>

Цитата: unplugged

2). Считается ли клоакингом локализованный по стране юзера контент сайта?
Т.е. опять же - смотрим по айпи страну\язык и отдаем в зависимости от этого разный контент.


Если контент предназначен для пользователей, а не для ПС, клоакингом это не считаться не будет, только вот... Определить страну по IP можно, а как определить язык? Например, далеко не все жители Израиля разговаривают только на иврите, в Германии также масса бывших наших соотечественников, я уж не говорю о странах "ближнего зарубежья". Да и мало ли народу на учебе/командировке/отдыхе и т.п.
С определенной долей вероятности определить язык можно по HTTP заголовку Accept-Language. Но, мне кажется, что лучше предоставить возможность пользователю самому выбрать язык.

8
22 июня 2007 года
mfender
3.5K / / 15.06.2005
Так точно. Человекам нужно дать возможность выбора. Например, хранить в куках идентификатор выбранного интерфейса, но выбрать он должен сам. А если заходит человек впервые, или после чистки куков - давать ему пустую splash-страницу, где он и определится с выбором. Так логичней.
16K
22 июня 2007 года
unplugged
21 / / 27.11.2006
Спасибо за ответы и мнения.
Еще пара утверждений, которые требуют проверки :)
1. Тег <noindex a rel="nofollow"></noindex> работает только в Яндексе\Рамблере. Гугл\МСН и прочие его не учитывают?
2. Все ли поисковики игнорят JavaScript? Где-то читал, что гугл вроде собирается парсить его ботами (?).
Тогда достаточно ли будет замены
 
Код:
<a href="bla">a</a>

на
 
Код:
<script>document.write("<a href=\"bla\">a</a>")</script>

для выполнения поставленной задачи по всем поисковикам?
832
22 июня 2007 года
Carpus
390 / / 14.04.2005
1.1 <noindex>...</noindex> - для Яндекса http://webmaster.yandex.ru/faq.xml?id=502464#noindex.
1.2 <a rel="nofollow"> - для Google http://www.google.com/support/webmasters/bin/answer.py?answer=33582&query=rel+nofollow&topic=&type=

2. Еще раз повторю,
Цитата: unplugged
для выполнения поставленной задачи по всем поисковикам

, проще и надежнее запретить индексацию в robots.txt

337
22 июня 2007 года
shine
719 / / 09.06.2006
Цитата: unplugged
1. Тег <noindex a rel="nofollow"></noindex> работает только в Яндексе\Рамблере. Гугл\МСН и прочие его не учитывают?


Яндекс не индексирует все, что внутри noindex. Гугл индексирует но не учитывает при раздаче ссылочного веса все то, что внутри a.rel="nofollow".
Насчет остальных ПС - не знаю.

Цитата: unplugged
2. Все ли поисковики игнорят JavaScript? Где-то читал, что гугл вроде собирается парсить его ботами (?).


У него не хватит на это мощности. Он даже простой HTML не успевает регулярно парсить, а ты хочешь чтобы он еще и JavaScript тебе разбирал. :)
Вобщем, имхо это нереально. Особенно учитывая современную моду на "WEB2.0" который на этом JavaScript по большой части и основан.

Реклама на сайте | Обмен ссылками | Ссылки | Экспорт (RSS) | Контакты
Добавить статью | Добавить исходник | Добавить хостинг-провайдера | Добавить сайт в каталог