Если Sape плохо индексирует сайт или все ссылки валятся в error…
Все чаще и чаще слышу, что при добавлении сайта в Sape возникают разного рода проблемы. В основном эти проблемы возникают на сателлитах на WP.
Самая первая проблема – это робот сапы не индексирует сайт, например, из 1000 страниц берет всего 20-30 страниц и останавливается. Наконец-то сапа научилась не брать странички, где в мета-тегах указан тег noindex. И скорее всего это и является причиной того, что сапа не берет больше 20 страниц. Обычно данный тег по умолчанию проставляется плагином Platinun Seo Pack или подобным почти на все, что дублирует контент, а это архивы, поисковые страницы, теги, внутренние страницы, включая разбивку. Чтобы увеличить кол-во страниц, идем в настройки и убираем галочки с пункта “Use noindex for sub pages”, таким образом, если у вас есть разбивка на страницы, страницы не будут помечаться тегом noindex и сапа будет брать больше страниц. Также рекомендую увеличить кол-во страниц в разбивке по-максимому.
Вторая проблема – ссылки падают в error. Первым делом проверяем кодировку страницы в мета-тегах и, в какой кодировке выводятся ссылки. Кодировки должны совпадать. Обычно, если вы используете WP и плагин iMoney для вывода ссылок, то кодировка должна совпадать по умолчанию и быть UTF8. Если все верно, то открываем страничку, где есть хотя бы одна сапешная ссылка, открываем исходный код страницы, находим ссылку и смотрим, чтобы в ней не было ничего лишнего и она не была закрыта от индексации. Обычно ссылки портятся из-за плагинов, которые закрывают внешние ссылки от индексации или от плагина WP Google Analytics, который вставляет свой код в ссылки для отслеживания кликов по ссылкам.
Это, конечно, не полный список причин того, что ссылки падают в error, но в большинстве случаев данные рекомендации должны помощь.
Popularity: 29%