Форум о социальных сетях Поиск по форуму Инвестиции SMM обучение SMM курсы
Форум о социальных сетях Поиск по форуму Инвестиции SMM обучение SMM курсы
  • Страница 1 из 1
  • 1
Оптимальный robots.txt для блога
#1
Среда, 19.05.2010, 14:49
_[JAGUAR]_
Проверенный
Сообщения: 734
Репутация: 3257
Файл robots.txt лекарство для блогов WordPress, несмотря на свою гибкость и податливость на изменения в коде, этот движок блога не обладает по умолчанию файлом robots.txt, что для новичков может стать настоящей проблемой. А для внутренней оптимизации этот небольшой файл очень важен. Вот как создать robots.txt для своего блога рассмотрим далее.

О да, блог будет отлично индексироваться и без robots.txt и скорее всего первый пост попадет в индекс шустрого Гугла уже через 3-5 часов. Но что повлечет за собой такая индексация впоследствии, вот в чем загвоздка. Последствия могут быть весьма плачевными, особенно для тех, кто потом в дальнейшем войдет в курс дела и поймет, что заранее не создав robots.txt получил кучу дубликата блога.

Для чего нужен robots.txt? При обращении поисковых ботов к блогу да и к сайту в частности, первым делом происходит сканирование на наличие этого файла, если таковой отсутствует блог будет все равно проиндексирован, но нужно ли это?

Файл robots.txt необходим не для управления поисковыми ботами, а для некоторого направления в индексации, говорящий им о том, что нужно индексировать, а что нет. Он ставит команду на запрет сканирования и занесения в базу поисковика некоторых нежелательных директорий блога.

Основная проблема при работе с WordPress, заключается в большом количестве дубликатов контента, который он создает. Под разными URL адресами на блоге можно найти один и тот же контент, что рассматривается поисковой системой как дубликат и она начинает постепенно применять к блогу свои фильтры. Сюда можно отнести адреса: рубрик, категорий, тегов, RSS канала, запросов через поиск и еще массу ненужных для внесения в базу поисковика адресов – входа в панель администрации WordPress и административную папку в целом.

Чтобы решить проблему дубликатов контента, естественно необходимо создать robots.txt для блога WordPress. У каждого он может быть свой в зависимости от названия папок в корневой части блога и смотря, что Вы хотите срыть от поисковых ботов. Приведу лишь пример файла, который использую на своем блоге. Путем некоторых экспериментов у меня вышел следующий robots.txt, который я считаю наиболее эффективным для WordPress:

User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-includes/
Disallow: /xmlrpc.php
Disallow: /wp-admin
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /tag/
Disallow: /page/
Disallow: /trackback/

Disallow: /feed/- запрет фида канала RSS
Disallow: /comments/– данную строку указывать, если хотите запретить комментарии
Disallow: */trackback/
Disallow: */feed/
Disallow: */comments/
Disallow: /?feed=
Disallow: /?s=
Disallow: /*?*
Disallow: /*?
Sitemap: http://megasoft.3dn.ru/sitemap-forum.xml (пример)
- карта блога

User-agent: Yandex – команды поисковому боту Яндекса
Disallow: /cgi-bin/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-includes/
Disallow: /xmlrpc.php
Disallow: /wp-admin
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /tag/
Disallow: /page/
Disallow: /trackback/
Disallow: /feed/
– запрет фида канала RSS
Disallow: /comments/ – данную строку указывать, если хотите запретить комментарии
Disallow: */trackback/
Disallow: */feed/
Disallow: */comments/
Disallow: /?feed=
Disallow: /?s=
Disallow: /*?*
Disallow: /*?
Host: seocekret.ru
- адрес хоста, которым нужно исключить зеркала для Яндекса с www

Строки которые не расписаны в объяснении, думаю и так можно догадаться, что они запрещают. Хочу лишь обратить особое внимание на запрет *?* и *? – данная команда даст роботу запрет на индексацию динамических адресов блога, которые обычно по умолчанию создаются при написании постов, и если у Вас URL адреса страниц имеют именно такой вид со знаком вопроса, то обязательно исключите эти команды из файла robots.txt.

Если на блоге Вы используете вид статических адресов, например http://megasoft.3dn.ru/blog/ (пример), формируя их с помощью плагина, то оставьте все как есть. Создать robots.txt довольно просто – достаточно открыть блокнот и скопировать в него вышеуказанные строки, затем сохранить файл с расширением txt. После чего залейте его в корневой каталог блога, через FTP или непосредственно с панели хостера управления блогом.

Пост отредактировал _[JAGUAR]_ - Среда, 19.05.2010, 17:40
#2
Среда, 19.05.2010, 15:06
Ronik
Проверенный
Сообщения: 3737
Репутация: 12681
Спасибо за статью очень полезная вышла.А кто автор статьи?
#3
Среда, 19.05.2010, 15:12
_[JAGUAR]_
Проверенный
Сообщения: 734
Репутация: 3257
Dima_volk, Сорри не знаю!!!)))
#4
Среда, 19.05.2010, 15:58
_Black_
Проверенный
Сообщения: 352
Репутация: 965
спасибо :)
[spoiler="Лента уважения..."]• Dessar1994; • FullBlooded; • MC_Bandit; • Dima_volk • Savas • Zhenya; • Шурик[/spoiler]
#5
Среда, 19.05.2010, 16:27
_[JAGUAR]_
Проверенный
Сообщения: 734
Репутация: 3257
#6
Среда, 19.05.2010, 17:33
Ryudzaki1
Проверенный
Сообщения: 349
Репутация: 554
Хочу напомнить красным текстом имеют право писать тока админы! А так неплохо! Спасибо за статейку!
Адаптирую сайты с Dle на Ucoz!
#7
Пятница, 21.05.2010, 12:55
_[JAGUAR]_
Проверенный
Сообщения: 734
Репутация: 3257
Ryudzaki1, Я исправил! ;)
#8
Пятница, 21.05.2010, 12:59
80R06EY
Проверенный
Сообщения: 245
Репутация: 584
Хорошая и полезная статья, прочитав узнал немного нового. Большое спасибо!
Пост отредактировал 80R06EY - Пятница, 21.05.2010, 14:22
#9
Пятница, 21.05.2010, 13:26
_[JAGUAR]_
Проверенный
Сообщения: 734
Репутация: 3257
80R06EY, незачто!
Пост отредактировал _[JAGUAR]_ - Пятница, 21.05.2010, 14:01
Пятница, 21.05.2010, 16:18
$USER$
Заблокированные
Сообщения: 1326
Репутация: 5864
_[JAGUAR]_, спасибо за статью! ;)
Пятница, 21.05.2010, 16:28
shooter2010
Заблокированные
Сообщения: 713
Репутация: 1558
Супер y

[qc]Продаю ICQ UIN (6*7*,8*,9*)
-------------------------------------
Продаю Уникальные Статьи
Есть много разних тем
-------------------------------------
<b></b>[/qc]
Пятница, 21.05.2010, 16:44
Bart_95
Проверенный
Сообщения: 438
Репутация: 4989
Quote (_|JAGUAR|_)
Host:seocekret.ru - адрес хоста, которым нужно исключить зеркала для Яндекса с www

Думаю понятно что источником данной статьи является seocekret.ru

Пятница, 21.05.2010, 16:53
_[JAGUAR]_
Проверенный
Сообщения: 734
Репутация: 3257
XameleoN, да незачто! ;)
Вторник, 03.08.2010, 14:03
dubrik
Проверенный
Сообщения: 222
Репутация: 581
спасибо
  • Страница 1 из 1
  • 1
Поиск:
Форум
Социальные сети
Хостинг от uCoz