Форум о социальных сетях Поиск по форуму Инвестиции SMM обучение SMM курсы
Форум о социальных сетях Поиск по форуму Инвестиции SMM обучение SMM курсы
  • Страница 1 из 2
  • 1
  • 2
  • »
Файл robots.txt
#1
Суббота, 01.08.2009, 01:59
TroYan
Заблокированные
Сообщения: 210
Репутация: 123
Роботы поисковых систем при входе на сайт первым делом обращаются к файлу robots.txt, чтобы получить инструкции к дальнейшему действию и узнать, какие файлы и директории запрещены к индексированию. Поэтому веб-мастеру крайне необходимо знать, как правильно написать этот файл, так как ошибки в нём могут привести к очень плачевным последствиям. Ещё раз повторимся и уточним, что файл robots.txt ничего не разрешает к индексации, а только запрещает. И ещё один нюанс. Он не является стопроцентным указанием для поисковых роботов. Скорее можно сказать, что он является рекомендательным документом.

Файл robots.txt – обыкновенный файл с расширением txt, который создают с помощью Блокнота и располагают в корневой директории конкретного сайта и который содержит инструкции по индексации для поисковых роботов. Инструкции могут быть, как и общие, так и для конкретных роботов отдельные.

А теперь немного подробнее о файле robots.txt.

Основные правила при создании и загрузке файла robots.txt:
- не путать название, то есть называть файл robots.txt, а не robot.txt и так далее.
- писать название файла robots.txt обязательно в нижнем регистре, то есть robots.txt, а не Robots.txt и ROBOTS.TXT и так далее.
- размещать файл robots.txt именно в корневой директории сайта, а не в каком другом месте.

Также очень важно грамотное содержание файла robots.txt, поэтому расскажу подробнее об этом моменте. Ошибки в содержании этого файла могут привести к тому, что сайт или отдельные его директории или файлы не будут проиндексированы.

Итак, из чего же состоит содержание файла robots.txt? Вот примерное его содержание:

User-agent: *
Disallow: /adminka/
Disallow: /image/

Давайте разберём содержание этого файла.
Первая строка «User-agent: *». Звёздочка в инструкции User-agent обозначает, что данная инструкция относится ко всем поисковым роботам. Если инструкция предназначена для конкретного поискового робота, то необходимо прописать его имя.
Вторая и третья строка запрещают индексацию директорий adminka и image. Обратите внимание, что каждая запрещённая к индексации директория прописана в отдельной строке. Совмещение их в одной строке является грубой ошибкой. Также нельзя переносить строки в пределах одной инструкции.

Для поискового робота Яндекса актуально также писать директиву Host. Эта директива указывает роботу на основное зеркало этого сайта. В этой директиве можно прописать адрес сайта либо с www, либо без www. Какая разница спросите вы? Да никакой. Можно указывать и так, и так. Всё зависит исключительно от вашего желания. Никаких ограничений и ущемлений для вашего сайта не будет. Правильно написать директиву Host нужно так:

User-agent: Yandex
Disallow: /adminka/
Host: www.site.ru

А теперь приведу конкретные примеры написания файла robots.txt для различных задач.

1. Запретить весь сайт к индексации всеми поисковыми роботами.

User-agent: *
Disallow: /

2. Не запрещать весь сайт к индексации всеми поисковыми роботами.

User-agent: *
Disallow:

3. Запретить весь сайт к индексации одним поисковым роботом (например, SeoBot).

User-agent: SeoBot
Disallow: /

4. Не запрещать весь сайт к индексации одному роботу (например, SeoBot) и запретить к индексации всем остальным поисковым роботам.

User-agent: SeoBot
Disallow:

User-agent: *
Disallow: /

5. Запретить несколько директорий к индексации всеми поисковыми роботами.

User-agent: *
Disallow: /directoria-1/
Disallow: /directoria-1/
Disallow: /hidedirectoria/

6. Запретить несколько файлов к индексации всеми поисковыми роботами.

User-agent: *
Disallow: /hide.php
Disallow: /secret.html

Какие же ошибки следует не допускать в написании содержимого файла robots.txt?

Вот основные правила написания содержимого файла robots.txt:

1. Писать содержимое файла нужно только в нижнем регистре.
2. В каждой инструкции Disallow указывать только одну директорию или один файл.
3. Не менять местами инструкцию Disallow и User-agent.
4. Не оставлять пустой строку User-agent. Если инструкция относится ко всем поисковым роботам, то писать звёздочку, а если к конкретному поисковому роботу, то писать его имя.
5. В директиве Host (для Яндекса) адрес писать нужно без протокола http:// и без закрывающего слеша /.
6. Не нужно использовать символы подстановки в инструкции Disallow в виде звёздочки и прочих символов.
7. Стараться не писать комментарии к инструкциям в одной строке с инструкциями.
8. Нельзя пропускать инструкцию Disallow. Если вы не собираетесь ничего запрещать к индексации, то оставьте эту инструкцию пустой.
9. При запрещении к индексации директорий обязательно прописывать слеши.
10. Самое главное правило – прежде чем залить файл robots.txt на сервер сайта нужно сто раз его проверить и перепроверить во избежание дальнейших недоразумений.

Источник Яндекс dry

Пост отредактировал TroYan - Суббота, 01.08.2009, 17:22
#2
Суббота, 01.08.2009, 02:02
FroozXD
Заблокированные
Сообщения: 580
Репутация: 34
Это ты с Яндекса тыриш ? dry
#3
Суббота, 01.08.2009, 02:04
TroYan
Заблокированные
Сообщения: 210
Репутация: 123
net, Какая разница? dry
#4
Суббота, 01.08.2009, 02:07
FroozXD
Заблокированные
Сообщения: 580
Репутация: 34
TroYan, Такая что это нехорошо dry наверно ты посты набиваеш тупыми темами? Эти темы некому не нужны! я тоже могу щас скопировать все с яндекса и у меня будет 1к постов xD
#5
Суббота, 01.08.2009, 02:21
[DestRoyer]
Пользователь
Сообщения: 211
Репутация: 142
TroYan, источник указывать надо wink
#6
Суббота, 01.08.2009, 02:24
FroozXD
Заблокированные
Сообщения: 580
Репутация: 34
[DestRoyer],
Quote (TroYan)
User-agent: Yandex

Так все уже понятно, источник Yandex angry
#7
Суббота, 01.08.2009, 08:27
TroYan
Заблокированные
Сообщения: 210
Репутация: 123
net, Слушай, во 1тема нетупая, во2 тупой тут может ты,в 3 ненадо тут флуд разводить.Тема полезная для новичков, а если она ненужная то Модераторы закрыли бы её!
#8
Суббота, 01.08.2009, 08:57
RazeR
Проверенный
Сообщения: 679
Репутация: 235
TroYan, не сказать что она полезная, но и бесполезная сказать тоже нельзя! Короч тема для новичков, и ты это сразу указал в названии темы.
Так что net, если ты V.I.P. не надо думать то что ты самый умный и правильный на всём мегасофте!
моя ася - 576780888
#9
Суббота, 01.08.2009, 09:53
GoLoVa
Заблокированные
Сообщения: 848
Репутация:
Источник ?
Любимый смайл -
Любимый смайл -
Мой зароботок
Суббота, 01.08.2009, 09:55
CCUMC
Проверенный
Сообщения: 1591
Репутация: 4731
Quote (GoLoVa)
Источник ?

ну сайт яндекса понятно. Статья немного полезная для тех кто не разбирается.
Суббота, 01.08.2009, 10:14
TroYan
Заблокированные
Сообщения: 210
Репутация: 123
GoLoVa, Мда еще ник "Голова" wacko
Суббота, 01.08.2009, 10:15
smack
Заблокированные
Сообщения: 314
Репутация:
ппц я не разбираюсь!Спс что создал тему!но у меня вопрос добавляю сайт в яндекс,пишет что-то на счет этого файла! x(
и не могу добавить помогите плс cry
Ушел на ForuCoz.com и всем желаю того-же...хотите баньте..хотите нет..мне ПОХУЙ
Суббота, 01.08.2009, 10:44
RazeR
Проверенный
Сообщения: 679
Репутация: 235
smack, у тебя походу в файле robots.txt запрещена индексация яндексом
моя ася - 576780888
Суббота, 01.08.2009, 11:47
GoLoVa
Заблокированные
Сообщения: 848
Репутация:
TroYan, А тебе ненравится ? ЧТо-то..
Любимый смайл -
Любимый смайл -
Мой зароботок
Суббота, 01.08.2009, 12:13
smack
Заблокированные
Сообщения: 314
Репутация:
RazeR, и теперь я не смогу добавить сайт в яндекс? sad
Пост отредактировал smack - Суббота, 01.08.2009, 12:13
Ушел на ForuCoz.com и всем желаю того-же...хотите баньте..хотите нет..мне ПОХУЙ
  • Страница 1 из 2
  • 1
  • 2
  • »
Поиск:
Форум
Социальные сети
Хостинг от uCoz