· Владислав Сопин · SEO · 2 min read
Как грамотно настроить robots.txt?
Поговорим о важной составляющей технического SEO файле robots.txt. Этот небольшой текстовый документ играет огромную роль в правильном индексировании вашего сайта поисковыми системами.

Что такое robots.txt?
Файл robots.txt служит своеобразным руководством для поисковых роботов, поясняющим, какие страницы и ресурсы вашего сайта разрешено или запрещено индексировать. Грамотная настройка robots.txt способна существенно облегчить жизнь как владельцу сайта, так и самим ботам.
Содержание поста
- Что такое robots.txt
- Как правильно оформить robots.txt
- Важные директивы robots.txt
- Примеры использования директив
- Кириллица и символы
- Советы по созданию robots.txt
- Заключение
Как правильно оформить robots.txt?
Яндекс поддерживает стандарт Robots Exclusion Protocol с рядом особенностей. Рассмотрим требования и рекомендации по использованию этого файла:
Требования к файлу robots.txt: Размер файла не должен превышать 500 КБ. Название файла строго фиксировано robots.txt. Размещен он должен быть в корневой папке сайта. Доступность для ботов обеспечивается возвратом HTTP-кода статуса 200 OK при обращении к файлу. Редирект файлов robots.txt: Яндекс допускает перенос файла robots.txt с одного домена на другой, что полезно при смене адреса сайта. При таком подходе поисковый робот учтет инструкции нового файла.
Важные директивы robots.txt
Рассмотрим наиболее распространенные команды, которые используются в robots.txt:
- User-Agent: Указывает, какому роботу принадлежат последующие правила.
- Disallow: Запрещает индексировать указанные страницы или каталоги.
- Sitemap: Определяет расположение карты сайта (XML-файла sitemap).
- Clean-Param: Игнорирует параметры URL при обработке ссылок.
- Clean-Param: Разрешает индексировать отдельные страницы или разделы сайта.
- Clean-Param: Устанавливает минимальное время между загрузками страниц.
Примеры использования директив
Простейший пример открытого сайта: User-agent: Allow: Полный запрет индексации: User-agent: Disallow: А вот рекомендуемые закрытые разделы:
- Панели администраторов и административные страницы: Disallow: /admin/ Disallow: /wp-admin/
- Временные и тестовые страницы: Disallow: /test/ Disallow: /tmp/
- Картинки, скрипты и CSS-стили: Disallow: /images/ Disallow: /js/ Disallow: /css/
- Личные кабинеты и корзины покупок: Disallow: /cart/ Disallow: /account/
Кириллица и символы
Кириллицу в robots.txt использовать нельзя! Путь к файлам и каталогам указывается либо латиницей, либо транслитом. Имя домена при необходимости преобразуется в Punycode.
Неправильный пример
Disallow: /каталог/
Правильный пример
Disallow: /%D0%BA%D0%B0%D1%82%D0%B0%D0%BB%D0%BE%D0%B3/
Советы по созданию robots.txt:
Лучше всего создавать robots.txt в любом текстовом редакторе и сохранять его в UTF-8 без BOM. После создания обязательно проверьте файл через сервис проверки robots.txt в инструментах вебмастеров (например, Яндекс.Вебмастер). Расположите готовый файл в корень вашего сайта.
Заключение
Правильная настройка robots.txt важна для любого владельца сайта, так как от нее зависят качественные показатели индексации и снижение нагрузки на сервер. Надеюсь, мои советы помогли вам разобраться в вопросах robots.txt и теперь вы сможете грамотно настроить этот важный элемент технической оптимизации вашего сайта. Всегда готов поддержать вас консультациями и оказать помощь в создании или проверке robots.txt. Обращайтесь, будем рады помочь!



