Скрыть объявление
ВАШИ ПРАВА ОГРАНИЧЕНЫ!

Зарегистрируйтесь на форуме, чтобы стать полноценным участником сообщества!

Правильный robots.txt для datalife engine

Тема в разделе "Хаки DLE", создана пользователем PunPun, 1 авг 2017.

01.08.17 в 19:45
22.05.23 в 14:29
33
14.811
2
  1. TopicStarter Overlay
    PunPun

    VIP Кинотрафик v2

    Регистрация:
    11 июн 2015
    Сообщения:
    7.396
    Лучших ответов:
    32
    Рейтинги:
    +4.010 / 113 / -0
    Для чего нужен robots.txt?
    Для того чтобы указывать поисковику какие страницы посещать и индексировать можно, а какие нельзя. Закрывая от индексации какие-то страницы (или даже разделы) вы тем самым признаете, что эти страницы некачественные или ненужные по различным причинам. Чаще всего запрет используется для исключения дублей страниц и технической информации. К сожалению, реальность такова, что сегодня 99% сайтов имеющих файл роботс закрывают с его помощью как раз такие страницы.

    И вот идеальный robots.txt для Чистой версии DLE:
    Код:
    User-agent: *
    Disallow: /engine/*
    Disallow: */page/*/
    Disallow: */page/
    Disallow: /user/*
    Disallow: /lastnews/*
    Disallow: /catalog/*
    Disallow: /newposts/*
    Disallow: /favorites/
    Disallow: /rules.html
    Disallow: /statistics.html
    Disallow: /addnews.html
    Disallow: /?do=*
    Disallow: /index.php?do=*
    Allow: /engine/classes/js/
    Allow: /engine/classes/min/index.php
    Allow: /engine/data/emoticons/
    
    Host: site.com
    Sitemap: http://site.com/sitemap.xml
    С помощью него мы закроем доступ ко всем не нужным файлам в папке engine, страницам навигации (что по сути есть дубли), страницам стандартных возможностей DLE которые дублируют контент и никак не позволят собрать трафик и так же разрешим доступ для ПС к нужным файлам которые используются движком на страницах.
     
    • Полезно Полезно x 6
    • Нравится Нравится x 2
    • Лучший Лучший x 2
    • Не согласен Не согласен x 1
  2. Uralbox

    Команда форума VIP Кинотрафик v2

    Регистрация:
    25 окт 2015
    Сообщения:
    1.593
    Лучших ответов:
    0
    Рейтинги:
    +185 / 5 / -0
    Кто может объективно прокомментировать этот robots.txt ?
    Особенно смущают эти пункты -
    Disallow: */page/*/
    Disallow: */page/
     
  3. f1nder

    f1nder Бывалый

    Регистрация:
    30 сен 2015
    Сообщения:
    130
    Лучших ответов:
    0
    Рейтинги:
    +42 / 0 / -0
    Это чтобы мусорные навигационные страницы не индексировались.
     
  4. TopicStarter Overlay
    PunPun

    VIP Кинотрафик v2

    Регистрация:
    11 июн 2015
    Сообщения:
    7.396
    Лучших ответов:
    32
    Рейтинги:
    +4.010 / 113 / -0
    Ты на преколе? Я в конце для кого все написал?
     
  5. Uralbox

    Команда форума VIP Кинотрафик v2

    Регистрация:
    25 окт 2015
    Сообщения:
    1.593
    Лучших ответов:
    0
    Рейтинги:
    +185 / 5 / -0
    Ну я в курсе конечно что за что отвечает. Я про то, стоит ли так закрывать для роботов - это же и закрытие переходов этих же роботов.
     
  6. LisER07

    VIP Кинотрафик v2 Кодер

    Регистрация:
    4 окт 2015
    Сообщения:
    630
    Лучших ответов:
    2
    Рейтинги:
    +116 / 3 / -0
    PunPun а со страницы узеров можно траф собирать ?
     
  7. GUEVARA

    GUEVARA Бывалый

    Регистрация:
    28 мар 2017
    Сообщения:
    162
    Лучших ответов:
    0
    Рейтинги:
    +40 / 13 / -0
    Самый дибильнейшей роботс, который я когда либо видел на ДЛЕ, приведите хоть пару тройку сайтов с топа, у которых такой чудо-роботс?
    Извините за наглость, но всё же спрошу, а на какой ляд индексировать например:
    /language/
    /templates/
    /upgrade/
    /user/ - который засрут ссылками прогонщики
    /backup/
    /*print - который создаст те же дубли. только якобы для принтерной версии сайта

    Это всё нужно в поиске? В этот список еще могу смело добавить 7-10 строк, которые не скрыты в вашем роботсе
     
    • Нравится Нравится x 3
  8. TopicStarter Overlay
    PunPun

    VIP Кинотрафик v2

    Регистрация:
    11 июн 2015
    Сообщения:
    7.396
    Лучших ответов:
    32
    Рейтинги:
    +4.010 / 113 / -0
    GUEVARA где lang, temp, uprage, backup в поиске?)) Такие заявления без всяких пруфов и непонимания что эти папки не индексируются.
     
  9. GUEVARA

    GUEVARA Бывалый

    Регистрация:
    28 мар 2017
    Сообщения:
    162
    Лучших ответов:
    0
    Рейтинги:
    +40 / 13 / -0
    :eek::D:D:D это без комментариев))) Вы еще расскажите мне, что /user/ и /*print тоже в поиск не попадут
    Но перед тем как создавать подобные темы и учить кого то, разберитесь в этом сами
    А я пожалуй промолчу и не буду критиковать больше ваш роботс, а то вы входите в команду форума, а то я сейчас и другие моменты добавлю, даже хотя бы обращение к яндексу через User-agent: Yandex, которое должно быть прописано. Пожалуй разговор закрыт) Вам видней, ваш роботс правильный)
     
  10. LisER07

    VIP Кинотрафик v2 Кодер

    Регистрация:
    4 окт 2015
    Сообщения:
    630
    Лучших ответов:
    2
    Рейтинги:
    +116 / 3 / -0
    Мой "идеальный" вариант robots.txt
    Код:
    User-agent: *
    Allow: /*.js
    Allow: /*.css
    Allow: /engine/classes/js/
    Allow: /engine/classes/min/index.php
    Allow: /engine/data/emoticons/
    Disallow: /engine/*
    Disallow: */page/*/
    Disallow: */page/
    Disallow: /user/*
    Disallow: /lastnews/*
    Disallow: /catalog/*
    Disallow: /newposts/*
    Disallow: /favorites/
    Disallow: /rules.html
    Disallow: /statistics.html
    Disallow: /index.php?do=*
    Disallow: /*print
    Disallow: /*print:*
    Disallow: /*rss.xml
    Disallow: /addnews.html
    Disallow: /favorites/
    
    User-agent: Yandex
    Allow: /*.js
    Allow: /*.css
    Allow: /engine/classes/js/
    Allow: /engine/classes/min/index.php
    Allow: /engine/data/emoticons/
    Disallow: /engine/*
    Disallow: */page/*/
    Disallow: */page/
    Disallow: /user/*
    Disallow: /lastnews/*
    Disallow: /catalog/*
    Disallow: /newposts/*
    Disallow: /favorites/
    Disallow: /rules.html
    Disallow: /statistics.html
    Disallow: /index.php?do=*
    Disallow: /*print
    Disallow: /*print:*
    Disallow: /*rss.xml
    Disallow: /addnews.html
    Disallow: /favorites/
    
    User-agent: Googlebot
    Allow: /*.js
    Allow: /*.css
    Allow: /engine/classes/js/
    Allow: /engine/classes/min/index.php
    Allow: /engine/data/emoticons/
    Disallow: /engine/*
    Disallow: */page/*/
    Disallow: */page/
    Disallow: /user/*
    Disallow: /lastnews/*
    Disallow: /catalog/*
    Disallow: /newposts/*
    Disallow: /favorites/
    Disallow: /rules.html
    Disallow: /statistics.html
    Disallow: /index.php?do=*
    Disallow: /*print
    Disallow: /*print:*
    Disallow: /*rss.xml
    Disallow: /addnews.html
    Disallow: /favorites/
    
    Host: site.ru
    Sitemap: http://site.ru/sitemap.xml
     
    #10 LisER07, 8 окт 2017
    Последнее редактирование: 8 окт 2017
  11. TopicStarter Overlay
    PunPun

    VIP Кинотрафик v2

    Регистрация:
    11 июн 2015
    Сообщения:
    7.396
    Лучших ответов:
    32
    Рейтинги:
    +4.010 / 113 / -0
    GUEVARA если ты глуп и не в курсе что это папки к которым нет входа ни пс ни юзеру, как они могут индексироваться. С головой все в поряде?
     
    • Нравится Нравится x 1
  12. GUEVARA

    GUEVARA Бывалый

    Регистрация:
    28 мар 2017
    Сообщения:
    162
    Лучших ответов:
    0
    Рейтинги:
    +40 / 13 / -0
    Ясненько)))
    И раз уж на то пошло, user - это не папка, а директория по которой создаются пользователи, которые размещают в поле о себе ссылки на свои сайты. А принт это обыкновенный дубли ваших текстов, которые вы даже не удосужились закрыть... и причем тут "юзерам нет входа"?
    Господи, не позорьтесь лучше, вы команда форума, вы хоть это знать должны
    Больше ничего не напишу в этом теме... всех благ
     
    #12 GUEVARA, 8 окт 2017
    Последнее редактирование: 8 окт 2017
    • Согласен Согласен x 1
  13. Burial

    Burial Местный

    Регистрация:
    30 сен 2015
    Сообщения:
    1.994
    Лучших ответов:
    2
    Рейтинги:
    +464 / 80 / -0
    Кто нибудь напишет идеальный роботс в этом веке?
     
  14. LisER07

    VIP Кинотрафик v2 Кодер

    Регистрация:
    4 окт 2015
    Сообщения:
    630
    Лучших ответов:
    2
    Рейтинги:
    +116 / 3 / -0
  15. TopicStarter Overlay
    PunPun

    VIP Кинотрафик v2

    Регистрация:
    11 июн 2015
    Сообщения:
    7.396
    Лучших ответов:
    32
    Рейтинги:
    +4.010 / 113 / -0
    GUEVARA что бы ссылка на print попала в индекс она должна быть в шаблоне, так что если ее нет в шаблоне о какой индексации данной страницы может идти речь? Жги еще, а я и далее буду рофлить с тебя.
     
    • Нравится Нравится x 1
  16. byroot

    Забанен

    Регистрация:
    10 окт 2015
    Сообщения:
    12.295
    Лучших ответов:
    54
    Рейтинги:
    +5.206 / 74 / -0
    2017-10-09_19-08-15.png

    Иногда лучше промолчать, если не уверен на все 100% в том что пишешь!
    Страницы юзеров, пагинация и т.п. второстепенные страницы хорошо закрываются метатегом ноиндекс.
     
  17. GUEVARA

    GUEVARA Бывалый

    Регистрация:
    28 мар 2017
    Сообщения:
    162
    Лучших ответов:
    0
    Рейтинги:
    +40 / 13 / -0
    ага))) особенно для гугла noindex самое то)))

    а чего вы кстати поредактировали сообщения PunPana, в которых он меня оскорбляет?) или он сам решил не позорится больше?

    Кстати кстати кстати, только сейчас заметил, что роботс который в самом первом посте от PunPun - координально изменен и приведен в более менее нормальный и умный вариант... Где же исходный вариант уважаемый PunPun, который считался правильным? А то люди заходят и не понимают в чем собственно весь этот срач заключается... решили так выкрутится и меня в дураки выставить? Вы извинится случайно не хотите?
     
    #17 GUEVARA, 9 окт 2017
    Последнее редактирование модератором: 9 окт 2017
  18. byroot

    Забанен

    Регистрация:
    10 окт 2015
    Сообщения:
    12.295
    Лучших ответов:
    54
    Рейтинги:
    +5.206 / 74 / -0
    для гугла никто не отменял роботс:
    Код:
    <meta name="robots" content="noindex,nofollow" />
    или
    Код:
    <meta name="robots" content="noindex,follow" />
    тема подчищена! Продолжите в данном разделе подобное общение - оба инициатора получат РО на сутки!
     
  19. GUEVARA

    GUEVARA Бывалый

    Регистрация:
    28 мар 2017
    Сообщения:
    162
    Лучших ответов:
    0
    Рейтинги:
    +40 / 13 / -0
    Да просто на многих форумах за подобные высказывания штрафуют и кидают предупреждение, не понимаю почему у вас не так, ведь вы являетесь лидирующем форумом по киносайтам... просто тема подчищается и не наказывается нарушитель, ведь у вас в правилах написано - запрещено использовать оскорбительные выражения, в итоге я был и балаболом и тупицей и тд... а ТС тему просто поправил пост и я в дураках, не очень то и приятно
    я конечно всё понимаю, что я новичок... но всё же
     
  20. byroot

    Забанен

    Регистрация:
    10 окт 2015
    Сообщения:
    12.295
    Лучших ответов:
    54
    Рейтинги:
    +5.206 / 74 / -0
    GUEVARA брань не приветствуется нигде! Сообщения подтерты! Все наезды что были - не по теме и они удалены! Первое сообщение отредактировано - это уже другой вопрос. Первый вариант файла был правильным, добавлять его новыми строками было не обязательно, но раз уж ТС решил так сделать - то пускай так и остается.
     
Похожие темы
  1. geony
    Ответов:
    25
    Просмотров:
    8.736
  2. ZerocooL
    Ответов:
    679
    Просмотров:
    83.578
  3. PunPun
    Ответов:
    27
    Просмотров:
    16.448
  4. PunPun
    Ответов:
    12
    Просмотров:
    6.350
Загрузка...
Яндекс.Метрика