Скрыть объявление
ВАШИ ПРАВА ОГРАНИЧЕНЫ!

Зарегистрируйтесь на форуме, чтобы стать полноценным участником сообщества!

A-parser 1.1 - продвинутый парсер поисковых систем, suggest, pr, dmoz, whois, etc

Тема в разделе "Google", создана пользователем A-Parser Support, 12 янв 2017.

12.01.17 в 14:37
18.05.18 в 10:31
45
2.871
1
  1. TopicStarter Overlay
    A-Parser Support

    A-Parser Support Новичок

    Регистрация:
    12 янв 2017
    Сообщения:
    36
    Лучших ответов:
    0
    Рейтинги:
    +2 / 0 / -1
    1.2.160 - поддержка SQLite, проверка доменов на клей, Parse all results в SE::Yahoo

    [​IMG]
    Улучшения
    • Добавлена поддержка SQLite в JavaScript парсерах и шаблонизаторе, пример использования здесь
    • Добавлена защита от случайного закрытия окна парсера
    • В [​IMG] SE::Yahoo добавлены Parse all results и Parse related to level
    • [​IMG] SE::Yandex::TIC полностью переписан, добавлена возможность проверять домены на клей
    • В [​IMG] Rank::MegaIndex добавлена поддержка ReCaptcha2
    • Улучшен парсинг сниппетов в [​IMG] SE:: DuckDuckGo
    • Улучшен сбор почт в [​IMG] HTML::EmailExtractor
    Исправления в связи с изменениями в выдаче
    • Обновлен алгоритм Bypass Cloudflare
    • [​IMG] SE::Bing::Translator почти полностью переписан в связи с изменением логики работы переводчика Bing
    • Исправлена работа [​IMG] SE::Seznam с некоторыми видами запросов
    • Исправлен парсинг related keywords, а также мобильной выдачи в [​IMG] SE::Google::Modern
    • Исправлен парсинг related keywords в [​IMG] SE::Bing
    • Исправлена работа [​IMG] SE::IxQuick при работе с русскоязычными запросами
    • [​IMG] SE::Yandex:: Direct, [​IMG] SE::Google::ByImage, [​IMG] SE::Yandex::WordStat
    Исправления
    • Исправлена работа [​IMG] SE::Google::Modern на IPv6 прокси
    • Исправлена ошибка, из-за которой [​IMG] SE::Google::Modern собирал ссылки с пометкой опасных сайтов в общий массив ссылок
    • Исправлена работа с оператором поиска + в [​IMG] SE::Bing
    • Исправлен парсинг запросов со спецсимволами в [​IMG] SE:: DuckDuckGo
    • Исправлена работа [​IMG] Rank::MajesticSEO
    • Исправлен баг с overrideOpts в JS парсерах
    • Исправлена работа с переменными при их создании в Parse custom results, а также при использовании нижнего подчеркивания в именах в Конструкторе результатов
    • Исправлена работа tools.js, баг появился в одной из предыдущих версий
    • Исправлен баг, из-за которого А-Парсер падал на некоторых ОС, появился в одной из предыдущих версий
     
  2. TopicStarter Overlay
    A-Parser Support

    A-Parser Support Новичок

    Регистрация:
    12 янв 2017
    Сообщения:
    36
    Лучших ответов:
    0
    Рейтинги:
    +2 / 0 / -1
    Видео урок: Создание JS парсеров. Работа с CAPTCHA
    Третье видео в цикле уроков по созданию JavaScript парсеров. Здесь рассказано о том, как написать JS парсер, в котором будет поддержка антигейта для разгадывания каптч на страницах.



    В уроке рассмотрено:
    • Создание JS-парсера для разгадывания капчи
    • Работа с объектом this.captcha внутри JavaScript кода
    • Описание процесса разгадывания каптчи, реализованного в A-Parser

    Статья и готовый парсер: Создание JS парсеров. Работа с CAPTCHA.

    Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
     
  3. TopicStarter Overlay
    A-Parser Support

    A-Parser Support Новичок

    Регистрация:
    12 янв 2017
    Сообщения:
    36
    Лучших ответов:
    0
    Рейтинги:
    +2 / 0 / -1
    Сборник рецептов #22: проверка индексации в нескольких ПС, многоуровневый парсинг и поиск сабдоменов

    22-й сборник рецептов. В нем мы разберемся, как проверять индексацию всех страниц сайта одновременно в нескольких поисковиках, научимся парсить данные по ссылкам из выдачи одним заданием и будем искать сабдомены на сайтах. Поехали!

    Получение страниц сайта и проверка индексации в Google и Яндекс

    Данный пресет позволяет спарсить ссылки на все страницы сайта и одновременно проверить их на предмет индексации поисковиками (в примере Google и Яндекс, можно по аналогии добавить другие ПС). Готовый пресет и описание по ссылке выше.
    [​IMG]

    Парсим title и description для TOP10 поисковой выдачи по ключевому слову

    Пример использования tools.query.add в JavaScript парсерах. Данный парсер получает ссылки из выдачи, после чего собирает из каждой страницы title и description. И все это одним заданием с максимальной производительностью, благодаря многопоточному парсингу. Парсер с описанием доступны по ссылке выше.
    [​IMG]

    Поиск сабдоменов сайта

    Небольшой пример, который демонстрирует, как собрать поддомены одного или нескольких сайтов. Используется [​IMG] HTML::LinkExtractor и Parse to level для прохода вглубь по страницам сайта. При этом Конструктором результатов извлекаются из внутренних ссылок домены и выводятся с уникализацией по строке. Готовый пресет - по ссылке выше.
    [​IMG]

    Кроме этого:
    Еще больше различных рецептов в нашем Каталоге!
    Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

    Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

    Предыдущие сборники рецептов:
     
  4. TopicStarter Overlay
    A-Parser Support

    A-Parser Support Новичок

    Регистрация:
    12 янв 2017
    Сообщения:
    36
    Лучших ответов:
    0
    Рейтинги:
    +2 / 0 / -1
    Сборник статей #3: пагинация, переменные и БД SQLite

    В этом сборнике статей мы рассмотрим все возможные варианты решения задачи прохода по пагинации на сайтах, очень детально изучим работу с переменными в JavaScript парсерах, а также попробуем работать с базами данных SQLite на примере парсера курсов валют. Поехали!

    Обзор вариантов прохода по пагинации

    В A-Parser существует несколько способов, с помощью которых можно реализовать проход по пагинации. В связи с их разнообразием, становится актуальным вопрос выбора нужного алгоритма, который позволит максимально эффективно переходить по страницам в процессе парсинга. В этой статье мы постараемся разобраться с каждым из способов максимально подробно. Также будут показаны реальные примеры и даны рекомендации по оптимизации многостраничного парсинга. Статья - по ссылке выше.
    [​IMG]

    Переменные в парсерах JavaScript

    JS парсеры в А-Парсере появились уже около года назад. Благодаря им стало возможным решать очень сложные задачи по парсингу, реализовывая практически любую логику. В этой статье мы максимально подробно изучим работу с разными типами переменных, а также узнаем, как можно оптимизировать работу сложных парсеров. Все это - в статье по ссылке выше.
    [​IMG]

    Разработка JS парсера с сохранением результата в SQLite

    Начиная с версии 1.2.152 в A-Parser появилась возможность работать с БД SQLite.
    В данной статье мы рассмотрим разработку JavaScript парсера, который будет парсить курсы валют из сайта finance.i.ua и сохранять их в БД. В результате получится парсер, в котором продемонстрированы основные операции с базами данных. Подробности, а также готовый парсер - по ссылке выше.
    [​IMG]


    Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки :) ) - отписывайтесь здесь.

    Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

    Предыдущие сборники статей
     
  5. TopicStarter Overlay
    A-Parser Support

    A-Parser Support Новичок

    Регистрация:
    12 янв 2017
    Сообщения:
    36
    Лучших ответов:
    0
    Рейтинги:
    +2 / 0 / -1
    1.2.185 - увеличение скорости в SE::Google::Modern, новые возможности Net:: DNS, множество улучшений

    [​IMG]
    Улучшения
    • [​IMG] SE::Google::Modern - многократно увеличена скорость парсинга
    • Множество улучшений в [​IMG]Net:: DNS:
      • Возможность указать несколько DNS и задать метод выбора
      • Бан нерабочих/плохих DNS по специальному эвристическому алгоритму
      • Возможность вывести в результат использованный DNS сервер при удачном запросе
    • В [​IMG] SE::Google::Modern добавлена опция Use sessions
    • В [​IMG] SE::Yandex::WordStat добавлена настройка пресета антигейта для логина
    • Также в [​IMG] SE::Yandex::WordStat удалены настройки Use logins/Use sessions, теперь они включены всегда
    • Добавлена возможность автоматического удаления задания из Завершенных
    • В макросе подстановок {num} добавлена поддержка обратного отсчета
    • В JavaScript парсерах добавлена возможность сохранения произвольных данных в сессии
    • В JavaScript парсерах добавлена возможность прямого сохранения в файл
    • В API методе oneRequest/bulkRequest добавлена возможность указать configPreset
    • В связи с неактуальностью удалены парсеры SE::Google::Mobile и SE::Yandex::Catalog
    Исправления в связи с изменениями в выдаче
    Исправления
    • Количество неудачных больше не обнуляется при постановке на паузу
    • Исправлена проблема с подключением Node.js модулей на Linux
    • Исправлено падение парсера в редких ситуациях при использовании JS парсеров
    • Решена проблема с подключением Node.js модулей lodash, sequelize
    • Исправлена ошибка итератора при равных границах в макросе {num}
     
  6. TopicStarter Overlay
    A-Parser Support

    A-Parser Support Новичок

    Регистрация:
    12 янв 2017
    Сообщения:
    36
    Лучших ответов:
    0
    Рейтинги:
    +2 / 0 / -1
    Разгадывание рекаптч в JS парсере

    Очередное видео в цикле уроков по созданию JavaScript парсеров. Здесь показано, как реализовать разгадывание рекаптч в JS парсере.

    [​IMG]

    В уроке рассмотрено:
    • Описание и настройка парсера [​IMG] Util::ReCaptcha2
    • Описание принципа работы ReCaptcha2
    • Создание кастомного JavaScript парсера с поддержкой разгадывания рекаптч

    Ссылки:

    Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
     
Яндекс.Метрика