подскажите по парсингу

Тема в разделе "Вопросы и ответы", создана пользователем dslash, 18.01.16.

  1. dslash

    dslash Активный участник

    Сообщения:
    367
    Симпатии:
    193
    Баллы:
    72
    Подскажите чем и где можно напарсить наиболее "чистые" статьи? И ещё чем можно напарсить комментарии? Бурж.

    Есть Х-парсер и а-парсер. Но пока не силён в них.
     
  2. Insider

    Insider Администратор Команда форума

    Сообщения:
    1.025
    Симпатии:
    685
    Баллы:
    209
    Наиболее чистый вариант - это парсинг одного конкретного сайта, где ты можешь настроить точные границы парсинга. Например, с помощью Content Downloader.

    Если надо парсить по ключам, то можно X-parser, но стоит учитывать, что ключи должны быть очень читабельными и не очень НЧ. В противном случае ручного редактирования не избежать.

    А тебе для каких целей?
     
  3. dslash

    dslash Активный участник

    Сообщения:
    367
    Симпатии:
    193
    Баллы:
    72
    Для доров. Я уже парсил х-парсером и чистил текст регулярками... Вышло хорошо, но всегда хочется лучше.
     
  4. Insider

    Insider Администратор Команда форума

    Сообщения:
    1.025
    Симпатии:
    685
    Баллы:
    209
    Тогда X-parser лучший вариант.
     
  5. amnesia

    amnesia Новичок

    Сообщения:
    75
    Симпатии:
    40
    Баллы:
    19
    Я под бурж русские книги переводчику скармливал, получается 100% уникальный и более-менее читабельный текст.Правда под разные тематики не всегда подберешь.
     
  6. dslash

    dslash Активный участник

    Сообщения:
    367
    Симпатии:
    193
    Баллы:
    72
    У меня своя метода. Но нужен качественный текст исходник. Желательно тематический. )

    А комменты хотел именно живые напарсить вроде.

    Это замечательно.
    Отличная статья, пиши еще... И т.д.

    Вот только чем не представляю.
     
  7. Insider

    Insider Администратор Команда форума

    Сообщения:
    1.025
    Симпатии:
    685
    Баллы:
    209
    Content Downloader

    Найти тематический сайт и спарсить все комменты с него.
     
  8. dslash

    dslash Активный участник

    Сообщения:
    367
    Симпатии:
    193
    Баллы:
    72
    У меня нету ее... Хорошая прога? Стоит купить?
     
  9. Insider

    Insider Администратор Команда форума

    Сообщения:
    1.025
    Симпатии:
    685
    Баллы:
    209
    Да, очень хорошая и стоит немного.
     
  10. Bratec

    Bratec Новичок

    Сообщения:
    14
    Симпатии:
    3
    Баллы:
    3
    Как это сделать массово? Зенкой?
     
  11. Veemankm

    Veemankm Новичок

    Сообщения:
    61
    Симпатии:
    32
    Баллы:
    14
    Промтом. Суляешь кучу книг, а он переведёт. Правда мусора выгребать потом....:vomit:

    PS Возьми произведения Толстого, они до настоящего времени авторским правом не защищены=))))
     
  12. dslash

    dslash Активный участник

    Сообщения:
    367
    Симпатии:
    193
    Баллы:
    72
    Хех, пожелайте удачи. Запускаю самые мощные доры за всю свою карьеру. Встретимся в топе. )
     
    mixwor и mordvin нравится это.
  13. mixwor

    mixwor Новичок

    Сообщения:
    70
    Симпатии:
    3
    Баллы:
    13
    Хочу попробовать сделать пачку другую доров под download но застопорился на контенте для них.
    Блэк интресно послушать твои методы приготовления контента для свои даунлод дорчиков, а конкретно:
    1) Какую текстовку используешь?
    2) Чем и где ее парсишь?
    3) Используешь ли на страницах дора картинки и видео?

    P.S.
    Сейчас на руках есть даунлод кеи по драйверам (выделила пп) , потом из парсеров x-parser и CD (еще даже не разобрался и не парсил ими, ток купил недавно), но что то не догоняю какую текстовку можно использовать на доре по драйверам.
     
  14. Insider

    Insider Администратор Команда форума

    Сообщения:
    1.025
    Симпатии:
    685
    Баллы:
    209
    Да нет какого-то особого метода, а последние мои доры, начиная с осени все были провальными. Так что это лучше не у меня спрашивать :)

    Просто любую околотематическую текстовку, сгенеренную по алгоритмы "стыковка по запятым".

    X-parser и Content Downloaded

    Раньше не использовал, но сейчас буду использовать картники, так как один популярный западный сеошник проводил исследование на около 1 млн запросов и пришел к выводу, что сайты, имеющие хотя бы одну картинку в посте лучше ранжируются. Думаю, что стоит попробовать.
     
    mixwor нравится это.
  15. Dimonchik

    Dimonchik Новичок

    Сообщения:
    5
    Симпатии:
    0
    Баллы:
    7
    А как делать околотематическую текстовку на доре, если ключевики микс(и драйвера, и инструкции и т.д.)? Или все-таки ключи группировать по темам? И сколько(примерно) надо текстовки на один дорвей на 10000 ключей?
     
  16. Insider

    Insider Администратор Команда форума

    Сообщения:
    1.025
    Симпатии:
    685
    Баллы:
    209
    На даунлоад дорах я не заморачивался с тематикой текстовки. Но можно парсить снипетты по каждому ключу.
     
  17. Dimonchik

    Dimonchik Новичок

    Сообщения:
    5
    Симпатии:
    0
    Баллы:
    7
    Спасибо, Инсайдер! Форум - находка для чайников!
    Было бы еще круто, если б была возможность читать форум через Tapatalk.
     

Поделиться этой страницей