pip install scrapy-pyppeteer
pip install beautifulsoup4
- https://psy.su/club/forum/
- проверка
scrapy check psy_su
- скрапинг
scrapy crawl psy_su
- результат в файле
data/data_psy_su.csv
- проверка
- https://psyhelp24.org
- проверка
scrapy check psyhelp24_org
- скрапинг
scrapy crawl psyhelp24_org
- результат в файле
data/data_psyhelp24_org.csv
- проверка
- https://psycheforum.ru
- проверка что работает
scrapy check psycheforum_ru
- просмотр выдачи со странички
scrapy parse --spider=psycheforum_ru https://psycheforum.ru/topic/97703-lyubovnaya-addikciya/
- скрапинг
scrapy crawl psycheforum_ru
- скрапинг с сохранением и возможностью продолжить при остановке
scrapy crawl psycheforum_ru -s JOBDIR=crawls/psycheforum_ru-1
- результат в файле
data/data_psycheforum_ru.csv
- проверка что работает
- https://www.b17.ru/forum/
- проверка
scrapy check b17_ru
- получение данных с одной странички
scrapy parse -s spider=b17_ru --depth=1 https://www.b17.ru/forum/topic.php?id=365771
- скрапинг
scrapy crawl b17_ru
- данные в файле
data/data_b17_ru.csv
- проверка
- https://forum.psyche.guru/
- https://www.psychologies.ru/forum/ (закрыт)
Тестовый запуск на получение 5 записей scrapy crawl psycheforum_ru -s CLOSESPIDER_ITEMCOUNT=5
Подготовку выполняет скрипт prepare4db.py
.
Запуск python prepare4db.py