Telegram-канал scrapy_python - Scrapy: Unsorted - каталог телеграмм

Scrapy

06 May 2024 21:01

Всем привет.


def start_requests(self):
    with open("somefile.csv", mode="r", encoding="UTF-8") as csv_file:
        csv_reader = csv.DictReader(csv_file, delimiter="|")
        for row in csv_reader:
            row['emails'] = None
            if not row.get("Website"):
                yield row
                continue

builtins.AttributeError: 'dict' object has no attribute 'dont_filter'

ето фича или баг?

Читать полностью…

Scrapy

06 May 2024 12:42

https://github.com/scrapy/scrapy/pull/6246

Читать полностью…

Scrapy

06 May 2024 11:30

значит она вся будет ждать если надо ждать

Читать полностью…

Scrapy

06 May 2024 11:29

start_request с data:, шлет запрос, дальше async функция в цикле с inline_ реквестами и yield-ят обычные реквесты

Читать полностью…

Scrapy

06 May 2024 11:24

У меня есть 10 реквестов которые должны спать, они позже выполняют обычные реквесты. вот первый уснул, и как проснулся должен пойти выполнять дальше обычные реквесты. А у меня пока все 10 реквестов не проснутся, дальше не идет.

Читать полностью…

Scrapy

06 May 2024 11:20

Точнее работает, но не так как мне нужно. Блокируются вообще все реквесты. Может конечно я что-то не так делаю)

Читать полностью…

Scrapy

06 May 2024 11:18

ну т.е что такое инлайн реквест?

Читать полностью…

Scrapy

06 May 2024 11:18

если он на дефередах то да, callLater

Читать полностью…

Scrapy

06 May 2024 11:18

await asyncio.sleep()

Читать полностью…

Scrapy

06 May 2024 11:15

планируется когда-нибудь, оно застряло потому что мы хотели привязать к этому изменение поведения start_requests в плане наполнения очереди

Читать полностью…

Scrapy

06 May 2024 01:51

I'm looking for someone who

- Have good combo i can check qulaity with you
- Knows how to dump / or have HQ keywords/dorks and good tools.
- Mail access
I need someone to work long term with me i paying very good when i have good quality acc. You can write me on Telegram at @Roulenmm
I only focused on Poland Mainly this domian

For https://1login.wp.pl
@wp.pl, @o2.pl, @Tlen.pl, @go2.pl

For https://poczta.interia.pl/logowanie/
@interia.pl, @interia.eu, @interia.com, @poczta.fm, @VIP.interia.pl, @intmail.pl, @interiowy.pl, @adresik.net, @pisz.to, @pacz.to, @ogarnij.se, @hub.pl

Russian:
"Ищу кого-то, кто:

- Имеет хороший комбо, с которым я могу проверить качество.
- Знает, как выкачивать / или имеет качественные ключевые слова/дорки и хорошие инструменты.
- Имеет доступ к почте.
Мне нужен человек для долгосрочной работы, я плачу очень хорошо, когда у меня есть хорошие качественные аккаунты. Вы можете написать мне в Telegram или Telegram - @Roulenmm

Я сосредоточен в основном на Польше, преимущественно на этих доменах:

Для https://1login.wp.pl
@wp.pl, @o2.pl, @Tlen.pl, @go2.pl

Для https://poczta.interia.pl/logowanie/
@interia.pl, @interia.eu, @interia.com, @poczta.fm, @VIP.interia.pl, @intmail.pl, @interiowy.pl, @adresik.net, @pisz.to, @pacz.to, @ogarnij.se, @hub.pl

Читать полностью…

Scrapy

30 Apr 2024 16:36

Если есть пару лишних тысяч долларов, можешь проконсультироваться у каких-то прокси провайдеров

Читать полностью…

Scrapy

29 Apr 2024 19:18

страницы, не слинкованные никуда, вы не найдёте никак

Читать полностью…

Scrapy

29 Apr 2024 19:17

Только по прямому url и если есть ссылки с этого юрла на странице? Это так работает?

По карте сайта по идее можно?

Читать полностью…

Scrapy

29 Apr 2024 17:19

как считаете, каждый раз при вызове asyncio.run_in_executor мне следует передавать единственный экземпляр эксекьютора?
scrapy/twisted сами эксекьютор используют, или напрямую с threadpool работают?
если используют, то могу ли получить доступ к экземпляру эксекьютора, чтоб не спавнить свой второй?

Читать полностью…

Scrapy

06 May 2024 12:45

нет, в 2.11.2 этого не будет, только в 2.12

Читать полностью…

Scrapy

06 May 2024 12:32

кстати, в 2.11.2 в download_slots можно будет autothrottle выключать?

Читать полностью…

Scrapy

06 May 2024 11:29

ну вот асинк функция она эти N реквестов последовательно ждёт? или там gather? или как

Читать полностью…

Scrapy

06 May 2024 11:26

а как ты их реализовал?

Читать полностью…

Scrapy

06 May 2024 11:21

может мы про разное
типа вот у тебя колбэк, он же последовательно выполняется, ты в нём сказал сделать реквест, он же дальше не пойдёт пока ответ не придёт, если перед этим спать то точно так же весь колбэк ждёт

Читать полностью…