Boty to 57,5% ruchu, co czwarty bot to AI

Po raz pierwszy w historii pomiarów to maszyny, a nie ludzie, generują większość ruchu w internecie. Z danych Cloudflare Radar, które 3 czerwca 2026 roku upublicznił prezes firmy Matthew Prince, wynika, że boty odpowiadają już za 57,5% wszystkich żądań HTML, a żywi użytkownicy za pozostałe 42,5%. W tym botowym tłumie najszybciej rośnie jedna kategoria: crawlery i agenci napędzani sztuczną inteligencją, którzy stanowią już ponad jedną czwartą zweryfikowanego ruchu automatycznego.

To nie jest statystyka dla samej statystyki. Dla każdego, kto zarabia na widoczności w wyszukiwarkach i w odpowiedziach modeli językowych, oznacza ona zmianę reguł gry: treść jest masowo pobierana, ale prawie nigdy nie odsyła ruchu z powrotem. W odpowiedzi na ten chaos Cloudflare uruchomił w czerwcu 2026 roku warstwę kryptograficznej weryfikacji agentów AI, opartą na świeżo sfinalizowanym standardzie W3C. Wyjaśniamy, co dokładnie pokazują liczby i co z nich wynika dla strategii SEO oraz AIO.

Kontekst: maszyny przejęły większość ruchu

Przez lata proporcja ruchu w sieci była względnie stabilna: ludzie generowali grubo ponad połowę żądań, a boty (od wyszukiwarek po monitoring) resztę. Ten układ właśnie się odwrócił. Według Cloudflare Radar automatyczne żądania po raz pierwszy przekroczyły próg 50% i sięgnęły 57,5% ruchu HTML. Prince skomentował to krótko: po raz pierwszy w sieci dominują maszyny, a nie ludzie.

Tempo tej zmiany napędza sztuczna inteligencja. Raport HUMAN Security pod tytułem 2026 State of AI Traffic wskazuje, że w trakcie 2025 roku ruch automatyczny rósł mniej więcej osiem razy szybciej niż ruch ludzki, a aktywność generowana przez agentów AI oraz przeglądarki agentowe wzrosła o blisko 8000%. Innymi słowy, do sieci wszedł zupełnie nowy typ użytkownika: program, który czyta strony w imieniu człowieka albo trenuje na nich model.

Wewnątrz tej kategorii widać też wyraźną rotację liderów. Z danych przytaczanych przez Cloudflare wynika, że ruch związany z wyszukiwaniem AI odpowiada już za 9,3% aktywności crawlerów AI, podczas gdy w kwietniu 2026 roku było to 7,5%. To znak, że produkty pokroju ChatGPT Search, Perplexity czy trybu wyszukiwania w asystentach systematycznie zwiększają swój udział w torcie crawlowania kosztem czystego scrapowania treningowego. Dla wydawcy to ważna różnica, bo właśnie ten wyszukiwawczy wycinek ma realną szansę odesłać kogoś z powrotem na stronę.

Pisaliśmy już o tym, jak zmienia się skład tego ruchu botowego, gdy GPTBot OpenAI prześcignął ClaudeBota Anthropica, a chiński Bytespider podwoił swój udział. Najnowsze dane Cloudflare dokładają do tego obrazu twardą liczbę: AI to już nie margines, lecz znacząca część całego automatycznego internetu.

Kluczowe fakty: ile ruchu generuje AI

Cloudflare rozbija ruch botów na kategorie i przypisuje im konkretne udziały. Według danych za maj 2026 roku crawlery AI odpowiadają za 20,3% zweryfikowanego ruchu botów, a osobna kategoria botów obsługujących wyszukiwanie AI dokłada kolejne 6,5%. Łącznie aktywność związana ze sztuczną inteligencją to około 26,7% zweryfikowanego ruchu automatycznego, czyli mniej więcej co czwarty bot.

Najważniejsze liczby z pomiarów Cloudflare Radar zebraliśmy w tabeli.

Wskaźnik	Wartość	Okres
Udział botów w ruchu HTML	57,5%	3 czerwca 2026
Udział ludzi w ruchu HTML	42,5%	3 czerwca 2026
Crawlery AI w ruchu botów	20,3%	maj 2026
Boty wyszukiwania AI (dodatkowo)	6,5%	maj 2026
Łączna aktywność AI w ruchu botów	ok. 26,7%	maj 2026
Udział Googlebota wśród crawlerów	27,26%	maj 2026
Udział GPTBota	11,48%	maj 2026
Udział ClaudeBota	9,73%	maj 2026

Równie wymowny jest cel, w jakim AI pobiera treści. Z analizy Cloudflare wynika, że 51,8% crawlowania AI służy trenowaniu modeli, czyli nie ma żadnego mechanizmu odsyłania ruchu z powrotem do źródła. Kolejne 35,7% to cel mieszany, a zaledwie 9,3% to crawlowanie czysto wyszukiwawcze, które teoretycznie może przełożyć się na cytowanie i kliknięcie. Dla wydawcy oznacza to, że ponad połowa pracy jego serwera idzie na zasilenie cudzego modelu bez śladu rewanżu.

Crawl-to-refer, czyli ile pobrań na jedno odesłanie

Najbardziej dramatyczny wskaźnik to tak zwany crawl-to-refer ratio, czyli stosunek liczby pobranych stron do liczby odesłań ruchu przez daną platformę. Im wyższa liczba, tym bardziej jednostronna relacja: bot bierze dużo, oddaje mało. Dane Cloudflare za różne okresy 2026 roku rysują przepaść między klasycznym wyszukiwaniem a modelami AI.

Bot / platforma	Crawl-to-refer	Okres
Google (klasyczne wyszukiwanie)	4,9:1	marzec 2026
PerplexityBot	111:1	I kw. 2026
GPTBot	1276:1	I kw. 2026
ClaudeBot	11122:1	25 maja do 1 czerwca 2026

Różnica jest porażająca. Google pobiera około pięciu stron na jedno odesłanie, więc relacja pozostaje w miarę zbalansowana. Tymczasem ClaudeBot w ostatnim mierzonym tygodniu maja pobrał ponad 11 tysięcy stron na każde jedno odesłanie. GPTBot w pierwszym kwartale notował 1276 pobrań na odesłanie, a Perplexity, mimo wizerunku silnika odpowiedzi, wypadał najlepiej spośród czystych platform AI z wynikiem 111:1. Cloudflare zastrzega, że ruch z natywnej aplikacji Claude często nie przenosi nagłówka referrer, co może zawyżać wynik Anthropica, ale nawet z tym zastrzeżeniem skala dysproporcji nie pozostawia złudzeń.

Weryfikacja agentów: standard Web Bot Auth wchodzi do gry

Rosnący i często anonimowy ruch AI stworzył problem zaufania: jak odróżnić uczciwego agenta działającego w imieniu użytkownika od podszywającego się scrapera, który tylko udaje, że jest ChatGPT czy Gemini. Odpowiedzią ma być Web Bot Auth, specyfikacja W3C sfinalizowana w maju 2026 roku, która definiuje kryptograficzny sposób podpisywania żądań przez boty.

Jak podaje Cloudflare w czerwcowej aktualizacji platformy, nowa warstwa weryfikacji agentów AI wykorzystuje właśnie te kryptograficzne wyzwania. Każdy certyfikowany agent, w tym ChatGPT Atlas, Claude w Chrome, przeglądarka Perplexity oraz tryb agentowy Gemini, podpisuje teraz swoje żądania weryfikowalnym tokenem. Według firmy lista objętych agentów pokrywa około 84% zidentyfikowanego ruchu przeglądarek AI na czerwiec 2026 roku.

To przełom z dwóch powodów. Po pierwsze, daje wydawcom narzędzie do precyzyjnego decydowania, kogo wpuszczają: można przepuścić zweryfikowanego agenta wyszukiwania, a jednocześnie zablokować bota trenującego model. Po drugie, tworzy fundament pod modele rozliczeń w stylu pay per crawl, w których dostęp do treści dla AI staje się transakcją, a nie domyślnym prawem. O blokowaniu treści w odpowiedziach AI i raportowaniu tego ruchu pisaliśmy przy okazji nowego raportu wydajności w Search Console.

Co to znaczy dla SEO i AIO

Dla branży wnioski są konkretne i w kilku miejscach niewygodne. Klasyczny model, w którym wymieniasz dostęp do treści na ruch z wyszukiwarki, przestaje obowiązywać w świecie AI. Boty pobierają twoje strony, by zasilić odpowiedź, która często nie zawiera klikalnego odesłania. To podważa fundament, na którym przez dwie dekady stało SEO: indeksacja w zamian za odwiedziny.

Pierwszy praktyczny wniosek dotyczy crawl budgetu i infrastruktury. Skoro AI generuje ponad jedną czwartą ruchu botów, a większość tego crawlowania nie odsyła nikogo z powrotem, koszty serwerowe rosną bez zwrotu w postaci sesji. Warto monitorować logi serwera pod kątem GPTBota, ClaudeBota i PerplexityBota oraz świadomie decydować, którym z nich otwierasz drzwi, a którym nie.

Drugi wniosek dotyczy strategii widoczności. Skoro tylko 9,3% crawlowania AI ma charakter wyszukiwawczy, to właśnie o ten wycinek toczy się gra o cytowania. Optymalizacja pod AIO nie polega na karmieniu modeli treningowych, lecz na tym, by w momencie odpowiadania na pytanie użytkownika model wybrał i przytoczył właśnie twoją stronę. Liczą się klarowna struktura, jednoznaczne definicje, wyraźni autorzy oraz dowody w postaci danych i przykładów. To te same cechy, które od dawna polecamy w analizach widoczności w AI search, gdzie rozwiązania w rodzaju llms.txt okazały się rozczarowaniem, a realną przewagę dawała jakość i parsowalność treści.

Trzeci wniosek jest finansowy. Standard Web Bot Auth i mechanizmy pay per crawl zapowiadają świat, w którym dostęp AI do treści da się wyceniać i sprzedawać. Dla dużych wydawców to szansa na nowy strumień przychodu, dla mniejszych serwisów raczej kolejna decyzja do podjęcia: udostępniać treść za darmo dla widoczności w odpowiedziach, czy stawiać bramkę. Nie ma tu jednej dobrej odpowiedzi, ale od czerwca 2026 roku jest to wreszcie decyzja, którą technicznie można wyegzekwować.

Praktyczne kroki na najbliższy kwartał

Jak przełożyć te dane na konkretne działania? Zacznij od audytu logów serwera za ostatnie 30 dni i policz, jaki udział w żądaniach mają GPTBot, ClaudeBot, PerplexityBot oraz Google-Extended. Jeśli któryś z botów treningowych generuje wysoki wolumen przy zerowym zwrocie, masz twardy argument za regułą w pliku robots.txt lub za regułą na poziomie zapory aplikacyjnej. Pamiętaj jednak, że blokada bota treningowego to nie to samo co blokada bota wyszukiwawczego: odcinając ten drugi, znikasz z odpowiedzi AI, więc decyzje podejmuj per agent, a nie hurtowo.

Drugi krok to weryfikacja, czy twoje najważniejsze podstrony są w ogóle zbudowane pod cytowanie. Sprawdź, czy kluczowe odpowiedzi padają wysoko w treści, czy definicje są jednoznaczne, a dane ujęte w listy i tabele, które model łatwo wyodrębni. Trzeci krok to pomiar: ustaw raportowanie wzmianek i cytowań marki w odpowiedziach AI, by widzieć nie tylko ruch z kliknięć, lecz także samą obecność w generowanych odpowiedziach. W świecie, w którym ponad połowa crawlowania nie odsyła nikogo, obecność w odpowiedzi bywa jedyną walutą widoczności, jaka ci zostaje.

Czwarty krok dotyczy mierzenia samej metodologii. Liczby Cloudflare odnoszą się do zweryfikowanego ruchu botów i do nagłówków referrer, które nie zawsze są przekazywane przez natywne aplikacje. Traktuj je więc jako rzetelny kierunek trendu, a nie jako idealnie dokładny licznik. Im więcej platform wdroży podpisy Web Bot Auth, tym wiarygodniejsze staną się te pomiary, bo anonimowy ruch będzie coraz trudniej pomylić ze zweryfikowanym agentem.

Reakcje branży

W środowisku SEO dane Cloudflare wywołały dyskusję o końcu darmowego obiegu treści. Część praktyków odczytuje rosnący crawl-to-refer jako dowód, że modele AI pasożytują na pracy wydawców, pobierając ogromne wolumeny stron i oddając śladowy ruch. Inni studzą emocje, przypominając, że referrer z natywnych aplikacji bywa pomijany, więc realne odesłania mogą być wyższe, niż pokazują surowe liczby.

Zgoda panuje natomiast co do kierunku. Weryfikacja agentów oparta na podpisach kryptograficznych jest postrzegana jako krok dojrzewania ekosystemu: zamiast wojny na blokady i obejścia, branża dostaje wspólny język, w którym bot przedstawia się tożsamością, a wydawca świadomie decyduje o dostępie. Operatorzy dużych serwisów już zapowiadają testy selektywnego wpuszczania zweryfikowanych agentów wyszukiwania przy jednoczesnym odcinaniu botów treningowych.

Z perspektywy polskiego rynku obraz jest podobny, choć z opóźnieniem. Rodzime serwisy contentowe i e-commerce dopiero zaczynają analizować, ile ich pasma pochłaniają boty AI, a narzędzia do weryfikacji agentów wchodzą głównie przez globalnych dostawców CDN. Eksperci podkreślają, że dla mniejszych wydawców kluczowa będzie nie tyle sama blokada, ile świadoma polityka: które treści warto eksponować modelom, by budować rozpoznawalność marki w odpowiedziach AI, a które zamknąć, bo nie przynoszą ani ruchu, ani cytowań. Ta kalkulacja, jeszcze rok temu czysto teoretyczna, dziś staje się elementem strategii widoczności.

Co dalej

Najbliższe miesiące pokażą, jak szybko wydawcy zaczną realnie korzystać z nowych narzędzi. Kluczowe będą trzy rzeczy. Po pierwsze, adopcja Web Bot Auth poza Cloudflare: standard W3C ma sens dopiero wtedy, gdy podpisy weryfikuje cała infrastruktura, a nie jeden dostawca. Po drugie, reakcja dostawców modeli na bramki pay per crawl: czy zaczną płacić za dostęp do wartościowych źródeł, czy ograniczą crawlowanie tam, gdzie napotkają opłaty. Po trzecie, ewolucja samych odpowiedzi AI w stronę większej liczby klikalnych cytowań, co mogłoby częściowo odwrócić dramatyczne wskaźniki crawl-to-refer.

Dla zespołów SEO i AIO praktyczny plan na teraz jest prosty. Włącz monitoring botów AI w logach, zdecyduj o polityce dostępu dla crawlerów treningowych i wyszukiwawczych, a treść projektuj tak, by była łatwa do zacytowania w odpowiedzi, a nie tylko do pobrania. Świat, w którym maszyny czytają sieć częściej niż ludzie, już nadszedł. Wygrają w nim ci, którzy potrafią zamienić pobranie strony przez bota w realną widoczność marki.

Czy boty naprawdę generują już większość ruchu w sieci?

Tak. Według danych Cloudflare Radar upublicznionych 3 czerwca 2026 roku boty odpowiadają za 57,5% żądań HTML, a ludzie za 42,5%. To pierwszy raz w historii pomiarów, gdy ruch automatyczny przekroczył połowę całości.

Co oznacza wskaźnik crawl-to-refer?

To stosunek liczby stron pobranych przez bota do liczby odesłań ruchu przez daną platformę. Wartość 11122:1 dla ClaudeBota oznacza ponad 11 tysięcy pobranych stron na jedno odesłanie. Dla porównania klasyczny Google notował 4,9:1, czyli relację znacznie bardziej zbalansowaną.

Czym jest Web Bot Auth?

To specyfikacja W3C sfinalizowana w maju 2026 roku, która definiuje kryptograficzny sposób podpisywania żądań przez boty. Dzięki niej certyfikowani agenci AI, tacy jak ChatGPT Atlas, Claude w Chrome czy tryb agentowy Gemini, przedstawiają weryfikowalny token, a wydawca może świadomie zdecydować, kogo wpuszcza.

Jak przygotować stronę pod ruch botów AI?

Monitoruj logi serwera pod kątem GPTBota, ClaudeBota i PerplexityBota, ustal politykę dostępu osobno dla botów treningowych i wyszukiwawczych, a treść projektuj tak, by była łatwa do zacytowania: klarowna struktura, jednoznaczne definicje, wyraźni autorzy oraz konkretne dane i przykłady.

Czy crawlowanie przez AI przekłada się na ruch?

W większości nie. Z danych Cloudflare wynika, że 51,8% crawlowania AI służy trenowaniu modeli i nie ma mechanizmu odsyłania, 35,7% to cel mieszany, a tylko 9,3% to crawlowanie wyszukiwawcze, które realnie może prowadzić do cytowania i kliknięcia.