Indexácia stránok je základným predpokladom pre úspech v SEO. Ak vyhľadávač nevie o URL z vášho webu, nemôže ich zobraziť v rámci výsledkov vyhľadávania. Často sa tiež stáva, že vyhľadávače niektoré stránky alebo určité segmenty webu z nejakého dôvodu jednoducho neindexujú.
URL, ktoré nie sú zaindexované môžete nájsť pomocou Miner Fulltext Index Checker, ktorý vám okrem iného pomôže odhaliť tiež príčinu, prečo nie je vaša stránka zaindexovaná.
Vyhľadávače totiž hromadnú kontrolu indexácie neumožňujú. Nástroje ako Google Search Console ukazujú iba základnú štatistiku počtu indexovaných URL, ale neposkytujú dáta konkrétnych URL a operátor site: neposkytuje 100 % spoľahlivé dáta.
Využitie v praxi
Miner kontroly indexácie stránok využijete v prípade:
- Ak začínate pracovať na novom projekte a pracujete na úvodnom SEO audite stránky. Jedným z hlavných krokov je zistiť, či sú potrebné stránky v poriadku zaindexované.
- Zaznamenali ste prepad pozícií, prípadne nižšiu alebo žiadnu návštevnosť z prirodzeného vyhľadávania na konkrétnu stránku a potrebujete zistiť, či stránka náhodou nevypadla z indexu vyhľadávača.
- Ak máte pochybnosti o stave indexácie svojho webu.
- Pokiaľ dôjde k zásadným výkyvom krivky indexácie napríklad v Google Search Console. Čím skôr sa vám podarí zistiť, ktoré URL sa prestali indexovať, tým skôr môžete odhaliť príčinu a zapracovať na jej odstránení.
Poďme ale pekne od základov.
Čo je Index vyhľadávačov
V prvom rade treba pochopiť čo je to Index vyhľadávača.
Vyhľadávače denne prechádzajú miliardy stránok rôznych webov a sťahujú si ich obsah. Avšak iba zlomok tohoto obsahu je pre nich dôležitý a využiteľný vo výsledkoch vyhľadávania.
Indexom sa na strane vyhľadávačov teda myslí databázu obsahu, ktorú si vyhľadávač uloží a používa ju vo výsledkoch vyhľadávania.
Môže byť už zaindexovaná stránka vyradená z indexu?
Áno, môže sa stať, že stránka, ktorá už bola raz zaindexovaná sa z nejakého dôvodu vyradí z indexu. Najčastejšie to spôsobujú tieto príčiny:
- Stránka začala vracať chybný stavový kód (40x) alebo serverovú chybu (50x) po dlhšiu dobu a crawler na to narazil pri viacerých prechádzaniach webu.
- Na stránku sa nasadila direktiva pre robotov noindex
- Vyhľadávač vyhodnotil, že danú stránku nepoužíva vo výsledkoch vyhľadávania a je na nej minimum alebo nezaujímavý obsah a preto stránku vyradil z indexu.
Pokiaľ narazíte na to, že niektorá z vašich stránok nie je zaindexovaná, odporúčam využiť miner na kontrolu indexovateľnosti, ktorý vám môže pomôcť odhaliť dôvod, prečo daná stránka nie je zaindexovaná vo vyhľadávači.
Kontrola indexácie URL vo vyhľadávači Seznam
Na kontrolu indexácie stránky na Sezname môžete použiť operátor info: a za ním URL adresu, ktorú chcete skontrolovať. Stačí teda do vyhľadávania na Sezname vpísať napríklad: info:https://www.marketingminer.com/cs
Pokiaľ sa daná stránka zobrazí vo výsledkoch vyhľadávania, znamená to, že je stránka na Sezname zaindexovaná.
Pokiaľ stránka nie je zaindexovaná, môžete využiť tento nástroj: https://search.seznam.cz/wt/pridej-stranku kde iba vložíte URL adresu a pošlete ju na zaindexovanie.
Pokiaľ SeznamBot vyhodnotí, že je stránka pre neho zaujímavá, tak ju zaindexuje a začne zobrazovať vo výsledkoch vyhľadávania na relevantné frázy.
Google Indexace
Najrýchlejší spôsob, akým sa dalo na Google skontrolovať či je konkrétna stránka zaindexovaná, bolo napísať do vyhľadávania operátor info: a za ním URL adresu webu, napríklad: info:https://www.marketingminer.com/cs/blog
Bohužiaľ koncom marca 2019 Google prestal podporovať operátor info: a preto už takýmto spôsobom nie je možné 100 % overiť indexáciu webu. Viac informácii k tejto problematike sme napísali v tomto článku: https://www.marketingminer.com/sk/blog/google-podpora-operatoru-info.html
Ručná kontrola indexácie stránok v GSC
Pokiaľ teda chcete ručne skontrolovať indexáciu menšieho množstva stránok, môžete využiť URL Inspection tool v Google Search Console.
Stačí vložiť URL, ktorú chcete skontrolovať a pokiaľ sa jedná o web, ku ktorému máte overené vlastníctvo v GSC, tak vám zobrazí detailné informácie o jej indexácii:
Čo ale v prípade, keď máte tisícky vstupných stránok a chcete skontrolovať hromadne ich indexáciu? Tak presne s týmto vám pomôže miner Fulltext Index Checker.
Ako hromadne skontrolovať indexáciu webu
Po prihlásení sa do Marketing Mineru kliknite vpravo hore na tlačidlo Vytvoriť report. Budeme kontrolovať indexáciu stránok, preto ako vstup zvolíme URL.
Následne do schránky napíšete alebo skopírujete zoznam URL, pri ktorých potrebujete zistiť, či sú v poriadku zaindexované alebo nie.
Aby bol váš report jednoducho identifikovateľný, je dobré ho pomenovať. Stačí kliknúť na pole Názov reportu.
Následne stačí kliknutím na vlajku vybrať krajinu, pre ktorú chcete získať dáta. Po kliknutí na Ďalší krok sa dostávate na voľbu Minera.
Voľba Minera a získanie dát
V sekcii výberu minerov zvoľte Miner Fulltext Index Checker. Tento Miner sa pomocou operátoru info: spytuje vyhľadávača na vložené URL. Vďaka tomuto overuje, či je URL zaindexovaná a či vyhľadávač na výstupe vracia rovnakú URL, ako bola vložená.
Niektoré vyhľadávače už ale operátor info: nepodporujú (napríklad Google) a preto Marketing Miner používa vlastnú sadu krokov, ktorými zisťuje, či je daná URL indexovaná alebo nie.
Nič ďalšie nie je potrebné nastavovať. Pokračujte kliknutím na tlačídlo Získať dáta. Po dokončení reportu vám prídu spracované dáta na e-mail.
Ukážka výstupu
Popis stĺpcov
Detekcia, či je URL vyhľadávačom indexovaná. Vracia buď TRUE (indexovaná) alebo FALSE (nie je indexovaná)
- Input: URL, ku ktorej sa získavali dáta.
- Indexed by Google: Detekcia, či je URL vyhľadávačom indexovaná. Vracia buď yes (indexovaná) alebo canonicalized or not indexed (URL buď nie je zaindexovaná alebo vyhľadávač používa jej kanonickú verziu).
- URL in results: Informácia o tom, aká URL pri zadaní operátora info: bola vyhľadávačom vrátená.
- Same as input: Porovnanie, či je URL na výstupe vyhľadávača rovnaká, ako na vstupe. Môže slúžiť na identifikáciu kanonizácie.
Analýza výstupu
Kontrola neindexovaných stránok
Vo výstupe by vás mali zaujímať primárne stĺpce Indexed by, ktoré indikujú, či je daná URL indexovaná vo vyhľadávači (príznak TRUE / FALSE). Správny postup je vyfiltrovať si zoznam neindexovaných stránok a na nich zisťovať, prečo sa v indexe vyhľadávačov neobjavujú a ako by sa takáto situácia dala zmeniť.
Kontrola kanonizácie
Môžu nastať špeciálne prípady, kedy sa na výstupe, za použitia operátora link:, objaví iná URL, než bola vložená. Ide o príznak toho, že vyhľadávač o danej URL vie, ale vo výsledkoch vyhľadávania používa nejakú jej kanonickú URL. Na detekciu týchto URL slúži stĺpec Same as input, ktorý vracia buď TRUE v prípade, že je URL na výstupe zhodná s vloženou URL alebo FALSE, ak to tak nie je.