Wat te doen met Google Search Console meldingen over niet geïndexeerde pagina’s?
Regelmatig krijg ik vragen over het Google Search Console rapport waarin niet geïndexeerde pagina’s worden vermeld. Het gebeurt de laatste tijd zo vaak, dat ik besloot om een blog te wijden aan pagina-indexering in Google Search Console.
Mail van Google Search Console over niet geïndexeerde pagina’s
Wanneer je bij het online zetten van de website deze door Google Search Console liet indexeren en je nieuwe pagina’s handmatig liet indexeren, is er over het algemeen geen reden tot paniek wanneer je een mailtje krijgt van Google Search Console met als titel Nieuwe redenen voorkomen dat pagina’s worden geïndexeerd op de site gevolgd door de naam van de website. Gelukkig geeft Google Search Console ook de reden van de niet geïndexeerde pagina’s op.
Meer lezen over het doorgeven van de sitemap en het handmatig laten indexeren van losse pagina’s
Klik op de reden waarom de pagina niet geïndexeerd kan worden
Wanneer je op de reden klikt waarom de pagina niet geïndexeerd kan worden, zie je om welke pagina’s het gaat. Wanneer je begrijpt waarom een pagina niet geïndexeerd worden, kun je controleren of het niet indexeren van de pagina terecht of onterecht is.
Wanneer het terecht is, hoef je niets te doen. Je kunt jammergenoeg niet aangeven in Google Search Console dat het ok is. Wanneer het onterecht is, kun je alsnog indexering van de betreffende pagina aanvragen.
De verschillende redenen waarom Google Search Console een pagina niet kan indexeren
Pagina met omleiding
Google heeft gezien dat er op jouw website een omgeleide pagina staat. Over het algemeen heb je dit bewust gedaan. Wellicht veranderde je vanwege SEO de url van een pagina en stelde je een 301 redirect in. De omgeleide pagina hoeft vanzelfsprekend niet meer geïndexeerd te worden en dus is het volkomen normaal dat deze omgeleide pagina in dit overzicht staat.
Uitgesloten door tag noindex
Je kunt zelf aangeven dat je bepaalde pagina’s niet geïndexeerd wilt hebben. Dit zijn pagina’s die je niet in zoekresultaten van Google getoond wilt hebben. Zo heb ik de volgende pagina’s niet laten indexeren:
- bedankpagina’s wanneer iemand een formulier instuurt of een review schrijft
- mijn online handleidingen die mijn klanten krijgen en waarmee zij zelf hun website up-to-date kunnen houden
- mijn online werkboeken, ook al zijn deze alleen toegankelijk via inloggen op de website
- mijn Google Analytics tutorial, ook al is deze alleen toegankelijk via inloggen op de website
Alternatieve pagina met correcte canonieke tag
Google heeft een pagina op jouw website geïdentificeerd die als een alternatieve versie van een andere pagina, en waarbij de canonieke tag correct is ingesteld. Die canonieke tag is overigens een HTML-element dat wordt gebruikt om zoekmachines te informeren welke versie van een pagina de voorkeursversie, ofwel de canonieke versie, is. Dit gebeurt wanneer er meerdere versies van dezelfde pagina zijn. Dit kan bijvoorbeeld gebeuren bij duplicate content of bij het tonen van dezelfde inhoud op verschillende URL’s.
Door de canonieke tag te gebruiken, kun je voorkomen dat zoekmachines deze pagina’s als afzonderlijke en unieke inhoud behandelen, wat kan leiden tot problemen met de posities in de zoekmachines.
Dit is dus ook weer iets wat bewust gedaan zou moeten zijn en waar je je dus geen zorgen over hoeft te maken. Tenzij je dit niet bewust hebt gedaan, dan zul je op onderzoek moeten uitgaan.
Niet gevonden (404)
Kijk hier naar de pagina’s die in dit overzicht staan. Zijn het pagina’s die zouden moeten bestaan? Check dan waarom deze volgens Google niet bestaan. Is het een pagina die niet meer bestaat, maar die nog wel een tijdje voor Google blijft bestaan, plaats dan een 301 redirect.
Geblokkeerd vanwege verboden toegang (403)
Google kan de pagina niet indexeren, omdat er een toegangsbeperking opzit. Waarschijnlijk is ook dit bewust en kun je de mededeling negeren. Wanneer de pagina wel geïndexeerd hoort te zijn, kan de oorzaak een fout in het .htaccess bestand zijn. Dit zul je wel moeten (laten) oplossen.
Geblokkeerd door robots.txt
Via een robots.txt bestand kun je aangeven dat bepaalde pagina’s van een website niet door zoekmachines geïndexeerd moeten worden. De betreffende pagina’s worden bij deze foutmelding getoond en worden dus bewust niet geïndexeerd.
Wanneer in dit overzicht pagina’s staan die wel geïndexeerd moeten worden, zul je het robots.txt bestand moeten (laten) aanpassen.
Gecrawld – momenteel niet geïndexeerd
Ook hier staan vaak pagina’s die niet geïndexeerd hoeven te worden. Denk aan de /feed/ pagina’s (overzichtpagina’s van blog, van categorieën en van tags).
Wanneer er een pagina tussen staat die wel geïndexeerd zou moeten zijn, kun je dit handmatig laten doen.
Gevonden – momenteel niet geïndexeerd
Ik raad je aan om de pagina’s die bij deze melding vermeldt worden, te verbeteren. Het kan namelijk betekenen dat Google besloten heeft dat het crawlen van deze pagina je website zou overbelasten en het crawlen verplaatst heeft naar een later tijdstip. In dat geval kun je deze pagina’s handmatig aanmelden voor indexering.
Het kan ook betekenen dat je de kwaliteit van de inhoud op de pagina moet verbeteren. Het kan natuurlijk sowieso geen kwaad om eens in de zoveel tijd pagina’s en blogberichten te updaten. Vergeet dan niet om handmatig opnieuw indexatie aan te vragen. Zo ziet Google ook gelijk dat de informatie op de website actueel is, en dit kan helpen bij een betere positie in de zoekresultaten.
Conclusie
In Google Search Console krijg je duidelijk te zien wat de niet geïndexeerde pagina’s zijn en om welke reden deze niet geïndexeerd worden. Wat jammer is, is dat je niet kan aangeven dat iets helemaal geen probleem is. Sterker, dat je bijvoorbeeld bewust een bepaalde pagina niet laat indexeren. Hierdoor blijven de meldingen staan, terwijl er niets aan de hand is.
Mocht je naar aanleiding van dit blog toch nog vragen hebben, laat gerust een reactie achter of stuur me een mailtje. Ik help je graag!
Met regelmaat plaats ik blogs en korte Tips & tricks. Wil je mijn tips en blogs niet missen? Schrijf je dan in voor mijn nieuwsbrief.




0 reacties