Mikä on noindex-tagi ja milloin sitä käytetään?

Noindex-tagi on HTML-metatietotunniste, joka kertoo hakukoneille, että tiettyä sivua ei pidä indeksoida. Kun Googlebot kohtaa noindex-tagin, se jättää sivun hakukoneen tietokannasta pois, eikä sivu näy hakutuloksissa. Se lisätään sivun <head>-osioon näin:

<meta name="robots" content="noindex">

Noindex voidaan asettaa myös HTTP-otsakkeen kautta, mikä on hyödyllinen esimerkiksi PDF-tiedostoille tai muille ei-HTML-resursseille:

X-Robots-Tag: noindex

Milloin noindex-tagia kannattaa käyttää?

Noindex on hyödyllinen työkalu, kun sivustollasi on sivuja, jotka täytyy teknisesti pitää toiminnassa mutta joita ei haluta hakutuloksiin. Tyypillisiä käyttötapauksia ovat:

  • Kirjautumis- ja rekisteröintisivut: Käyttäjien henkilökohtaiset sivut, tilin hallintasivut ja ostoskorisivut eivät kuulu hakutuloksiin
  • Sisäisen haun tulossivut: Sivuston oma hakutoiminto luo usein tuhansia URL-osoitteita, joilla ei ole itsenäistä hakuarvo
  • Kiitos-sivut: Lomakkeen täyttämisen jälkeen näkyvät kiitos-sivut eivät hyödy indeksoinnista
  • Tagisivut ja arkistosivut: WordPressin automaattisesti luomat tag- ja päivämääräarkistosivut ovat usein ohuita ja kannattaa poistaa indeksoinnista
  • Testisivut ja luonnostilassa olevat sivut: Sivut, joita ei ole vielä valmiita julkaistavaksi
  • Pagination-sivut: Joissakin tapauksissa blogin tai tuotelistauksen sivu 2, 3 ja eteenpäin kannattaa poistaa indeksoinnista, joskin tämä on tapauskohtaista

Noindex vs. robots.txt: mikä ero?

Noindex ja robots.txt tekevät eri asioita, ja niitä käytetään eri tilanteissa. Tämä on yksi teknisen SEO:n yleisimmistä väärinymmärryksistä.

robots.txt estää crawlauksen mutta ei indeksointia. Jos sivulle osoittaa ulkoisia linkkejä, Google voi silti indeksoida sen, vaikka robots.txt estäisi crawlauksen. Google näkee URL-osoitteen linkkien kautta mutta ei pysty lukemaan sivun sisältöä.

Noindex estää indeksoinnin mutta ei crawlausta. Googlebot vierailee sivulla, lukee noindex-tagin ja jättää sivun pois indeksistaan. Tämä on oikea tapa estää sivun näkyminen hakutuloksissa.

Kriittinen virhe on asettaa noindex-tagi sivulle ja samalla estää sen crawlaus robots.txt:llä. Jos Googlebot ei pääse sivulle, se ei pysty lukemaan noindex-tagia, ja sivu saattaa silti päätyä indeksiin ulkoisten linkkien kautta.

Noindex WordPressissä

WordPressissä noindex-tagi asetetaan helpoiten SEO-lisäosan kautta. Yoast SEO:ssa voit asettaa yksittäisen sivun noindexiksi sivueditorin SEO-välilehdeltä kohdasta “Hakurobotin asetukset”. Rank Mathissa vastaava asetus löytyy “Advanced”-välilehdeltä.

Voit myös asettaa kokonaisia sisältötyyppejä noindexiksi lisäosan yleisistä asetuksista. Esimerkiksi kaikki tagisivut tai tekijäsivut voidaan poistaa indeksoinnista kerralla ilman, että jokaista sivua tarvitsee käsitellä erikseen.

Varoita: noindex tärkeällä sivulla on kriittinen virhe

Noindex väärässä paikassa voi tuhota sivuston hakukonenäkyvyyden nopeasti. Tämä tapahtuu yllättävän usein sivustouudistuksen tai teeman vaihdon yhteydessä, kun jokin asetus nollautuu tai siirtyy väärin. Tarkista aina uudistuksen jälkeen, ettei tärkeillä sivuilla ole vahingossa noindex-tagia.

Screaming Frog löytää kaikki noindex-sivut automaattisesti crawlauksen aikana. Google Search Consolessa voit tarkistaa indeksointiraportin, joka näyttää, mitkä sivut on suljettu indeksoinnin ulkopuolelle ja miksi.

Noindex-tagi lyhyesti

Noindex-tagi estää sivun näkymisen hakutuloksissa kertomalla Googlelle, ettei sivua pidä indeksoida. Se eroaa robots.txt:stä siten, että noindex estää indeksoinnin, ei crawlausta. Käytä noindexia sivuille, jotka täytyy pitää toiminnassa mutta jotka eivät kuulu hakutuloksiin, ja tarkista säännöllisesti, ettei tärkeillä sivuilla ole vahingossa noindex-tagia.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

0