13 lutego 2015 WordpressManiac

Jak zapobiec indeksowaniu podstron przez Google

Jeśli nie chcesz, aby Google indeksował Twoje podstrony, możesz temu zapobiec i to w bardzo prosty sposób. Wystarczy, że skorzystasz z pliku robots.txt. Od czego zacząć i w jaki sposób powinieneś to zrobić? Poniżej kilka praktycznych rad i wskazówek.

Czym jest plik robots.txt?

Jeśli nie wicie, robots.txt to plik, który umieszczany jest w głównym katalogu witryny i który wskazuje te części witryny, które nie będą widoczne dla robotów przeglądarek. Pliku o którym mówimy, używamy tylko w sytuacji, kiedy chcemy zablokować indeksowanie przez różne przeglądarki i Google.

Zanim zastosujecie

Ta metoda blokowania dostępu wiąże się z pewnym ryzykiem. Jakim? Każdy robot inaczej interpretuje składnię. Dlatego warto użyć odpowiedniej składni, tak, aby każdy z nich mógł swobodnie rozpoznać polecenia. Co jeszcze? Polecenia w pliku robots.txt nie zawsze mogą zapobiec przekierowaniom z innych witryn. Oznacza to, że niedozwolone adresy URL znalezione w innym miejscu sieci będą zaindeksowane.

Jak zapisać plik robots.txt?

Jeśli chcecie, aby cała witryna nie był indeksowana, w pliku robots.txt w pozycji User-agent wpiszcie * (gwiazdkę), a w pozycji Disallow / (ukośnik).

Możliwe jest również podawanie dyrektyw w znacznikach HTML, tzw. znaczników meta. Wygląda to tak:

<meta name= „robots” content=X>, gdzie X to:

  1. Noindex – nie indeksuj strony
  2. Nofollow – nie podążaj za linkami na stronie

Fot. http://www.shoutmeloud.com/

Jak możemy Ci pomóc?

Napisz lub zadzwoń do nas. Łukasz odpowiada szybciej niż myślisz ;)

x