Amikor behatóbban kezdünk el foglalkozni a SEO-val, akkor előbb, vagy utóbb szembekerülünk a duplikált tartalom problémájával. Ez a probléma korántsem új keletű, már elég régóta jelen van, amiből az következik, hogy számos módszert ismerünk a duplikálás megoldására. Az alábbiakban ezek közül ismertetünk párat.
Blokkolás a Robots.txt használatával
- Ez a legrégebbi, és a legszélesebb körben alkalmazott módszer. A lényege az, hogy a robot.txt blokkolja az adott domaint, vagy oldalt, ezért a Google keresőrobotja nem lesz képes azt felkeresni és indexelni. Ennek a megoldásnak az a hátránya, hogy ha valaki hivatkozik az oldalunkra, akkor a Google azt sem fogja tudni követni, így optimalizálás szempontjából nem ez az ideális módszer, viszont bátran használhatjuk, ha egyszerűen csak blokkolni szeretnénk az adott tartalmat, attól függetlenül, hogy az duplikált-e, vagy sem.
Meta Robots Noindex/Follow tag
- <meta name=”robots” content=”noindex,follow” />
- Ezzel a taggel (noindex) el tudjuk érni, hogy a keresőmotor ne indexelje az oldalt, ami pedig lehetővé teszi a duplikálás elkerülését. A follow érték viszont azt közli a keresőmotorral, hogy kövesse az oldalon elhelyezett linkeket. Ez a megoldás a blogok esetében alkalmazható a leghatékonyabban, mivel itt az elsődleges tartalom, amit indexelni kell, az maga a blog, a másodpéldány pedig az archivált tartalom, ami ugyan régebbi tartalom, viszont hasznos lehet, ha meg tud jelenni a keresőkben.
Redirect 301
- A legtöbb esetben az lehet az optimális megoldás a duplikált tartalom ellen, ha a Redirect 301 segítségével átirányítjuk a keresőt a duplikált oldalról az eredeti oldalra. Amikor egyetlen oldalba olvasztjuk azokat az oldalakat, amik potenciálisan jó page rankkel rendelkeznek, akkor ezek nem fognak többé egymással versenyezni, hanem megnövelik a relevanciát, ezt pedig pozitív hatással lesz a SEO-ra. A Redirect 301-et olyan esetekben érdemes alkalmazni, amikor az átirányítás nem befolyásolja negatívan a felhasználói élményt. Ilyen esetek például az IP cím, az index fájl, www, vagy www nélküli tartalom átirányítása.
Canonical tag
- Egy másik módszer a duplikált tartalom kezelésére a rel=canonical tag használata. A rel=canonical taggel ugyanakkora page rankre tehetünk szert, mint a Redirect 301-el, viszont ezt egyszerűbb alkalmazni.
A tag a honlap HTML fejlécének a részét képezi, és így nézhet ki:
<link href=”hxxp://www.pelda.hu/aloldal/” rel=”canonical” /> - Ez a tag közli a keresőmotorokkal, hogy az adott oldalt úgy kezeljék, mintha a www.pelda.hu/aloldal URL másolata lenne és minden link és tartalom, ami a másolaton található, valójában az eredeti oldalhoz tartozik. Olyan honlapok esetében lehet hasznos, amelyek több kategóriát és alkategóriát különböztetnek meg, és eltér a kategóriák elérési útja, de a tartalom azonos.
Alternate link tag
- Ez a megoldás sok ponton hasonlít a Canonical tag-re, viszont ennek az alkalmazása a nemzetközi, vagy többnyelvű SEO-ban jellemző.
- <link rel=”alternate” hreflang=”en” href=”hxxp://www.pelda.com/valami” />
- <link rel=”alternate” hreflang=”en” href=”hxxp://www.pelda.co.uk/valami” />
- <link rel=”alternate” hreflang=”en” href=”hxxp://www.pelda.de/valami” />
- Az alternate tag segít a Google-nek, hogy minél könnyebben be tudja azonosítani az adott országnak megfelelő tartalmat. Ennek a tag-nek az a hátránya, hogy előfordulhat, hogy a Google duplikált tartalomként fogja kezelni néhány oldalunkat. Olyan oldalak esetén vehető igénybe, amelyeknek egynél több ország a célcsoportja.
Google Webmestereszközök
- A Google Webmestereszközök lehetővé teszik, hogy beállítsuk a honlapunk által preferált domaint, és azt is, hogy differenciáltan tudjuk kezelni a különböző URL paramétereket. Ennek a módszernek az a legnagyobb hátránya, hogy kizárólag a Google keresőmotorja estében működik. A Bingre, vagy más keresőmotorokra semmilyen hatást nem fognak gyakorolni az itt végrehajtott beállítások.
Fontos megjegyezni, hogy a fentiekben ismertetett megoldásokat nemcsak duplikált tartalom esetén lehet alkalmazni, hanem általánosságban is. Amennyiben van olyan aloldala a honlapunknak, amit nem szeretnénk, ha indexelnének a keresőmotorok, akkor érdemes megtenni a megfelelő lépéseket, különben előfordulhat, hogy a kereső 404-es hibaként kezeli az adott oldalt.