it-swarm.dev

Zabránit indexování stránek vyhledávačů 2, 3 a více?

Víte, jak zabránit indexování stránek za domovskou stránkou ve WP? Chci říct, že nechci mysite.com/page/2, mysite.com/page/3 být indexován.

Je to proto, že používám home.php pro své téma, takže page/2, page/3 jsou všechny stejné.

Prosím, dejte mi prosím nápovědu nebo fragment kódu, nechci přidat další plugin (meta roboty).

1
RichZenMaster

Jak přesně nastavujete domovskou stránku? Myslím, že problém spočívá v tom, že má nežádoucí stránkování na prvním místě a ne že je stránkování indexováno.

Soubor robots.txt je obecně dobrý způsob, jak zabránit hromadnému indexování. Myslím, že by to bylo ve směrnici ve vašem případě (prosím, otestujte to tak, aby to neovlivňovalo stránkování na jiných místech):

User-agent: *
Disallow: /page/
4
Rarst

Pokud je to kvůli SEO a varování v konzole Vyhledávání Google, mohou být ignorovány. wp/Page2 a tak dále by měly být stále indexovány. Tato odpověď a článek s odpovědí od společnosti Google:

SEO se na chvíli domnívali, že by bylo vhodné přidat metaznačku noindex roboty na stránku 2 a další stránkovaný archiv. To by zabránilo lidem, aby ve výsledcích vyhledávání našli stránku 2 a další. Myšlenka byla, že vyhledávač by stále sledoval všechny tyto odkazy, takže všechny propojené stránky budou stále správně indexovány.

Problém je v tom, že na konci loňského roku Google řekl něco, co nás zaujalo: dlouhodobý noindex na stránce povede k tomu, že nebudou následovat odkazy na této stránce. Díky tomu je přidávání noindexu na stránku 2 a další stránkovaných archivů špatný nápad, protože by to mohlo vést k tomu, že vaše články nebudou dostávat interní odkazy, které potřebují.

Vzhledem k tomu, co Google řekl o dlouhodobé noindex, v Yoast SEO v6.3 jsme odstranili možnost přidat noindex na podstránky archivů. Pokud má stránka 2 a další archiv mít kanonický odkaz na stránku 1, nebo na sebe? Myšlenka spočívala v tom, že chcete, aby návštěvníci většinou skončili na stránce 1 archivu. Tato stránka je pro většinu uživatelů obvykle nejrelevantnější.

Google je nyní velmi jasný: každá stránka v rámci stránkované série by měla kanonikovat sama pro sebe, takže/strana/2/má kanonický odkaz na stránku/2/2 /. Z tohoto důvodu vidíte indexované stránkované archivy.

Chcete-li se o tom dozvědět více, můžete se podívat na tento článek - https://yoast.com/pagination-seo-best-practices/

1
Axel Metayer

Pokud se snažíte zabránit duplicitnímu obsahu, měli byste se podívat na kořen problému. Uvádíte, že vaše domovská stránka používá šablonu home.php, obsahuje nějaký statický text, který předáváte na všechny ostatní stránky pomocí domácí šablony? Pokud se jedná o tento případ, buď jej odeberte, nebo vytvořte jedinečnou domovskou šablonu, která by měla být poctivě home.php.

pokud z nějakého důvodu chcete zachovat stránky, které zobrazují stejný obsah jako domovská stránka, ale pomocí jiné adresy URL, můžete se vždy uchýlit ke kanonickým.

Pokud nahradíte obsah vašeho souboru header.php následujícím, můžete určit různé záhlaví, z nichž jeden bude obsahovat kanonické a ty, které budou použity.

<?php
if (is_page('1')){
    <?php include(TEMPLATEPATH.'/header1.php'); ?>
}
elseif (is_page('2')){
    <?php include(TEMPLATEPATH.'/header2.php'); ?>
}
else {
    <?php include(TEMPLATEPATH.'/headerdefault.php'); ?>
}
?>

A než se ujistíte, že máte kanonický odkaz, který odkazuje na vaši domovskou stránku

<link rel="canonical" href="http://www.yourdomain.com/" />

To řekne společnosti Google, jaká je vhodná adresa URL obsahu, který prohlíží, aniž by se uchýlil k použití modulu Plugin.

Ať tak či onak to všechno vypadá trochu divné a obávám se, že jsem jen nepochopil vaši žádost, protože to zřejmě nedává smysl. Jste si vědom toho, jak funguje duplicitní obsah? Nebo jsem to já, kdo by měl jít zpátky do postele.

Nevidím účel záměrně vytvářet nové stránky, které obsahují stejný obsah a než hledat řešení, které by zabránilo duplicitnímu obsahu.

0
Roswell Balentien

Myslím, že meta tagy robotů jsou to, co je potřeba upravit. Chcete, aby pavouci šli na stránku 2 a sledovali odkazy na vaše články, ale nechcete, aby tato stránka skutečně indexovala (protože se změní). Ve vašem souboru header.php najděte metaznačku „roboty“ a změňte ji na následující:

<meta name="robots" content="follow, <?php echo (get_query_var('paged')==1)?'index':'noindex'?>" />

Použití deky robots.txt bohužel způsobí, že pavouk nebude následovat odkazy a nenajde články, které jsou na jiných stránkách.

0
user2810