canonical标签优化:规范标签的使用 - 阿伟的SEO博客

/ 0评 / 1

一个网页可能可以通过多个网址访问,这种情况下谷歌如何确定哪个网址可以作为首选网址?如何分析并解决多个网址的带来的重复内容问题?

这时候就需要用到canonical标签了,谷歌、微软和雅虎于2009年联合创建了canonical的标签,它的诞生就是为站长们解决重复内容的问题,而本文也就是要探讨canonical标签的使用。以下是正文:

什么是canonical标签

canonical标签是Html网页代码head部分的一个标签,是一种告诉搜索引擎特定网页的首选版本的方式。如果没有canonical标签,谷歌将基于各种原因做出判断选择其中一个网页作为规范网页,当然即使你有设置canonical标签,谷歌还是有可能选择其他网页作为规范网页(反正我是老大我说了算)。

具体代码如下:

<link rel="canonical" href="https://example.com/product-a/" />

rel="canonical"即表明此标签中的链接就是网页的首选版本,也就是href="https://example.com/product-a/"。

使用canonical标签的好处

1、解决重复内容问题

不管是出于seo操作还是网站用户使用,有很多原因都会导致重复页面的问题,或者非常相似的页面可以用不同的网址打开。而canonical标签的使用起到了整合重复内容的作用,可以帮助谷歌选择网页的首选网址,避免因重复内容问题可能带来的惩罚。

2、巩固和提升网页权重

使用canonical标签对重复内容进行了整合,避免了权重在不同链接间的分散,将权重集中在规范网页,也有利于网页的收录和排名提升。

3、优化抓取预算

过多的重复内容会影响网站的抓取预算,当然如果你网站的页面量在几千以内,是不需要考虑抓取预算问题。但如果你是页面数量级很大的大型站点,就需要考虑抓取预算问题了。

canonical标签的使用会让谷歌爬虫有更多的抓取预算去发现和抓取其他重要的页面,而不是在重复页面里循环。

如何使用canonical标签

关于canonical标签的详细使用可以参考谷歌官方指南:https://developers.google.com/search/docs/advanced/crawling/consolidate-duplicate-urls

具体来讲,方法一般有以下三种:

1、在所有重复网页的head部分代码里添加canonical标签

即<link rel="canonical" href="https://example.com/">

如果使用的是WordPress后台,可以通过如Yoast SEO这样的插件来实现。

2、在网页的http标头添加canonical标签

由于网页head部分添加canonical标签仅适用于html页面,而非html文档的规范标签需要通过http标头的标记来实现。即:

Link: <https://www.example.com/example-a.pdf>; rel="canonical"

3、在站点地图中添加canonical标签

谷歌默认在站点地图中的链接就是规范链接,即使如此,谷歌也不一定选择站点地图中的链接作为规范。

因为在这种情况下,谷歌仍需要为站点地图中声明的规范网页确定关联的重复网页,并且该方法不如第一种方法向谷歌进行声明的信号强,所以更推荐第一种方法。

使用canonical标签的注意事项

1、canonical标签与noindex标签的比较

noindex标签是一个指令,谷歌必须遵守指令并删除出现在搜索结果中的网页;而canonical标签只是一个提示,向谷歌提出关于规范网页版本的建议。

所以如果你非常不想要谷歌收录某页面,就使用noindex标签,而更多时候,选择canonical标签就足够了。

2、canonical标签与301重定向的比较

使用301重定向,将不规范网页转向规范网页,也起到了添加canonical标签的作用,某种程度上是谷歌更推荐的做法,但前提是这些重复网页已经弃用。

3、检查工具

如果不知道添加的canonical标签有什么问题,可以使用一些工具进行检查,这里推荐插件:SEO Pro Extension。

它可以提供网页的多个基础SEO元素的审查,包括tdk标签、h标签、核心网页指标、图片alt属性等。

项目实践

在我接手项目组新站点之后,我发现最大的问题就是谷歌爬虫在抓取网页时陷入了某种无限循环,只抓取列表页中筛选项页面,而这种组合筛选造成了大量重复且无价值的页面。

解决这个问题的最佳选择是canonical标签,通过url优化,我将所有的多重筛选的canonical标签归到一级筛选,向谷歌表明一级筛选是首选版本。

另外多重筛选页造成了大量的0结果页面,也在这些页面添加了noindex标签,向谷歌表明这些页面不用收录了。

同时放开列表页翻页的nofollow设置,让谷歌更多地抓取详情页以及一级筛选页。

目前网站的抓取已经回到了正轨,但可能是新站的缘故,整体抓取量还是偏低,不过这是另一个问题了。

以上

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注