什么是技术SEO?它有哪些内容有利搜索引擎(例如百度)
2020-11-06 11:09:16
技术SEO是优化您的网站以帮助搜索引擎(例如百度)查找,理解和索引页面的过程。
尽管像百度这样的现代搜索引擎相对擅长发现和理解内容,但还远非完美。技术问题可以很容易地阻止它们在搜索结果中进行爬网,建立索引和显示网页。
在这篇文章中,我们将介绍一些技术SEO最佳实践,无论技术水平如何,任何人都可以实施。
1.确保重要内容是“可抓取的”和“可索引的”
搜寻是搜寻引擎发现大多数新内容的方式。在这里,蜘蛛可以访问并从已知网页下载新数据。
例如,假设您将一个新页面添加到您的站点并从您的主页链接到该页面。当搜索引擎接下来抓取您的主页时,它将发现指向新页面的链接。然后,如果它确定该页面上的内容对搜索者来说很有价值,那么它将被索引。
只要您不阻止搜索引擎对页面进行爬网或编制索引,此过程就可以很好地进行。
Robots.txt是一个文件,它告诉百度之类的搜索引擎可以和不能抓取哪些页面。您可以通过导航到yourwebsite.com/robots.txt进行查看。
在上面的示例中,这两行简单的代码行阻止了搜索引擎抓取网站上的每个页面。因此,您可以看到此文件的气质如何,以及犯下代价高昂的错误有多容易。
您可以在百度站长工具中检查robots.txt阻止了哪些页面(如果有)。只需转到“抓取错误” 报告,切换以查看排除的URL,然后查找“被robots.txt阻止”错误。
如果其中有任何不应被阻止的URL,则需要删除或编辑robots.txt文件来解决此问题。
但是,可爬网页面并不总是可索引的。如果您的网页上的meta robots标记或xrobots标头设置为“ noindex”,则搜索引擎将无法为该页面编制索引。
通过删除应建立索引的任何页面的“ noindex”元标记或xrobots标记来解决这些问题。
进一步阅读
什么是robots.txt?如何正确使用?
关于搜索引擎快照常见问题汇总
2.使用HTTPS
HTTPS加密网站与其访问者之间发送的数据。它有助于保护敏感信息(如信用卡详细信息)不被泄露。
鉴于HTTPS对网络用户的好处, 自2014年以来它一直是排名因素,这不足为奇。
您如何知道您的站点是否使用HTTPS?
如果看到“不安全”警告,则说明您未使用HTTPS,并且需要安装TLS/SSL认证。您可以从LetsEncrypt免费获得。
有时我们也会遇到安装了TLS/SSL认证,但仍显示“不安全”警告。这时您就遇到了内容混合的问题。这意味着页面本身是装载了HTTPS,但它的加载资源文件(图片,CSS等)在HTTP。
有四种方法可以解决此问题:
为资源选择一个安全主机(如果有)。
在本地托管资源(如果法律允许的话)。
从您的网站中排除资源。
使用HTTP 内容安全策略(CSP)
但是,如果您在一个页面上遇到了混合内容问题,那么其他页面也很可能也会受到影响。要检查这种情况,请使用Ahrefs网站站长工具来抓取您的网站。它检查100多个预定义的SEO问题,包括HTTP/HTTPS混合内容。
推荐阅读:什么是SSL证书?对于SEO为什么重要?
3.解决重复的内容问题
重复内容是指相同或相似的内容出现在网络上的多个位置。它可以发生在一个网站或多个网站上。
尽管有很多人认为,但搜索引擎不会因网站内容重复而受到惩罚。他们已经证实了这一点。
但是重复的内容可能会导致其他问题,例如:
搜索结果中不良或不友好的网址;
反向链接稀释;
浪费了抓取预算;
联合发布的内容排名高于您。
您可以在Google Search Console中查看内容重复的页面。只需转到“覆盖率” 报告,切换以查看排除的URL,然后查找与重复项有关的问题。
但是,Search Console仅告诉您Google识别为重复的URL。Google可能还没有发现其他重复的内容问题。要找到这些内容,请使用Ahrefs网站管理员工具进行免费爬网, 然后检查“重复内容”报告。
通过在每组重复项中选择一个URL作为“规范”(主要)版本来解决问题。
进一步阅读
什么是内容重复?针对SEO该如何处理它?
什么是canonical标签?如何正确使用?
4.创建一个站点地图
站点地图列出了您网站上的所有重要内容。它们有多种格式,但是XML文件是最常见的。
如今,许多人都质疑站点地图的重要性,因为百度通常即使没有内容也可以找到您的大部分内容。但是,一位百度工程师确认了2020年站点地图的重要性,指出站点地图是百度URL的第二重要来源:
但是为什么呢?
原因之一是站点地图通常包含“孤立”页面。这些是百度无法通过抓取找到的页面,因为它们没有 您网站上可抓取页面的内部链接。
然后,您可以通过搜索引擎站长工具将其提交给搜索引擎。
值得注意的是,百度还将站点地图中的URL视为建议的规范。这可以帮助解决重复的内容问题(请参阅上一点),但是仍然是 在可能的情况下使用规范标签的最佳实践。
推荐阅读:2020年的网站地图对于SEO仍然重要吗?
5.将hreflang用于多语言内容
Hreflang是HTML属性,用于指定网页的语言和地理区域。它用于其他语言版本的网页或其他地理位置定位的网站。
这些多语言版本中的每一个都使用hreflang告知搜索引擎其语言和地理定位。
hreflang对于SEO非常重要的主要原因有两个:
它有助于消除重复的内容。假设您有两个相似的页面。如果没有hreflang,搜索引擎可能会将这些页面视为重复页面,并且仅将其中一个索引。
它可以帮助排名。 hreflang集群中的页面共享排名信号。这意味着,如果您的英文页面具有大量链接,则该页面的西班牙语版本会有效地共享这些信号。这可能有助于它在其他国家的搜索引擎中排名。
实施hreflang很容易。只需将适当的hreflang标记添加到页面的所有版本。
例如,如果您有英文,西班牙文和德文的首页版本,则可以将以下hreflang标记添加到所有这些页面中
推荐阅读:大多数多语言网站会犯的HREFLANG错误
6.将HTTP重定向到HTTPS
即使您使用的是HTTP,也可以使用HTTP版本的访问者访问您的网站。这不是理想的选择,因为如果访问者可以访问您网站的非安全版本,则没有HTTPS的意义。
要检查是否存在这种情况,请尝试导航到站点的HTTP版本。如果浏览器自动将您重定向,则可能没有问题。
如果能够访问HTTP版本,则需要将HTTP重定向到HTTPS。
您可以通过将以下代码添加到.htaccess文件中来做到这一点:
RewriteEngine On RewriteCond %{SERVER_PORT} 80 RewriteRule ^(.*)$ https://yourwebsite.com/$1 [R=301,L]
或者,如果您使用的是WordPress,只需在“设置”下将WordPress地址和站点地址更改为HTTPS版本。
只要确保在执行此操作时使用永久(301)重定向,而不是临时(302)重定向即可。
推荐阅读:何时使用301重定向以及如何正确执行的主要用例
7.修复孤立的页面
孤立页面没有网站上可爬网页面的内部链接。结果,搜索引擎无法找到它们或将它们编入索引(除非它们具有来自其他网站的反向链接)。
通常,使用大多数审核工具很难找到孤立的页面,因为它们像搜索引擎一样爬行您的网站。但是,如果您使用的是为您生成站点地图的CMS,则可以在Ahrefs的Site Audit中将其用作URL的来源。只需选中该选项即可在抓取设置中抓取自动检测到的站点地图和反向链接。
如果站点地图的位置不在robots.txt文件中,并且无法在yourwebsite.com/sitemap.xml上访问,则应在抓取设置中选中“特定站点地图”选项,然后粘贴到站点地图URL中(s)。
抓取完成后,请转到“链接”报告,并检查“孤立页面(没有传入的内部链接)”问题。
如果有任何重要的URL,则应将其合并到站点结构中。这可能意味着从导航栏或其他相关的可爬网页面添加内部链接。如果它们不重要,则可以删除,重定向或忽略它们。由你决定。
推荐阅读:如何使用内部链接以及避免什么?
8.确保您的页面快速加载
加载缓慢的页面使访问者感到烦恼。这就是搜索引擎将网页速度列为排名因素之一。
不幸的是,页面速度是一个复杂的话题。您可以使用许多工具和指标来衡量速度基准,但是Google的Pagespeed Insights是一个合理的起点。它为您在台式机和移动设备上的性能得分提供0-100之间的分数,并告诉您可以改进的地方。
但是,我们不关注单个领域,而是以最少的精力介绍一些可能对您的页面速度产生最大积极影响的事情。
切换到更快的DNS提供商。DNSPOD是一个不错的选择(免费)。只需注册一个免费帐户,然后将您的域名服务器与您的域名注册商交换即可。
安装一个缓存插件。CCaching临时存储文件,以便可以将文件更快,更有效地交付给访问者。如果您使用的是WordPress,则WP Rocket 和WP Super Cache 是两个不错的选择。
缩小HTML,CSS和JavaScript文件。缩小可从代码中删除空格和注释,以减小文件大小。您可以使用WP Rocket或Autoptimize做到这一点。
使用CDN。内容分发网络(CDN)将您的网页副本存储在全球的服务器上。然后,它将访问者连接到最近的服务器,以使请求的文件传播的距离更短。有很多CDN提供程序,但是Cloudflare是一个不错的选择。
压缩图像。图像通常是网页上最大的文件。压缩它们可以减小它们的大小,并确保它们花费尽可能少的时间来加载。有很多图像压缩插件,但我们喜欢Shortpixel。
推荐阅读:2020年网站速度优化全面指南
9.Nofollow内部链接
Nofollow链接通常用于标记出您不想认可的页面的出站链接。他们告诉搜索引擎不要将排名积分“传递给链接的页面”(尽管搜索引擎可能会选择忽略该建议)。
因此,不应将它们用于内部链接。但是,根据我们对前110,000个网站的研究,发现3.6%的内部链接是nofollow的。
许多网站所有者这样做是为了阻止页面索引,但是nofollow不能那样工作。在内部链接上使用nofollow只会造成危害,因为它可能会阻止爬网并导致孤立的内容。
分页是一个常见的问题。
要检查您的网站是否存在nofollow的内部链接,请在Ahrefs网站管理员工具中运行爬网,然后转到“链接”报告并查找相关问题。
解决此问题很容易。只需从受影响的链接中删除nofollow属性。
推荐阅读:什么是nofollow链接?它影响SEO优化吗?
总结
技术SEO是一项复杂的业务,在本文中我们没有足够的时间介绍更多SEO技巧。但是,以上建议应足以消除最常见的技术故障,并轻松将您网站的性能置于互联网的前10%。
尽管像百度这样的现代搜索引擎相对擅长发现和理解内容,但还远非完美。技术问题可以很容易地阻止它们在搜索结果中进行爬网,建立索引和显示网页。
在这篇文章中,我们将介绍一些技术SEO最佳实践,无论技术水平如何,任何人都可以实施。
1.确保重要内容是“可抓取的”和“可索引的”
搜寻是搜寻引擎发现大多数新内容的方式。在这里,蜘蛛可以访问并从已知网页下载新数据。
例如,假设您将一个新页面添加到您的站点并从您的主页链接到该页面。当搜索引擎接下来抓取您的主页时,它将发现指向新页面的链接。然后,如果它确定该页面上的内容对搜索者来说很有价值,那么它将被索引。
只要您不阻止搜索引擎对页面进行爬网或编制索引,此过程就可以很好地进行。
Robots.txt是一个文件,它告诉百度之类的搜索引擎可以和不能抓取哪些页面。您可以通过导航到yourwebsite.com/robots.txt进行查看。
在上面的示例中,这两行简单的代码行阻止了搜索引擎抓取网站上的每个页面。因此,您可以看到此文件的气质如何,以及犯下代价高昂的错误有多容易。
您可以在百度站长工具中检查robots.txt阻止了哪些页面(如果有)。只需转到“抓取错误” 报告,切换以查看排除的URL,然后查找“被robots.txt阻止”错误。
如果其中有任何不应被阻止的URL,则需要删除或编辑robots.txt文件来解决此问题。
但是,可爬网页面并不总是可索引的。如果您的网页上的meta robots标记或xrobots标头设置为“ noindex”,则搜索引擎将无法为该页面编制索引。
通过删除应建立索引的任何页面的“ noindex”元标记或xrobots标记来解决这些问题。
进一步阅读
什么是robots.txt?如何正确使用?
关于搜索引擎快照常见问题汇总
2.使用HTTPS
HTTPS加密网站与其访问者之间发送的数据。它有助于保护敏感信息(如信用卡详细信息)不被泄露。
鉴于HTTPS对网络用户的好处, 自2014年以来它一直是排名因素,这不足为奇。
您如何知道您的站点是否使用HTTPS?
如果看到“不安全”警告,则说明您未使用HTTPS,并且需要安装TLS/SSL认证。您可以从LetsEncrypt免费获得。
有时我们也会遇到安装了TLS/SSL认证,但仍显示“不安全”警告。这时您就遇到了内容混合的问题。这意味着页面本身是装载了HTTPS,但它的加载资源文件(图片,CSS等)在HTTP。
有四种方法可以解决此问题:
为资源选择一个安全主机(如果有)。
在本地托管资源(如果法律允许的话)。
从您的网站中排除资源。
使用HTTP 内容安全策略(CSP)
但是,如果您在一个页面上遇到了混合内容问题,那么其他页面也很可能也会受到影响。要检查这种情况,请使用Ahrefs网站站长工具来抓取您的网站。它检查100多个预定义的SEO问题,包括HTTP/HTTPS混合内容。
推荐阅读:什么是SSL证书?对于SEO为什么重要?
3.解决重复的内容问题
重复内容是指相同或相似的内容出现在网络上的多个位置。它可以发生在一个网站或多个网站上。
尽管有很多人认为,但搜索引擎不会因网站内容重复而受到惩罚。他们已经证实了这一点。
但是重复的内容可能会导致其他问题,例如:
搜索结果中不良或不友好的网址;
反向链接稀释;
浪费了抓取预算;
联合发布的内容排名高于您。
您可以在Google Search Console中查看内容重复的页面。只需转到“覆盖率” 报告,切换以查看排除的URL,然后查找与重复项有关的问题。
但是,Search Console仅告诉您Google识别为重复的URL。Google可能还没有发现其他重复的内容问题。要找到这些内容,请使用Ahrefs网站管理员工具进行免费爬网, 然后检查“重复内容”报告。
通过在每组重复项中选择一个URL作为“规范”(主要)版本来解决问题。
进一步阅读
什么是内容重复?针对SEO该如何处理它?
什么是canonical标签?如何正确使用?
4.创建一个站点地图
站点地图列出了您网站上的所有重要内容。它们有多种格式,但是XML文件是最常见的。
如今,许多人都质疑站点地图的重要性,因为百度通常即使没有内容也可以找到您的大部分内容。但是,一位百度工程师确认了2020年站点地图的重要性,指出站点地图是百度URL的第二重要来源:
但是为什么呢?
原因之一是站点地图通常包含“孤立”页面。这些是百度无法通过抓取找到的页面,因为它们没有 您网站上可抓取页面的内部链接。
然后,您可以通过搜索引擎站长工具将其提交给搜索引擎。
值得注意的是,百度还将站点地图中的URL视为建议的规范。这可以帮助解决重复的内容问题(请参阅上一点),但是仍然是 在可能的情况下使用规范标签的最佳实践。
推荐阅读:2020年的网站地图对于SEO仍然重要吗?
5.将hreflang用于多语言内容
Hreflang是HTML属性,用于指定网页的语言和地理区域。它用于其他语言版本的网页或其他地理位置定位的网站。
这些多语言版本中的每一个都使用hreflang告知搜索引擎其语言和地理定位。
hreflang对于SEO非常重要的主要原因有两个:
它有助于消除重复的内容。假设您有两个相似的页面。如果没有hreflang,搜索引擎可能会将这些页面视为重复页面,并且仅将其中一个索引。
它可以帮助排名。 hreflang集群中的页面共享排名信号。这意味着,如果您的英文页面具有大量链接,则该页面的西班牙语版本会有效地共享这些信号。这可能有助于它在其他国家的搜索引擎中排名。
实施hreflang很容易。只需将适当的hreflang标记添加到页面的所有版本。
例如,如果您有英文,西班牙文和德文的首页版本,则可以将以下hreflang标记添加到所有这些页面中
推荐阅读:大多数多语言网站会犯的HREFLANG错误
6.将HTTP重定向到HTTPS
即使您使用的是HTTP,也可以使用HTTP版本的访问者访问您的网站。这不是理想的选择,因为如果访问者可以访问您网站的非安全版本,则没有HTTPS的意义。
要检查是否存在这种情况,请尝试导航到站点的HTTP版本。如果浏览器自动将您重定向,则可能没有问题。
如果能够访问HTTP版本,则需要将HTTP重定向到HTTPS。
您可以通过将以下代码添加到.htaccess文件中来做到这一点:
RewriteEngine On RewriteCond %{SERVER_PORT} 80 RewriteRule ^(.*)$ https://yourwebsite.com/$1 [R=301,L]
或者,如果您使用的是WordPress,只需在“设置”下将WordPress地址和站点地址更改为HTTPS版本。
只要确保在执行此操作时使用永久(301)重定向,而不是临时(302)重定向即可。
推荐阅读:何时使用301重定向以及如何正确执行的主要用例
7.修复孤立的页面
孤立页面没有网站上可爬网页面的内部链接。结果,搜索引擎无法找到它们或将它们编入索引(除非它们具有来自其他网站的反向链接)。
通常,使用大多数审核工具很难找到孤立的页面,因为它们像搜索引擎一样爬行您的网站。但是,如果您使用的是为您生成站点地图的CMS,则可以在Ahrefs的Site Audit中将其用作URL的来源。只需选中该选项即可在抓取设置中抓取自动检测到的站点地图和反向链接。
如果站点地图的位置不在robots.txt文件中,并且无法在yourwebsite.com/sitemap.xml上访问,则应在抓取设置中选中“特定站点地图”选项,然后粘贴到站点地图URL中(s)。
抓取完成后,请转到“链接”报告,并检查“孤立页面(没有传入的内部链接)”问题。
如果有任何重要的URL,则应将其合并到站点结构中。这可能意味着从导航栏或其他相关的可爬网页面添加内部链接。如果它们不重要,则可以删除,重定向或忽略它们。由你决定。
推荐阅读:如何使用内部链接以及避免什么?
8.确保您的页面快速加载
加载缓慢的页面使访问者感到烦恼。这就是搜索引擎将网页速度列为排名因素之一。
不幸的是,页面速度是一个复杂的话题。您可以使用许多工具和指标来衡量速度基准,但是Google的Pagespeed Insights是一个合理的起点。它为您在台式机和移动设备上的性能得分提供0-100之间的分数,并告诉您可以改进的地方。
但是,我们不关注单个领域,而是以最少的精力介绍一些可能对您的页面速度产生最大积极影响的事情。
切换到更快的DNS提供商。DNSPOD是一个不错的选择(免费)。只需注册一个免费帐户,然后将您的域名服务器与您的域名注册商交换即可。
安装一个缓存插件。CCaching临时存储文件,以便可以将文件更快,更有效地交付给访问者。如果您使用的是WordPress,则WP Rocket 和WP Super Cache 是两个不错的选择。
缩小HTML,CSS和JavaScript文件。缩小可从代码中删除空格和注释,以减小文件大小。您可以使用WP Rocket或Autoptimize做到这一点。
使用CDN。内容分发网络(CDN)将您的网页副本存储在全球的服务器上。然后,它将访问者连接到最近的服务器,以使请求的文件传播的距离更短。有很多CDN提供程序,但是Cloudflare是一个不错的选择。
压缩图像。图像通常是网页上最大的文件。压缩它们可以减小它们的大小,并确保它们花费尽可能少的时间来加载。有很多图像压缩插件,但我们喜欢Shortpixel。
推荐阅读:2020年网站速度优化全面指南
9.Nofollow内部链接
Nofollow链接通常用于标记出您不想认可的页面的出站链接。他们告诉搜索引擎不要将排名积分“传递给链接的页面”(尽管搜索引擎可能会选择忽略该建议)。
因此,不应将它们用于内部链接。但是,根据我们对前110,000个网站的研究,发现3.6%的内部链接是nofollow的。
许多网站所有者这样做是为了阻止页面索引,但是nofollow不能那样工作。在内部链接上使用nofollow只会造成危害,因为它可能会阻止爬网并导致孤立的内容。
分页是一个常见的问题。
要检查您的网站是否存在nofollow的内部链接,请在Ahrefs网站管理员工具中运行爬网,然后转到“链接”报告并查找相关问题。
解决此问题很容易。只需从受影响的链接中删除nofollow属性。
推荐阅读:什么是nofollow链接?它影响SEO优化吗?
总结
技术SEO是一项复杂的业务,在本文中我们没有足够的时间介绍更多SEO技巧。但是,以上建议应足以消除最常见的技术故障,并轻松将您网站的性能置于互联网的前10%。