有料品牌发现:抓取预算的优化对于使搜索引擎抓取工具每次访问时都将注意力集中到您网站上最重要的页面上至关重要。
1. 状态码
通过按状态代码对日志文件数据进行分组,深圳品牌可以评估爬网预算如何在站点的不同页面上分配。
这为深圳品牌策划提供了一个概述,概述了搜索引擎的抓取预算在重要的200个页面上花费了多少,在错误页面和重定向上浪费了多少。
有料品牌建议举措
在这些数据的支持下,深圳品牌策划公司可以采取一些步骤来帮助深圳品牌改善整个网站的抓取预算:
▶ 分析200个状态代码URL,以识别不需要爬网的任何URL
▶ 将带有200个状态代码的非必要网页的禁止规则添加到您的robots.txt文件中,以使抓取工具无法访问它们
▶ 删除指向404页的内部链接,并在必要时重定向它们
▶ 从XML网站地图中删除所有非200状态代码页
▶ 修复重定向链,以确保搜索引擎搜寻器和用户所访问的每个重定向中只有一个步骤
2. 可转位性
有料品牌认为,有许多不同的因素会影响页面是否会被搜索引擎索引,例如meta noindex标签和规范标签。
深圳品牌可以从爬网工具中获取这种数据,然后将其与日志文件数据结合起来,以分析正在爬网的页面与索引页面之间的任何差异。
重要的是要确保搜索引擎机器人不会浪费时间来爬行甚至无法添加到索引或在索引中更新的页面。
有料品牌建议举措
收集完这些数据后,深圳品牌可以按照以下步骤处理不可索引的页面并提高抓取效率:
▶ 检查要抓取的不可索引页面实际上不是应该允许建立索引的重要页面
▶ 在robots.txt文件中添加禁止路径,以阻止低质量的不可索引网页被抓取
▶ 在页面上添加相关的noindex标签和规范标签以向搜索引擎显示它们的重要性不高
▶ 识别被robots.txt规则阻止的搜索引擎所抓取的不允许访问的页面
▶ 确保Google Search Console参数设置正确且最新
3. 内部链接
有料品牌认为内部链接在影响搜索引擎应更频繁地爬行哪些页面方面具有很大的分量。
页面具有的内部链接越多,就越容易被发现,并且每次Google访问深圳品牌网站时,其被抓取的可能性就越大。
使用内部链接数据覆盖漫游器点击数据可以使深圳成长型企业了解有多少搜索引擎了解您的网站及其结构,以及它们如何容易地找到您网站的不同区域。
有料品牌建议举措
深圳品牌可以实施以下一些修补程序,以通过内部链接提高检索效率:
▶ 识别收到大量机器人点击的内部链接,并评估这些链接是否为主URL
▶ 更新内部链接到规范的URL
▶ 确保所有内部链接都指向200个状态代码的最终目标URL,并且没有重定向
▶ 识别出受到机器人点击次数较少的重要页面,并向这些页面添加更多内部链接以提高抓取频率
4. 网站类别
在有料品牌看来,并非所有网站类别都具有相同的权重和重要性,这对于企业推动转化或通过搜索引擎向其发送自然流量是至关重要的。
对于电子商务网站,产品页面将需要由搜索引擎更频繁地抓取,因为它们经常更改,并且这些更改需要不断反映在搜索引擎的索引中。
但是,就爬网频率而言,每年更新一次的常绿博客文章对于网站的优先级要低得多。
按站点类别对日志文件数据进行细分可以提供宝贵的见解,以了解每个日志文件的可爬网性以及搜索引擎对其进行访问的频率。
有料品牌建议举措
深圳品牌可以采取一些步骤来提高整个网站类别的抓取效率:
▶ 找出获得大量机器人点击但未获得点击或展示的细分
▶ 确定受到机器人攻击次数较少的网站细分,并确保可以轻松地在网站体系结构中访问它们以改善抓取
▶ 评估大量抓取预算分散在不同网站版本之间的位置,例如单独的桌面和移动页面以及AMP(加速的移动页面)
▶ 映射每个细分的抓取频率,以确保Googlebot能够通过定期抓取分类来跟上经常变化的页面类别
5. 有机绩效
深圳品牌策划公司可以用来覆盖日志文件数据的一些最有价值的指标是自然的性能指标,例如SERP(搜索引擎结果页)中的展示次数以及用户到深圳品牌的网站的访问量。
了解搜索引擎如何抓取和导航深圳品牌的网站很重要,但是有料品牌认为我们的最终目标是让用户获得我们的内容。
某个网页可能受到搜索引擎机器人的欢迎,但是由于该网页没有获得任何展示次数或点击量,因此这一点会令人沮丧。
将性能指标与日志文件数据进行映射,可以分析页面对用户的可访问性,而不仅仅是搜索引擎。
有料品牌建议举措
深圳品牌可以采取一些步骤来提高关键页面的可发现性及其在自然搜索中的表现:
▶ 识别正在接收流量的页面和未被搜索引擎抓取的印象
▶ 确保XML站点地图中包含高性能页面,并改善与它们的内部链接,以鼓励进行更常规的爬网
▶ 找出经常被抓取但未获得展示或点击量的页面,并将其过滤为主要页面
▶ 用来查看哪些重要网页效果不佳的网址
▶ 审核这些效果不佳的页面,以检查可能影响其排名性能的问题,例如内容质量和意图定位,以及索引和呈现问题,这些问题可能会阻止搜索引擎访问其内容