搜索引擎蜘蛛是如何爬行与抓取页面的？小小课堂SEO教程 - 阔象出海

B2B数据

免费试用

全球企业库

寻找优质线索并发现新的线索来源

全球企业库 ico

全球企业库

中国进出口企业 ico

中国进出口企业

领英获客

通过信息化手段高效开发管理客户

领英人员 ico

B2B询盘线索

抢先一步了解潜客最新采购意向

询盘线索 ico

展会采购商名录

全球不同行业展会的采购商信息

展会数据 ico

立即使用会员中心

发布时间:8月前

957

138

搜索引擎蜘蛛是如何爬行与抓取页面的？小小课堂SEO教程

搜索引擎蜘蛛是用来爬行和访问页面的程序。它们通过向页面发出访问请求并收集HTML代码来实现页面的抓取和收录。本文将为大家详细介绍搜索引擎蜘蛛的工作原理、爬行方式以及如何吸引更多的蜘蛛来访您的网站。

搜索引擎蜘蛛网页抓取策略

一、搜索引擎蜘蛛简介

搜索引擎蜘蛛，又被称之为"蜘蛛"或"机器人"，是用来爬行和访问页面的程序。

① 爬行原理

搜索引擎蜘蛛访问网页的过程，就好比用户使用的浏览器。搜索引擎蜘蛛向页面发出访问请求，该页面的服务器则返回该页面的HTML代码。搜索引擎蜘蛛将收到的HTML代码存入搜索引擎的原始页面数据库中。

② 如何爬行

为了提高搜索引擎蜘蛛的工作效率，通常采用多个蜘蛛并发分布爬行。同时，分布爬行还分为两种模式：深度优先和广度优先。深度优先是沿着发现的链接一直爬行，直到没有任何链接；广度优先是先将一页面上的所有链接爬行完毕之后，才会沿着第二层页面继续这样爬行。

③ 蜘蛛必遵守的协议

搜索引擎蜘蛛在访问网站之前，都会先访问网站根目录下的robots.txt文件。搜索引擎蜘蛛不会去抓取robots.txt文件中禁止爬行的文件或目录。

④ 常见搜索引擎蜘蛛

百度蜘蛛：Baiduspider

谷歌蜘蛛：Googlebot

360蜘蛛：360Spider

SOSO蜘蛛：Sosospider

有道蜘蛛：YoudaoBot，YodaoBot

搜狗蜘蛛：Sogou News Spider

必应蜘蛛：bingbot

Alexa蜘蛛：ia_archiver

二、如何吸引更多搜索引擎蜘蛛

互联网信息爆炸，搜索引擎蜘蛛不可能将所有网站的所有链接全部爬行到，那么如何吸引更多的搜索引擎蜘蛛到您的网站上来爬行变得非常重要。

① 导入链接

无论是外部链接，还是内部链接，只有有导入，才能被搜索引擎蜘蛛知道该页面的存在。所以，多做外链建设有助于吸引更多蜘蛛来访。

② 页面更新频率

页面更新频率越高，搜索引擎蜘蛛来访的次数也会越多。

③ 网站和页面权重

整个网站的权重以及某一页面的权重（包括首页也是页面）影响着蜘蛛的来访频率，权重高、权威性强的网站一般都会增加搜索引擎蜘蛛的好感。

④ 与首页的距离

目录层级越深，蜘蛛来访的几率和次数就会越少。建议做外链时，不要只做首页外链，偶尔做栏目和聚合页面的外链也可以。同时，URL越短，蜘蛛可能也会觉得链接权重更高。

三、搜索引擎蜘蛛地址库

搜索引擎蜘蛛有一个专门的地址库，用来存放已经被发现的URL（已被抓取和未被抓取的都算，只要是被发现的URL都算），这样就不会出现重复爬行和抓取页面的情况了。

① 地址库URL来源

蜘蛛抓取的页面中发现的新的URL；

站长后台自主提交的URL；

站长后台提交的XML地图中的URL；

站长后台提交的网站URL。

② 对于未被抓取的URL

对于未被抓取的URL，不管是以什么方式获取的，哪怕是搜索引擎蜘蛛自己发现的，也会先放入地址库中，然后在做统一抓取。

四、页面数据存储

搜索引擎蜘蛛将抓取的页面数据会存入搜索引擎的原始页面数据库中，其实，就可以理解为快照中看到的页面数据，和用户看到的是一样的，每一个页面的URL地址都有一个唯一的编号。

五、复制内容检测

搜索引擎蜘蛛在爬行的过程中，会进行一定程度的复制内容检测。如果是权重低的网站上，发现了大量的转载或抄袭内容时，可能会停止爬行，这些页面可能也会不抓取与收录。但并不是说网站就不能转载，像一些权重很高的平台，哪怕是转载了一篇旧闻排名也可以很好。

上一篇:搜索引擎蜘蛛如何爬行以及如何吸引蜘蛛来抓取页面下一篇:如何让网站快速被搜索引擎收录?良性地被蜘蛛爬虫关注

相关文章

邮件签名一旦这么写，客户连你是谁都记不住

邮件签名一旦这么写，客户连你是谁都记不住阅读全文

亚马逊 FBA 物流服务详解：费用计算方式及优化策略

亚马逊 FBA 物流服务详解：费用计算方式及优化策略阅读全文

选择合适的 Shopify 域名,打造品牌形象

选择合适的 Shopify 域名,打造品牌形象阅读全文

亚马逊跨境电商团队组建与运营实践

亚马逊跨境电商团队组建与运营实践阅读全文

eBay开店全面指南：从注册账户到发布商品

eBay开店全面指南：从注册账户到发布商品阅读全文

跨境电商订单管理的全流程解析

跨境电商订单管理的全流程解析阅读全文

亚马逊运营小白攻略：从新人到高手的工作全过程

亚马逊运营小白攻略：从新人到高手的工作全过程阅读全文

3招做好跨境电商售后管理，利润轻松提升3个点

3招做好跨境电商售后管理，利润轻松提升3个点阅读全文

跨境电商售后处理各种情况的方法

跨境电商售后处理各种情况的方法阅读全文

如何利用数据分析选择热销商品?

如何利用数据分析选择热销商品? 阅读全文

开发优质客户，从阔象出海开始

免费、不限次查看真实采购商和供应商的贸易概述

欢迎使用阔象出海

添加专属客服，免费试用高级功能

AMY

打开微信扫一扫

alert_warn

该企业数据暂未公开

发现更多的优质采购商

请联系客服

专属热线：

官方邮箱：

AMY

立即扫码联系客服