您当前的位置 : 首页 > 动态 > 建站百科

网站死链介绍及设置方法

时间:2024-01-03来源:南昌大数据服务、3DVR、软件系统开发、微信小程序开发、网站建设

  一、死链介绍

  1、什么是死链

  几乎所有的网站或智能小程序都会遇到内容失效、过期,页面不需要再展现的情况,这些无法对用户提供任何有价值信息的页面就是死链接,它包括协议死链和内容死链两种形式。

  2、为什么要及时处理死链

  当站点/小程序死链数据累积过多并且被展示到搜索结果页时,会影响百度搜索对站点/小程序的评价,对站点/小程序的访问体验和用户转化都会起到负面影响。另一方面,百度检查死链的流程也会为站点/小程序带来额外负担,影响对其他正常页面的抓取和索引。

  二、百度搜索建议的死链类型及设置方案

  常见的死链包括协议死链(百度搜索建议的死链类型)和内容死链,还有一些对百度并不友好的“个性化死链”。

  协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、410。

  内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。

  在此,百度搜索建议的死链设置方案为:

  第一步,将返回码设置为404或者410:如果站点/小程序已永久删除相应内容,并且不打算对内容进行替换,建议开发者将返回码设置成404或410,百度爬虫尝试抓取网页时,如果返回码为404或410,会将URL判定为死链,进而从搜索中删除

  第二步,设置完返回码后,修改页面标题,明确表示该页面为死链,页面内容可以进行个性化设置。

  对百度搜索不友好的死链类型及不推荐的死链方案:

  1、个性化死链

  部分开发者追求个性化和用户体验,在页面内容失效后并未做协议死链处理,也就是说返回状态码依然是200,仅仅是在页面上做了一个有趣的个性化图片,通过图片告诉用户这个页面没有有价值的内容,这类死链是百度搜索不提倡的。

  2、页面内容为死链但是返回码为200

  3、页面重定向到首页、错误页面、登录页面

  例如:页面A内容已经失效,用户点击页面后,页面跳转到了站点首页。

  不推荐的死链设置方案可能会使搜索引擎造成混淆,使得站点的无效内容在搜索结果中展现,最终影响站点的排名和评价。

  三、如何处理死链

  【站点】

  第一步,筛查站点内部存在的死链,制作死链文件,并将这些死链页面设置成为404页面,即百度访问它们时返回码为404。

  第二步,将死链文件放置在网站根目录下

  比如您的网站为example.com,您已制作了一个silian_example.xml死链文件,则将silian_example.xml上传至网站根目录即example.com/silian_example.xml。

  第三步,登录百度搜索资源平台-死链提交工具提交死链数据

  (1)通过搜索资源平台-搜索服务-资源提交-死链提交,到达操作页面;

  (2)填写死链文件更新周期,可选“每隔xx小时/天更新一次”;

  (3)填写死链文件地址,请留意提交框右侧的配额提示;

  (4)管理已提交的死链列表,可查看死链文件状态和死链处理状态。

  特别提醒:

  1、在提交死链时,要保证所有页面都处于404状态,提交文件中请勿包括活链URL,如有活链会导致活链URL从搜索中移除。

  2、索引型死链Sitemap文件工具将不予处理,请勿提交索引型死链Sitemap文件。

  【小程序】

  整理出需要删除的资源path路径,通过智能小程序开发者平台-自然搜索-资源删除工具进行提交。

  特别提醒:

  1、死链文件每?一条path路径,?件支持txt格式,每个文件最多允许1000个path路径,且需小于10MB;

  2、为避免误删除影响小程序已有流量,每天最多可提交一次死链文件。

  附录:

  常见的死链返回码:

  404 Not Found,表示服务器没有找到任何匹配请求URL的东西,没有说明这种情况是暂时的还是永久的。

  410 Gone,表示请求的内容在服务器上不再可用,且没有已知的转发地址。410通常表示资源永久性的失效。

  正常页面返回码:

  200 OK,表示请求成功。

  如果相关内容已删除或移动,不建议返回成功状态码(200 OK)而是返回404、410状态码。

  204 NoContent,表示这个请求没有要发送的内容,但是报头可能有用。用户代理可以使用新的报头来更新此资源的缓存头。

  如果页面已经删除,请返回404/410,返回204可能给搜索引擎造成混淆。

  其他返回码:

  如果正常页面长期返回非2xx、3xx的错误码,可能会影响相应内容的收录和搜索展现。常见的错误码如下:

  403  Forbidden,表示客户端没有获取内容的权限。

  429 Too ManyRequests,表示用户在给定时间内发送了太多的请求。

  500 Internal ServerError,表示服务器遇到了不知道如何处理的情况。

  503 ServiceUnavailable,表示服务器还没有准备好处理请求。通常的情况是服务器超载或者正在维护。

  如果由于抓取频次过高导致429、5xx错误,开发者可以在百度搜索资源-抓取频次-抓取频次上限调整页面对百度爬虫的抓取频次进行设置。

  一、死链介绍

  1、什么是死链

  几乎所有的网站或智能小程序都会遇到内容失效、过期,页面不需要再展现的情况,这些无法对用户提供任何有价值信息的页面就是死链接,它包括协议死链和内容死链两种形式。

  2、为什么要及时处理死链

  当站点/小程序死链数据累积过多并且被展示到搜索结果页时,会影响百度搜索对站点/小程序的评价,对站点/小程序的访问体验和用户转化都会起到负面影响。另一方面,百度检查死链的流程也会为站点/小程序带来额外负担,影响对其他正常页面的抓取和索引。

  二、百度搜索建议的死链类型及设置方案

  常见的死链包括协议死链(百度搜索建议的死链类型)和内容死链,还有一些对百度并不友好的“个性化死链”。

  协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、410。

  内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。

  在此,百度搜索建议的死链设置方案为:

  第一步,将返回码设置为404或者410:如果站点/小程序已永久删除相应内容,并且不打算对内容进行替换,建议开发者将返回码设置成404或410,百度爬虫尝试抓取网页时,如果返回码为404或410,会将URL判定为死链,进而从搜索中删除

  第二步,设置完返回码后,修改页面标题,明确表示该页面为死链,页面内容可以进行个性化设置。

  对百度搜索不友好的死链类型及不推荐的死链方案:

  1、个性化死链

  部分开发者追求个性化和用户体验,在页面内容失效后并未做协议死链处理,也就是说返回状态码依然是200,仅仅是在页面上做了一个有趣的个性化图片,通过图片告诉用户这个页面没有有价值的内容,这类死链是百度搜索不提倡的。

  2、页面内容为死链但是返回码为200

  3、页面重定向到首页、错误页面、登录页面

  例如:页面A内容已经失效,用户点击页面后,页面跳转到了站点首页。

  不推荐的死链设置方案可能会使搜索引擎造成混淆,使得站点的无效内容在搜索结果中展现,最终影响站点的排名和评价。

  三、如何处理死链

  【站点】

  第一步,筛查站点内部存在的死链,制作死链文件,并将这些死链页面设置成为404页面,即百度访问它们时返回码为404。

  第二步,将死链文件放置在网站根目录下

  比如您的网站为example.com,您已制作了一个silian_example.xml死链文件,则将silian_example.xml上传至网站根目录即example.com/silian_example.xml。

  第三步,登录百度搜索资源平台-死链提交工具提交死链数据

  (1)通过搜索资源平台-搜索服务-资源提交-死链提交,到达操作页面;

  (2)填写死链文件更新周期,可选“每隔xx小时/天更新一次”;

  (3)填写死链文件地址,请留意提交框右侧的配额提示;

  (4)管理已提交的死链列表,可查看死链文件状态和死链处理状态。

  特别提醒:

  1、在提交死链时,要保证所有页面都处于404状态,提交文件中请勿包括活链URL,如有活链会导致活链URL从搜索中移除。

  2、索引型死链Sitemap文件工具将不予处理,请勿提交索引型死链Sitemap文件。

  【小程序】

  整理出需要删除的资源path路径,通过智能小程序开发者平台-自然搜索-资源删除工具进行提交。

  特别提醒:

  1、死链文件每?一条path路径,?件支持txt格式,每个文件最多允许1000个path路径,且需小于10MB;

  2、为避免误删除影响小程序已有流量,每天最多可提交一次死链文件。

  附录:

  常见的死链返回码:

  404 Not Found,表示服务器没有找到任何匹配请求URL的东西,没有说明这种情况是暂时的还是永久的。

  410 Gone,表示请求的内容在服务器上不再可用,且没有已知的转发地址。410通常表示资源永久性的失效。

  正常页面返回码:

  200 OK,表示请求成功。

  如果相关内容已删除或移动,不建议返回成功状态码(200 OK)而是返回404、410状态码。

  204 NoContent,表示这个请求没有要发送的内容,但是报头可能有用。用户代理可以使用新的报头来更新此资源的缓存头。

  如果页面已经删除,请返回404/410,返回204可能给搜索引擎造成混淆。

  其他返回码:

  如果正常页面长期返回非2xx、3xx的错误码,可能会影响相应内容的收录和搜索展现。常见的错误码如下:

  403  Forbidden,表示客户端没有获取内容的权限。

  429 Too ManyRequests,表示用户在给定时间内发送了太多的请求。

  500 Internal ServerError,表示服务器遇到了不知道如何处理的情况。

  503 ServiceUnavailable,表示服务器还没有准备好处理请求。通常的情况是服务器超载或者正在维护。

  如果由于抓取频次过高导致429、5xx错误,开发者可以在百度搜索资源-抓取频次-抓取频次上限调整页面对百度爬虫的抓取频次进行设置。

  道然专注于提供定制化大数据服务、VR建设、软件系统开发、网站建设、微信开发、小程序开发、宣传片拍摄等服务,多年的互联网经验让道然能准确的洞察市场风向,帮助客户赢得更广阔的互联网市场,以客户为本,帮助企业做好线上建设搭建对外沟通的桥梁,让每一家企业拥有自己的名片。道然根据企业形象主打量身定制,拒绝千遍一律我们只做高端。


返回列表

江西道然信息科技有限公司

地 址:南昌市红谷滩万象城置地中心5楼

电 话:400-808-6770

邮 箱:745451506@qq.com

填写您的项目信息
手机端二维码
与我们合作
与道然合作,您将会得到更成熟的品牌建设服务。我们以客户至上,同时也相互挑战,力求呈现最好的品牌建设成果。
服务热线:400-808-6770
Copyright ©江西道然信息科技有限公司 地址:南昌市红谷滩万象城置地中心5楼 联系人:18679189561(刘)
赣ICP备18010368号 赣公网安备 36010902000279号 增值电信业务许可证:赣B2-20240371