新浪稳座国家级门户头把交椅,谁还敢说自己网站结构的复杂程度可以超越新浪。于是我们请王久明分享一下新浪在死链处理和死链预防(重要页面因修改而产生死链)方面的经验。
一、在以下背景下会较多产生死链:
1、时政新闻的敏感性;
2、来自监管的删除需求;
3、频道(编辑)自身删改的需求;
4、搜索方期望资源方主动优化和定期清除的需求
二、死链分类:
由于系统架构、历史遗留问题、多业务系统交叉影响等多方面因素,新浪存在如下三种死链:
1、协议死链,服务器端返回HTTP状态码404;
2,内容死链,服务器端返回HTTP状态码200,无法设置为404;
3,页面需要用户和蜘蛛可以正常访问,但由于删改或误操作导致反复上下线形成协议死链或内容死链。
上线后又下线,后又上线,甚至反复多次。由于下线期间存在协议死链或内容死链的情况,导致百度认为该页面应该被删除,不被收录,且即使后续重新上线也无法恢复收录。对于这种情况,应加以预防。
阅读"[网站死链怎么处理]处理网站死链的方法"的人还阅读