百度 | 神马 | 搜狗 | 技术文档 | 学习资料分享 - 记录帝国CMS及运维技术的点点滴滴
你的位置:首页 > 实用IT技术 » 正文

【爬虫相关】DigExt DTS Agent是什么蜘蛛爬虫?

发布时间:2020-09-17

作品分类:爬虫相关  爬虫  抓取  失误  爬虫  蜘蛛  DigExt  DTS  Agent

DigExt是IE5的“允许脱机阅读”模式时发出的特殊标记。DigExt虽然并非是一个爬虫程序,但可能像爬虫一样造成大量的服务器访问。

由于设计的失误,离线浏览功能被许多用户无意中错误地使用为每天抓取整个站点,这个特性将使用服务器允许的最大连接数,因而会“成功”阻挡其他用户的使用,直到抓取结束。因此,很多站长封闭了这种形式的浏览器访问。
以上问题仅存在于IE5中。微软已经承认了发行这种浏览器功能是个失误,并在其后版本(IE 5.5以上)进行了修正,转而采用一种强度不高的预读(read-ahead)算法。

Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt; DTS Agent

Top