DigExt是IE5的“允许脱机阅读”模式时发出的特殊标记。DigExt虽然并非是一个爬虫程序,但可能像爬虫一样造成大量的服务器访问。
由于设计的失误,离线浏览功能被许多用户无意中错误地使用为每天抓取整个站点,这个特性将使用服务器允许的最大连接数,因而会“成功”阻挡其他用户的使用,直到抓取结束。因此,很多站长封闭了这种形式的浏览器访问。
以上问题仅存在于IE5中。微软已经承认了发行这种浏览器功能是个失误,并在其后版本(IE 5.5以上)进行了修正,转而采用一种强度不高的预读(read-ahead)算法。
Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt; DTS Agent