您现在的位置: 雨哲在线 >> 雨哲网赚 >> 网站运作 >> 搜索优化 >> 查看资讯内容

爬虫系统介绍之 Indy Library

【字: 】        ★★★ 作者:未知    资讯来源:雨哲在线    点击数:764    更新时间:2007-11-15
{$MY_文章通用_Ding}
Indy Library最初是一个关于网络操作的开源程序库,可在 http://www.nevrona.com/Indy" 或 http://indy.torry.net" 找到。这个程序库被Borland Delphi 6、 7、 C++Builder 6,以及所有 Kylix 版本所引用。
不幸的是,这个程序库被强制破解(hi-jacked)并被滥用于一些中国的spam bots中。近期所见使用“Indy Library”字串作为User Agent信息的访问,大多是这些中国“原创作品”。
是开源项目Indy的一部分,是关于网络操作的一个程序库。

爬虫信息

  • 爬虫名称: Indy Library
  • HTTP User Agent:


Mozilla/3.0 (compatible; Indy Library) </pre>

  • 抓取强度: 不一定,很多服务器上较少出现,但也有部分服务器被大量访问
  • 搜索引擎推广效果:无!
  • 来访IP:无规律,很杂乱
  • 对Indy Library爬虫进行控制

    Indy Library只是一个程序库,很多使用它的用户并不遵循robots.txt抓取规范,可能抓取你服务器上声明禁止访问的内容!。如果此类爬虫对您的服务器造成困扰,您可以:


    • 服务器防火墙屏蔽相关访问
    • .htaccess屏蔽相关访问
    • 在程序中进行相关检测和屏蔽

资讯来源:YZ81.COM

网友看法(已有 0 位网友发表了自己的看法。)
广告位招商QQ:425162221