baidu
互联网 54BQ.com
10-01
24

asp百度小偷程序源代码提供下载


  
“小偷程序”指的是利用ASP  或asp.net或PHP等脚本语言,把远程网站上的数据(图片,网页及其他文件)抓取到本地,经过各种处理后显示到自己的页面上或者存储进数据库的一类程序。

asp小偷程序实际上是通过了XML中的XMLHTTP组件调用其它网站上的网页。比如新闻小偷程序,很多都是调用了sina的新闻网页,并且对其中的html进行了一些替换,同时对广告也进行了过滤。用小偷程序的优点有:无须维护网站,因为小偷程序中的数据来自其他网站,它将随着该网站的更新而更新;可以节省服务器资源,一般小偷程序就几个文件,所有网页内容都是来自其他网站。缺点有:不稳定,如果目标网站出错,程序也会出错,而且,如果目标网站进行升级维护,那么小偷程序也要进行相应修改;速度,因为是远程调用,速度和在本地服务器上读取数据比起来,肯定要慢一些。


我曾经自己做过一个音乐小偷,而且全部都是伪静态即 ?****.htm类型的地址,当时百度、谷歌、搜搜、搜狗天天爬,百度收录上千,谷歌一度收录上万,但是由于占用服务器资源太大所以去掉了


最近写了一个纯的百度小偷界面如下

搜搜界面如下


地址是http://baidu.54bq.com/大家可以来测试一下


其实我的许多站长工具也属于小偷类程序,只不过应用不一样而已:


谷歌PR查询工具http://www.54bq.com/tools/pr
搜索引擎收录查询工具http://www.54bq.com/tools/seo.asp
还有其他在线工具http://www.54bq.com/tools

“小偷程序”的缺点
  不稳定,如果目标网站出错,程序也会出错,而且,如果目标网站进行升级维护,那么小偷程序也要进行相应修改;速度,因为是远程调用,速度和在本地服务器上读取数据比起来,肯定要慢一些。

比如收录查询工具在抓取谷歌收录量时经常会出错,因为谷歌会屏蔽掉一些经常不正常浏览的IP或者head。就算站长站的收录查询工具也是时常查不出谷歌收录的。


[本日志由 shmshz 于 2010-03-03 09:26 AM 编辑]
文章来自: 本站原创
引用通告: 查看所有引用 | 我要引用此文章
Tags: asp 小偷 程序 代码 下载
相关日志:
评论: 0 | 引用: 0 | 查看次数: -
发表评论
昵 称:
邮 箱:
密 码: 游客发言不需要密码.
内 容:
验证码: 验证码
选 项:
虽然发表评论不用注册,但是为了保护您的发言权,建议您注册帐号.