[下载:]
整站:http://x.oddsfun.com/x.zip(2012-4-3,此为第二版,上一版本我自己也没有备份)
模块:http://x.oddsfun.com/modules.zip,内附四个模块,直接放到sites/all/modules中即可
升级:可以整站复盖,也可以下载模块后放到sites/all/modules中.
升级原因:从2012-1-28版升级到2012-4-3,是为了支持godaddy空间,以及提高采集性能\bug fixed.
demo:http://oddsfun.com
你们要支持这个程序的话: buy me a coffee: http://me.alipay.com/trackself
请加QQ群:227600605,关于drupal anywhere 和 drupal crawler 这个CMS的
[介绍:]
这个是一个基于drupal的二次开发的CMS,主要用于采集和赚美金(人民币我是失败了):
1.可以采集明文的HTML.(藏在javascript里的东西应该是不行的).我主要用于采图片.
2.采集程序何其多,它的特色是完全基于PHP和drupal,直接能用在bluehost等便宜到死的主机上,不需要非常规的PHP插件.
3.并发爬行(一个个爬,等明年吧).bluehost的最大值是50并发,我设置了15个并发,不会让你被bluehost封机器的
4.对wordpress支持相当好,我指的是采集用wordpress做的站.我在做采集的时候发现80%的国外站点是用wordpress做的.
5.我在里面装上了很多drupal必须要用到的模块和帮你下载好了一些我必须用到的模块,你自己选择性安装,方便上手drupal
6.能并发下载图片.
7.能并发上传到picasa,我是穷人,所以得想尽办法省流量,流量是其次,bluehost限制了文件数量最大不超过15万张(15万张,几周就到了,我某个站似乎有70万的图片了).也是这一点,导致我赚不到人民币,万恶的GFW!