关于网络蜘蛛抓取网页,消耗流量

 

问:关于网络蜘蛛抓取网页,消耗流量太大,

虚拟主机:nbweb8,网址:www.dtmts.cn,dtmts.cn查看了一下,访问log,有很多百度蜘蛛,但是注册了百度熊掌添加网站后,却显示“暂时没有抓取频次数据”,无法更改抓取频次,请问怎么办?,关于网络蜘蛛抓取网页,消耗流量

答:您好,

熊掌号和抓取频次并无关联,如要对抓取做相关设置请通过ziyuan.baidu.com站长平台进行设置,非常感谢您长期对我司的支持!

问:就是ziyuan.baidu.com平台

显示无抓取信息,但实际访问记录有很多百度蜘蛛。请看图。太消耗流量了,怎么办

答:您好,从日志上看,并不是百度蜘蛛,而是baiduboxapp手百UA https://ziyuan.baidu.com/wiki/963 如果您不需要,请参看https://www.west.cn/faq/list.asp?unid=662 教程屏蔽这个ua,非常感谢您长期对我司的支持!

问:在虚拟主机根目录添加httpd.conf文件规则?

答:您好,您的主机是iis7的,参照web.config设置方式,非常感谢您长期对我司的支持!

问:web.config怎么屏蔽百度UA,怎么编写?

答:您好,给您发的教程里面有的:

<?xml version=\”1.0\” encoding=\”UTF-8\”?><configuration>    <system.webServer>        <rewrite>            <rules><rule name=\”Block spider\”>
      <match url=\”(^robots.txt$)\” ignoreCase=\”false\” negate=\”true\” />
      <conditions>
        <add input=\”{HTTP_USER_AGENT}\” pattern=\”baiduboxapp\” ignoreCase=\”true\” />
      </conditions>
     <action type=\”AbortRequest\” />
</rule>            </rules>        </rewrite>    </system.webServer></configuration>,非常感谢您长期对我司的支持!

问:从www日志weblog来看,9月17日有1000多条Baiduspider,那么消耗流量很大的是Baiduspider还是百度UA?

答:您好,消耗流量多的是baiduboxapp 手机百度的UA,不是Baiduspider,非常感谢您长期对我司的支持!

更多关于云服务器域名注册,虚拟主机的问题,请访问西部数码官网:www.west.cn
赞(0)
声明:本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-62778877-8306;邮箱:fanjiao@west.cn。本站原创内容未经允许不得转载,或转载时需注明出处:西部数码知识库 » 关于网络蜘蛛抓取网页,消耗流量

登录

找回密码

注册