请帮助我的网站禁止不明蜘蛛爬取

问:不明蜘蛛爬取网站消耗流量占比较多,看了相关教程仍然无法处理,请帮忙禁止以下红框内的三种蜘蛛的爬取,感谢。

,请帮助我的网站禁止不明蜘蛛爬取

答:您好,

这种不规则蜘蛛,无法通过规则的方式拦截,您可以关闭ssl 部署,然后开启百度云加速,百度云加速的缓存机制可以缓存静态文件,从而节 流量消耗。

问:我需要ssl。帮忙想想其他办法,谢谢。

答:您好,可尝试开启只让允许的蜘蛛进行访问,对于允许范围之外的蜘蛛进行拦截操作,请知悉

可在虚拟主机下/www目录下创建一个web.config(已有该文件,可直接在该文件中进行修改),在该文件中添加:

<?xml version="1.0" encoding="UTF-8"?>

<configuration>

    <system.webServer>

        <rewrite>

            <rules>

<rule name="Block spider">
      <match url="(^robots.txt$)" ignoreCase="false" negate="true" />
      <conditions>
        <add input="{HTTP_USER_AGENT}" pattern="SemrushBot|Webdup|AcoonBot|AhrefsBot|Ezooms|EdisterBot|EC2LinkFinder|jikespider|Purebot|MJ12bot|WangIDSpider|WBSearchBot|Wotbox|xbfMozilla|Yottaa|YandexBot|Jorgee|SWEBot|spbot|TurnitinBot-Agent|curl|perl|Python|Wget|Xenu|ZmEu" ignoreCase="true" />   
      </conditions>
      <action type="CustomResponse" statusCode="403" statusReason="Forbidden" statusDescription="Forbidden" />
</rule>

            </rules>

        </rewrite>

    </system.webServer>

</configuration>
将要拦截的蜘蛛信息添加到{HTTP_USER_AGENT}中即可,以“|”进行分隔,请知悉

,非常感谢您长期对我司的支持!

更多关于云服务器域名注册,虚拟主机的问题,请访问西部数码官网:www.west.cn
赞(0)
声明:本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-62778877-8306;邮箱:fanjiao@west.cn。本站原创内容未经允许不得转载,或转载时需注明出处:西部数码知识库 » 请帮助我的网站禁止不明蜘蛛爬取

登录

找回密码

注册