找回密码
 注册

插件 Plugins > Plugin 蜘蛛看门狗 v2.0(dicky_spider_watchdog)

admin 发表于 2022-4-8 12:16:04
https://www.tmd9.com/plugin.php?id=dicky_spider_watchdog5 d. d5 w& x  ]
discuz_plugin_dicky_spider_watchdog_SC_GBK.xml (简体 GBK 编码)  b" M4 E  `3 ~6 w9 p' y
discuz_plugin_dicky_spider_watchdog_SC_UTF8.xml (简体 UTF8SC 编码)5 t( n* j; a  l) d! U
discuz_plugin_dicky_spider_watchdog_TC_UTF8.xml (繁体 UTF8TC 编码)- S# T6 G: W  {
discuz_plugin_dicky_spider_watchdog_TC_BIG5.xml (繁体 BIG5 编码)( ?* X5 j& J/ ]6 y, E& J

0 ~# j7 u4 T( U1 N# l  e0 H
4 a! z* \! ?' r  D5 c# {+ m4 M插件可以阻止指定的蜘蛛、爬虫程序抓取网站,降低服务器负载,并可以设置指定版块、指定帖子ID、指定文章栏目ID、指定文章ID禁止蜘蛛和爬虫程序访问。3 l  g  [' T! E( P' |
* ]& X5 o! v) `/ D
演示地址:http://dz.25941.cn7 M* m8 a8 p5 h8 R% q
: J) S* v9 d/ |; ?0 F+ E4 P$ B
搜索引擎爬虫对网站的负面影响:
6 U1 R8 S3 s* p(1)、网站有限的带宽资源,而爬虫的量过多,导致正常用户访问缓慢。/ A) o' [  s4 X. @
例如,原本虚拟主机主机的连接数受限,带宽资源也是有限。这种情况搜索引擎爬虫受影响呈现更明显。
1 C" Z0 b. E1 g, g(2)、搜索引擎爬虫过频密,抓取扫描很多无效页面。甚至抓页面抓到服务器报502、500 、504 等服务器内部错误了,蜘蛛爬虫还在不停使劲抓取。
# _, t' r5 D! ]6 T(3)、设置了robots.txt文件不代表可以高枕无忧。
- [& t' L- K! J- j肯定有很多人认为,在robots.txt设置屏蔽搜索引擎爬虫即可,或者允许某些特定的搜索引擎爬虫,能达到你预想效果。不错正规的搜索引擎会遵守规则,且不会及时生效。实际中某些蜘蛛往往不是这样的,先扫描抓取你的页面,无视你的robots.txt。也可能它抓取后不一定留用;或者它只是统计信息,收集互联网行业趋势分析统计。
% q( R3 r: q) a5 G* d(4)、还有一种它们不是蜘蛛,但其有蜘蛛的特性。例如采集软件,采集程序,网络扫描e-mail地址的工具,各式各样的SEO分析统计工具,千奇百怪的网站漏洞扫描工具,等等,只有你想不到的工具,没有它做不到的...,对于这种蜘蛛,需要从网站访问日志中提取UA关键字,放到插件设置中。
4 Z' I9 `) M- S1 Y& Z& A0 x" I: C8 j3 n" y5 E, `' v: A
常见蜘蛛:5 ]) v1 w; |/ l7 c' M
Baiduspider
/ [! X: e% b+ BYodaoBot
, p2 i! G; |8 ~YoudaoBot: q/ H3 X) {0 z! z7 |
Googlebot
4 g& p4 R3 Y8 V9 h4 EGooglebot-Image$ S4 u7 w! R' `
Mediapartners-Google
+ x2 v9 F$ M0 A/ P8 SSogou-Test-Spider
' T3 `* r5 z8 {; u: UTwiceler
( x2 K3 ?' a3 V1 \3 T* ~0 DYahoo! Slurp; [3 N0 `& W0 |' ^6 t) G, U  p0 ^; R
Yahoo! Slurp China4 r5 d! D* }  ]- B: E, [
Yahoo!-AdCrawler
  q# G% q  @  ^& @' K9 \Yahoo ContentMatch Crawler1 K# m4 h6 r' K& G5 x5 g% i
Sosospider
+ o( p: _3 P' p5 aCollapsarWEB qihoobot
$ P( z. a! t4 l3 mNaverBot
2 z! q* B/ r  G  c/ `sogou spider
' m+ F: s2 x* B' A# ^sogou in spider" U2 g8 Y4 A7 j
Sogou web spider
9 R" R6 C+ p; ~( f3 [% s( `& lSogou News Spider
/ R" T& B+ J. k* ySogou Orion spider
: \4 J) o# {2 Y: _2 |$ P. g9 pSogou head spider% z9 h9 h- c8 @& a0 x$ J  H
SurveyBot: d: t% M1 @5 B/ S9 q6 s! U% m3 \
Yanga WorldSearch Bot v. K9 y% P/ x$ e$ l! C
baiduspider-mobile-gate
# r) q; M4 W% z. Q% h- `$ Ediscobot
2 j. B1 c  u& c  ?. sia_archiver
# h! G7 f' J) j0 Q9 tmsnbot
/ e: A4 V5 l. Qmsnbot-media# d: v! r: w; d. B
360Spider
4 r9 v1 j# q) y( qbingbot
  p9 I, k( Z5 z# \9 m0 gYisouSpider; i- \( Z) u5 h+ {9 r9 }( M
EasouSpider* u, |' T1 F, _- p: N( Y
JikeSpider, B. v2 p2 p. I" A6 y6 i8 z
EtaoSpider6 Q) m. m) ^& m, b% t9 d; [
YandexBot
( u, ?% y6 m) `. w( J1 }9 h8 Q( N$ EAhrefsBot
1 U0 A- R0 Y  J/ J, i" xezooms.bot; ]2 C' U7 Y# _

0 {& M  e" }7 D4 o" q# H
creditlist 发表于 2023-4-9 17:13:17
tshuz_tools
portal 发表于 2023-7-13 12:45:58
nciaer_autoforum
sms 发表于 2023-7-30 06:59:18
pin_baidu_hot
activitylog 发表于 2023-10-9 16:53:22
llx_wxfollow
todaynews 发表于 2023-12-7 05:27:23
dzl8_webmaster
statistics 发表于 2024-5-31 08:52:54
zxsq_mdavatar
Powered by Discuz! Team and Comsenz UI Team 温馨提示: 本站资源仅供学习等! 请下载后24小时内删除! 谢谢合作! Beta DZ X2 X2.5 X3 X3.1 X3.2 X3.3 X3.4 X3.5 F1.0 L1.0 UCenter Release Development
快速回复 返回顶部 返回列表