https://www.tmd9.com/plugin.php?id=tpgao_toutiao
2 J2 T% ?* _: |9 r$ i! Mdiscuz_plugin_tpgao_toutiao_SC_GBK.xml (简体 GBK 编码)
, n# T1 C7 _# [; U9 udiscuz_plugin_tpgao_toutiao_SC_UTF8.xml (简体 UTF8SC 编码)
/ M T: c, |- S$ @discuz_plugin_tpgao_toutiao_TC_UTF8.xml (繁体 UTF8TC 编码)4 o4 \- n3 @+ l) {' B" E: D0 ^
discuz_plugin_tpgao_toutiao_TC_BIG5.xml (繁体 BIG5 编码)1 ~; |4 W2 I1 [/ Y$ K1 K
& E& B4 h# p1 d7 P0 {8 d/ J9 @" k2 {+ h3 p; E
传统采集器基于页面(如PHP),这种方式的问题在于在服务器端运行,加大服务器压力,也很容易造成服务器IP被屏蔽,同时,由于PHP的先天语言特性,假死、不确定性、定时不方便等诸多问题;
* J- b: p* p& B0 F# V 重要问题:头条等服务器已经采用浏览器本地渲染方式来加载数据,传统的curl等已经很难拿到数据,本客户端克服了该问题,基于现在流行的渲染采集技术来采集数据;* A3 s6 p& {8 T
相对于传统采集器,有如下特性$ z: l* x4 r# j: W. ^ F% z6 `
4 U. O# I; Q6 Z* d7 x
1、稳定、基于客户端运行,减小对服务器造成压力;: B b9 T- p/ P: R: f
2、可以配合IP池更换IP(后期规划,目前版本没有);
8 t& L# Q7 t" d1 y3 J, z3、定时及运行方便;
' ^, i- w$ A! F( g5 `% z4、本地渲染数据,可以很轻松的爬取数据;
8 B, T7 D3 M1 L" ^/ v0 J
/ S# c" a0 W) a/ I. x% G购买后客户端可以找客服索取;
, S7 K$ m, T9 H8 m- P2 R
: ~7 [ W M0 O% G( B, g/ q |