https://www.tmd9.com/plugin.php?id=tpgao_toutiao
5 r+ E- E5 @: a7 ^* |7 Cdiscuz_plugin_tpgao_toutiao_SC_GBK.xml (简体 GBK 编码); C' P4 A W* O- d# i0 B! l/ b
discuz_plugin_tpgao_toutiao_SC_UTF8.xml (简体 UTF8SC 编码), ?. X- Q# X) }, i; x
discuz_plugin_tpgao_toutiao_TC_UTF8.xml (繁体 UTF8TC 编码)5 R& Y8 k* ?- U
discuz_plugin_tpgao_toutiao_TC_BIG5.xml (繁体 BIG5 编码)
4 }( g e# O! H5 L+ m$ ]8 L* Z7 U/ L. x* Z. n* {. m$ l
/ l" G) i% c8 m* P8 o传统采集器基于页面(如PHP),这种方式的问题在于在服务器端运行,加大服务器压力,也很容易造成服务器IP被屏蔽,同时,由于PHP的先天语言特性,假死、不确定性、定时不方便等诸多问题;
4 o# M0 Z% o. Z4 E 重要问题:头条等服务器已经采用浏览器本地渲染方式来加载数据,传统的curl等已经很难拿到数据,本客户端克服了该问题,基于现在流行的渲染采集技术来采集数据;
3 q p0 R; C0 ? x, c相对于传统采集器,有如下特性
# v6 J+ Y% T4 u& \# a; L# j9 l$ ]( ~. B' n E' E& s- S7 X/ u; |
1、稳定、基于客户端运行,减小对服务器造成压力;/ B2 w9 _+ N# T1 x7 x `2 P- j
2、可以配合IP池更换IP(后期规划,目前版本没有);
8 l6 i+ D6 v2 {: j+ G3、定时及运行方便;
& V0 `+ m+ H0 z6 ~+ ]+ q4、本地渲染数据,可以很轻松的爬取数据;6 v& j0 N- u! I" l+ |. W; e; \: e
* U) O# C4 ~8 I. {购买后客户端可以找客服索取;
6 S3 y8 S. m1 g7 A
2 l! P+ B' V9 j |