天空采集插件-傻瓜式让你的网站拥有任意资源(送三个采集规则)
大佬 2021-11-14

写在最前面:插件有两个文件是加密的,里面是爬虫写法和正则写法,如果你害怕不安全,可以自行解密文件,可能需要5块钱左右。

PHP解密网站  http://www.yunlu99.com/

如果在线充值失败,请加站长OO/微信。让站长手动为你充值。,上传文件,即刻解密。

 

说明:插件首发时间2018年。一直免费,未收费过,请放心使用。

采集插件是通过PHP+正则来远程获取目标网页内容,经过本地PHP+正则规则解析处理后存储到服务器的数据库内。

PHP获取整页源码。PHP提取指定内容。正则提取指定内容,这些需要慢慢学,不推荐你了解。很麻烦的。

采集规则与采集界面分离,编辑人员只需了解( [内容] 提取一切  [sky]  不要一切),只需选中自己想要采集的文章列表,就可以像发布文章一样,轻松地完成数据采集操作。

 

第一步:下载附件的插件。解压后-找到并将 sky_collection 文件夹及里面的所有文件,上传到

plugin  目录

 

第二步:网站后台>插件>找到xiuno天空内容采集并安装

 

第三步:采集>添加采集

比如以 https://www.186317.com/lingyi/1/

 

1 主要看网页源码

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

 

2 网址配置

页码使用以下字符做为通配符。

(*)

 

3 如果获取内容带首页各种分类

请在>网址配置>网址中必须包含

分类独家字符(比如  lingyi  )   就不会有这些无意义内容

 

获取网址

源码(从  <ul class="clearfix"><div class="pagebar ta-c"> )

//列表源码

<ul class="clearfix">

<li class="post-list clearfix mb15">

    <a href="https://www.186317.com/lingyi/7227.html" target="_blank"><span class="img-box" data-ratio="16:16"><img src="https://www.186317.com/zb_users/theme//tx_freecms/include/pic.png" alt="点到鬼"></span></a>

<li class="post-list clearfix mb15">
    <a href="https://www.186317.com/lingyi/7182.html" target="_blank"><span class="img-box" data-ratio="16:16"><img src="https://www.186317.com/zb_users/theme//tx_freecms/include/pic.png" alt="演戏"></span></a>

</ul>

//分页源码了

<div class="pagebar ta-c">
                       <a href="https://www.186317.com/lingyi/"><span class="page">‹‹</span></a>
     <span class="page now-page">1</span>

 

 

https://www.186317.com/lingyi/7227.html

 

标题源码

<title>点到鬼_灵异鬼故事_鬼故事之家</title>

标题规则

<title> [内容]</title>

就可以提取

点到鬼_灵异鬼故事_鬼故事之家

 

过滤选项

鬼故事之家 [sky]

就可以让 鬼故事之家 不显示

 

内容源码

<div class="tx-text f-16 mb15">

<p>灵异鬼故事《点到鬼》讲述了点名,大家应该都知道是怎么回事吧。简单的说就是查下人数,看看是不是都齐了,还差谁没有来,基本总在管理较多人的集体中,像是学校,一些企业单位什么的。如果是一个人推着一个小车,去卖煎饼果子,自然不需要点名,鬼段子分享:钥匙,一名保险推销员下班后去超市买过圣诞节送给女友的礼品,他最终买的是一个刻有月亮图案的纯银挂件。出超市后,他看见一个小姑娘在路边哭泣,就过去看怎么回事,突然发现那个小姑娘胸前有一串钥匙。第二天,警方发现小姑娘全身cl地死在街边,试分析原因。您看懂了吗?阅读更多精彩短篇鬼故事请随时关注 鬼故事网站灵异鬼故事栏目!</p></div>

内容规则

<div class="tx-text f-16 mb15"> [内容]</div>

就可以直接提取到

<p>灵异鬼故事《点到鬼》讲述了点名,大家应该都知道是怎么回事吧。简单的说就是查下人数,看看是不是都齐了,还差谁没有来,基本总在管理较多人的集体中,像是学校,一些企业单位什么的。如果是一个人推着一个小车,去卖煎饼果子,自然不需要点名,鬼段子分享:钥匙,一名保险推销员下班后去超市买过圣诞节送给女友的礼品,他最终买的是一个刻有月亮图案的纯银挂件。出超市后,他看见一个小姑娘在路边哭泣,就过去看怎么回事,突然发现那个小姑娘胸前有一串钥匙。第二天,警方发现小姑娘全身cl地死在街边,试分析原因。您看懂了吗?阅读更多精彩短篇鬼故事请随时关注 鬼故事网站灵异鬼故事栏目!</p>

 

特别说明

     [内容]

可以提取一切内容

 

     [sky]

前后接字符(支持正则),代表去掉不显示

 

正则请看

<a(   [^>]")>   [sky]
</a>   [sky]

让所有的<a 内容失效

 ^  正则开头

 

 

保存后>点击>测试

无错就

关于 定时发布

需要你自行挂计划任务才可以

http://你的域名/skycollection-post.htm

 

 

最后说明

高级设置  图片下载-默认是下载图片   推荐改成不下载图片哦

 

[内容]   [sky]   它们的前后都支持任意代码,都支持正则

正则写法教程   http://hm46148.j.h57.site/?thread-104.htm

正则在线测试

https://deerchao.cn/tools/wegester/

 

这是可以提取任意网站内容的(视频/图/文)啥都可以的 

<html>[内容]</html>

喜欢的可以试试哈,很简单的

 

最后再送大家一个 笑话段子采集规则

网址配置

https://m.xiaohua.com/duanzi?page=(*)

获取网址  从

<section class="index-content">

<div id="Pager" class="pagination-wrap">

 

 

内容规则:匹配规则

<div class="grid2"><p class="f36 fonts">[内容]</div>

 

演示网址

http://hm46148.j.h57.site/?forum-7.htm

 

演示截图

 

 

最后再给大家一个红牛电影采集规则

https://www.hongniuzy1.com/?m=vod-type-id-1-pg-(*).html

<div class="xing_vb">

<div class="pages" style="margin-bottom:10px;">

<div id="play_1">[内容]</div>

演示截图

最后于 2021-11-16 被大佬编辑 ,原因:
上传的附件:
最新回复 (32)
全部楼主
  • 大佬 楼主
    2021-11-14 2
    0
    关于用处。可以快速的让你的网站拥有任意资源
  • 一秀十年
    2021-11-14 3
    0
    点赞一个,其实这贴应该加精,写得太详细了,太好了。
  • 一秀十年
    2021-11-14 4
    1

    我想问问collection.php和thread.php文件代码看不了,敢用吗?

  • dysnyl
    2021-11-14 5
    0
    这是小说的采集?
  • 大佬 楼主
    2021-11-15 6
    0
    dysnyl 这是小说的采集?
    可以采集一切的一切的
    内容规则,适配规则
    <html>[内容]</html>
    就可以提取基本上任何网页了
  • 大佬 楼主
    2021-11-15 7
    0
    一秀十年 点赞一个,其实这贴应该加精,写得太详细了,太好了。
    问题是也要站长愿意啊
  • ww99826ww
    2021-11-15 8
    0
    沙发我没有,板凳我没有,板也没有,只好站在后面排队支持! 
  • ww99826ww
    2021-11-15 9
    0
    啊啊啊啊啊啊啊啊啊啊啊啊
  • 一秀十年
    2021-11-15 10
    0
    大佬 如果你有钱,可以解密代码的,可能需要5块钱左右。 另外,插件是2018年发布的了,作者不维护了的 加密部分就是爬虫提取,正则提取写法。

    哦,明白,多谢多谢。
    请教一个[sky]怎么玩,采集过来老是带人家网址
    例如,采集过来标题这样:经典xiunobbs风格主题-修罗社区 - Xiuno BBS - www.xxx.in,怎么用标题过滤选项sky去掉:“-修罗社区 - Xiuno BBS - www.xxx.in”

返回