900字范文,内容丰富有趣,生活中的好帮手!
900字范文 > 探究Ptcms小说采集规则

探究Ptcms小说采集规则

时间:2020-03-08 23:22:07

相关推荐

探究Ptcms小说采集规则

1、首页的更新列表页采集 ,新增/首页采集规则

PTCMS内置

[subnovelid] // floor(小说ID/1000)

[novelid] //小说ID

[页码] //列表采集页码

[空白] //空白 包含换行和空格

[内容] //等同于 .+? 匹配之间的任何字符

[数字] // 等同于 \d+ 匹配0-9数字组合

常用正则,以下的自己百度下

.+? //最小匹配 . 除了换行符之外的任意字符,+ 重复一次或一次以上

//? 懒惰模式

\d+ // \d 表示匹配的是数字,+ 表示重复一次或者多次

//* 表示重复零次或者多次

\w+ //[\w]+和\w+没有区别,都是匹配数字和字母下划线的多个字符;

//[\w+]表示匹配数字、字母、下划线和加号本身字符;

\s //\s是指空白,包括空格、换行、tab缩进等所有的空白,而\S刚好相反

\r\n //\n是换行。\r是回车。

[]

表示数组而非排列,即不按固定次序位置排列;

在[]内的字符可以任意次序出现。

[ABC]+

可以匹配"AAABBBCCC,BBBAAACCC,BACCBACAACBAC,…",不是一定按固定A…B…C…的次序排列。

[\w./-+]+

是匹配\w [0-9a-zA-Z_] 或 . 或 / 或 - 或 + 字符;

在[./-+]内均表示字符本身;

在[]+外表示{1,}至少1次或多次;

在[.]内点,不是任意字符的意思,就是匹配点.字符本身,点.可以不需要加反斜杠.。

在[]内特殊字符,表示匹配特殊字符本身,不需要加反斜杠,

在[]外特殊字符,表示匹配特殊字符本身,必须要加反斜杠。

()用于捕获匹配的字符串,比如:a(.?)b捕获a和b之间的任何字符(除了换行符外)

而且()还用于括起正则表达式中的小组,比如:^(a|b).$匹配以a或b开头的任何字符串

另外,(?:pattern)是一个非捕获匹配,就是匹配但不捕获字符串

(?<=pattern)逆序肯定环视,表示所在位置左侧能够匹配pattern

(?<!pattern)逆序否定环视,表示所在位置左侧不能匹配pattern

(?=pattern)顺序肯定环视,表示所在位置右侧能够匹配pattern

(?!pattern)顺序否定环视,表示所在位置右侧不能匹配pattern

这些都和()是不同的概念,不要混淆

[]用于定义匹配的字符集或字符范围,比如:[a-z]匹配一个英文小写字母范围从a到z

{}用于定义匹配的次数,比如:a{1,}匹配a至少一次

(1)采集地址

列表页地址:

信息页地址:

血红小说网

<h2>好看的玄幻小说最近更新列表</h2><ul><li><span class="s2">《<a href="/5_5875/" target="_blank">山村最强小农民</a>》</span><span class="s3"><a href="/5_5875/18285280.html" target="_blank">第三百四十七章 路修好了</a>(10-04)</span><span class="s5">赵小刚</span></li><li><span class="s2">《<a href="/5_5631/" target="_blank">绝品小农民</a>》</span><span class="s3"><a href="/5_5631/18285279.html" target="_blank">第三百四十七章路修好了</a>(10-04)</span><span class="s5">一目尽是沧桑</span></li><li><span class="s2">《<a href="/8_8246/" target="_blank">总裁,来吧!</a>》</span><span class="s3"><a href="/8_8246/18285275.html" target="_blank">第327章 小白鼠</a>(10-04)</span><span class="s5">壶聿</span></li>

88读书

<div class="booklist"><h1>玄幻魔法</h1><ul><li class="t"><span class="sm">小说名称</span><span class="zj">最新章节</span><span class="zz">作者</span><span class="zs">字数</span><span class="sj">更新</span><span class="zt">状态</span><span class="fs">关注</span></li><li><span class="sm"><a href="/xiaoshuo/98/98218/"><b>不灭修罗</b></a></span><span class="zj"><a href="/xiaoshuo/98/98218/40370860.html">第一千二百九十一章执法守护者出面</a></span><span class="zz">冷面加糖</span><span class="zs">9360650字</span><span class="sj">18-10-03</span><span class="zt">连载中</span><span class="fs">47人</span></li><li><span class="sm"><a href="/xiaoshuo/103/103631/"><b>英雄联盟之我最嚣张</b></a></span><span class="zj"><a href="/xiaoshuo/103/103631/40370859.html">第534章 邀请</a></span><span class="zz">西瓜君1</span><span class="zs">3645692字</span><span class="sj">18-10-03</span><span class="zt">连载中</span><span class="fs">6人</span></li><li><span class="sm"><a href="/xiaoshuo/99/99117/"><b>大道诛天</b></a></span><span class="zj"><a href="/xiaoshuo/99/99117/40370855.html">第八百六十九章 集体进阶</a></span><span class="zz">热乎冰棍儿</span><span class="zs">6849454字</span><span class="sj">18-10-03</span><span class="zt">连载中</span><span class="fs">69人</span></li>

顶点小说

<div id="newscontent"><div class="l"><h2> 最近更新小说列表</h2><ul><li><span class="s1">[玄幻奇幻]</span><spanclass="s2"><a href="/xs/98/98785/"target="_blank">圣尊之门</a></span><spanclass="s3"><a href="/xs/98/98785/424589.html"target="_blank">第一百一十八章 自断一臂,饶...</a></span><spanclass="s4">引玉</span><spanclass="s5">10-04</span></li><li><span class="s1">[玄幻奇幻]</span><spanclass="s2"><a href="/xs/109/109510/"target="_blank">不朽神帝</a></span><spanclass="s3"><a href="/xs/109/109510/735249.html"target="_blank">第1642章 十二天都化魂阵</a></span><spanclass="s4">项华</span><spanclass="s5">10-04</span></li><li><span class="s1">[女生频道]</span><spanclass="s2"><a href="/xs/119/119748/"target="_blank">御天神凰</a></span><spanclass="s3"><a href="/xs/119/119748/457042.html"target="_blank">第二百零九章 身世</a></span><spanclass="s4">迷之萌物</span><spanclass="s5">10-04</span></li><li><span class="s1">[都市言情]</span><spanclass="s2"><a href="/xs/117/117275/"target="_blank">火爆宗师</a></span><spanclass="s3"><a href="/xs/117/117275/496014.html"target="_blank">第195章 灵猫</a></span><spanclass="s4">瀚海藏鹰</span><spanclass="s5">10-04</span></li>

31xs首页

<div class="l"><h2>最近更新小说列表</h2><ul><li><span class="s1">[灵异小说]</span><span class="s2"><a href="/114/114468/" target="_blank">老公太放肆:娇妻要造反</a></span><span class="s3"><a href="/114/114468/38809832.html" target="_blank">第43章 暗恋的那几年3</a></span><span class="s4">天下斗笔</span><span class="s5">10-04</span></li><li><span class="s1">[都市小说]</span><span class="s2"><a href="/114/114495/" target="_blank">贴身特工</a></span><span class="s3"><a href="/114/114495/38809833.html" target="_blank">第九十一章 怪才导演</a></span><span class="s4">特工熊猫</span><span class="s5">10-04</span></li><li><span class="s1">[武侠小说]</span><span class="s2"><a href="/114/114499/" target="_blank">空竹断月</a></span><span class="s3"><a href="/114/114499/38809830.html" target="_blank">八章 箭上弦 太子挑衅</a></span><span class="s4">谭小漾</span><span class="s5">10-04</span></li><li><span class="s1">[都市小说]</span><span class="s2"><a href="/114/114497/" target="_blank">杂家弟子在都市</a></span><span class="s3"><a href="/114/114497/38809827.html" target="_blank">第三十二章 反追杀</a></span><span class="s4">尺寒</span><span class="s5">10-04</span></li>

目录页地址:

(2)更新列表规则

<span class="s2">《<a href="/5_5875/" target="_blank">山村最强小农民</a>》</span><span class="sm"><a href="/xiaoshuo/98/98218/"><b>不灭修罗</b></a></span><span class="s2"><a href="/xs/119/119748/" target="_blank">御天神凰</a></span><span class="s2"><a href="/114/114497/" target="_blank">杂家弟子在都市</a></span>

小说名称:

小说书号:

“s2”>.+?href=".+?/\d+/(\d+)/".+?blank">.+?

<span class="s3"><a href="/5_5875/18285280.html" target="_blank">第三百四十七章 路修好了</a>(10-04)</span><span class="zj"><a href="/xiaoshuo/98/98218/40370860.html">第一千二百九十一章执法守护者出面</a></span><span class="s3"><a href="/xs/119/119748/457042.html" target="_blank">第二百零九章 身世</a></span><span class="s3"><a href="/114/114499/38809830.html" target="_blank">八章 箭上弦 太子挑衅</a></span>

更新标识:

(3)信息页规则

小说名称:

血红小说网

</div><a href="/">血红小说网</a> &gt; <a href="/xuanhuan/1.html">玄幻小说</a> &gt; 山村最强小农民最新章节列表</div><div id="maininfo"><div id="info"><h1>山村最强小农民</h1><p>作&nbsp;&nbsp;&nbsp;&nbsp;者:赵小刚</p><p>动&nbsp;&nbsp;&nbsp;&nbsp;作:<a href="javascript:;" onClick="showpop('/modules/article/addbookcase.php?bid=5875&ajax_request=1');">加入书架</a>, <a href="javascript:;" onClick="showpop('/modules/article/uservote.php?id=5875&ajax_request=1');">投推荐票</a>, <a href="#footer">直达底部</a></p><p>最后更新:-10-03 21:14</p><p>下&nbsp;&nbsp;&nbsp;&nbsp;载:( <a href="/modules/article/txtarticle.php?id=5875">TXT</a>,CHM,UMD,JAR,APK,HTML )</p></div><div id="intro"><p>大哥死的突然,留下一个仙女一般的嫂子让赵小刚照顾,但是村里人都说她是扫把星,克夫命,赵小刚却不信邪,于是……</p></div></div><div id="sidebar"><div id="fmimg"><script src="/modules/article/52mb_uptime.php?id=5875&type=img"></script><span class="b"></span></div></div>

88读书

<meta property="og:type" content="novel"><meta property="og:title" content="不灭修罗"><meta property="og:description" content=" 三界众生,我为修罗。战天斗地,不死不灭!一位废物少年偶得修罗传承,从此走上了逆天之路。"><meta property="og:image" content="/98/98218/98218s.jpg"><meta property="og:novel:category" content="玄幻魔法"><meta property="og:novel:author" content="冷面加糖"><meta property="og:novel:book_name" content="不灭修罗"><meta property="og:novel:read_url" content="/xiaoshuo/98/98218/"><meta property="og:url" content="/xiaoshuo/98/98218/"><meta property="og:novel:status" content="连载中"><meta property="og:novel:update_time" content="10-04"><meta property="og:novel:latest_chapter_name" content="第一千二百九十三章试仙石开启"><div class="place">当前位置:<a href="/">88读书网</a> > <a href="/sort1/1/">玄幻魔法</a> > 不灭修罗</div><div class="jieshao"><div class="lf"><img src="/98/98218/98218s.jpg" alt="不灭修罗" onerror="this.src='/modules/article/images/nocover.jpg'"></div><div class="rt"><h1>不灭修罗</h1><div class="msg"><em>作者:冷面加糖 </em><em>状态:连载中 </em><em>更新时间:10-04</em><em>最新章节:<a href="40372978.html">第一千二百九十三章试仙石开启</a></em></div><div class="info"><a href="#footer" rel="nofollow">直达底部</a><a href="javascript:Ajax.Request('/modules/article/addbookcase.php?bid=98218',{onComplete:function(){alert(this.response.replace(/<br[^<>]*>/g,'\n'));}});" rel="nofollow">加入书架</a><a href="/newmessage.php?tosys=1&title=不灭修罗-- 第一千二百九十三章试仙石开启 章节出错啦!&content=错误章节: 第一千二百九十三章试仙石开启 ++++ 举报原因如下: " target="_blank" rel="nofollow">错误举报</a>投推荐票:</div><input type="text" name="uservote_num" id="uservote_num" value="1" maxlength="3" onchange="if(/\D/.test(this.value)){alert('只能输入数字');this.value='';}"><div class="vote"><a id="a_uservote" href="javascript:;" onclick="if(1){Ajax.Tip(event, '/modules/article/uservote.php?id=98218&num='+document.getElementById('uservote_num').value,3000);}else{alert('亲,需要登陆才能使用本功能哟');}" rel="nofollow">确定</a></div><div class="intro">三界众生,我为修罗。战天斗地,不死不灭!一位废物少年偶得修罗传承,从此走上了逆天之路。</div></div><div class="aside"><script>gonggao();</script></div></div>

顶点小说

<meta property="og:type" content="novel"/><meta property="og:title" content="圣尊之门"/><meta property="og:description" content="天地不仁,囚万物于牢笼。不甘做天地囚徒的太古神魔合力征天,一败涂地。遂,设神魔之门,布万古之局。主角穿越而来,记忆残缺,又浴血身死,圣魂重生,且看他手持神魔圣剑、身入神魔之门,一剑把苍穹刺个窟窿。Ps:这就是一个穿越者倒霉身死之后,再次重生,一人一剑一柄枪…"/><meta property="og:image" content="http://www.23us.tv/BookFiles/BookImages/shengzunzhimen.jpg"/><meta property="og:novel:category" content="玄幻奇幻"/><meta property="og:novel:author" content="引玉"/><meta property="og:novel:book_name" content="圣尊之门"/><meta property="og:novel:read_url" content="http://www.23us.tv/xs/98/98785/"/><meta property="og:url" content="http://www.23us.tv/xs/98/98785/"/><meta property="og:novel:status" content="连载"/><meta property="og:novel:update_time" content="/10/5 7:32:49"/><meta property="og:novel:latest_chapter_name" content="第一百一十九章 饶我不死的都死了"/><meta property="og:novel:latest_chapter_url" content="http://www.23us.tv/xs/98/98785/424658.html"/><div id="maininfo"><div id="info"><h1>圣尊之门</h1><p>作&nbsp;&nbsp;者:引玉</p><p>动&nbsp;&nbsp;作:<a rel="nofollow" href="javascript:;" onclick="addBookCase(98785);">加入书架</a>、<a rel="nofollow" href="#footer">直达底部</a></p><p>最后更新:/10/5 7:32:49</p><p>最新更新:<a href="/xs/98/98785/424658.html">第一百一十九章 饶我不死的都死了</a></p></div><div id="intro">天地不仁,囚万物于牢笼。不甘做天地囚徒的太古神魔合力征天,一败涂地。遂,设神魔之门,布万古之局。主角穿越而来,记忆残缺,又浴血身死,圣魂重生,且看他手持神魔圣剑、身入神魔之门,一剑把苍穹刺个窟窿。Ps:这就是一个穿越者倒霉身死之后,再次重生,一人一剑一柄枪…</div></div><div id="sidebar"><div id="fmimg"><img alt="圣尊之门" src="/BookFiles/BookImages/shengzunzhimen.jpg" width="120" height="150" /><span class="b"></span></div></div>

31xs首页

<meta property="og:type" content="novel"/><meta property="og:title" content="绝品邪少"/><meta property="og:description" content="谭笑笑说:我是极品美女!彭莹诗说:我是极品熟女!尹宝儿说:我是极品萝莉!上官无道说:我还是极品公子呢……叶潇震撼登场:吵什么吵,少爷才是主角,少爷的口号是践踏一切极品,只做人间绝品!"/><meta property="og:image" content="/img/114/114495/114495s.jpg"/><meta property="og:novel:category" content="都市"/><meta property="og:novel:author" content="陨落星辰"/><meta property="og:novel:book_name" content="绝品邪少"/><meta property="og:novel:read_url" content="/114/114495/"/><meta property="og:url" content="/114/114495/"/><meta property="og:novel:status" content="完结"/><meta property="og:novel:update_time" content="-10-04 22:07:14"/><div id="maininfo"><div id="info"><h1>绝品邪少</h1><p>作&nbsp;&nbsp;&nbsp;&nbsp;者:陨落星辰</p><p>动&nbsp;&nbsp;&nbsp;&nbsp;作:<a href="javascript:void(0);" onclick="addBookcase(114495,0)">加入书架</a>, <a href="#footer">直达底部</a>, <a href="javascript:void(0);" id="report" articleid="114495">错误反馈</a></p><p>更&nbsp;&nbsp;&nbsp;&nbsp;新:-10-04 22:07:14</p><p>最&nbsp;&nbsp;&nbsp;&nbsp;新:<a href="/114/114519/38824274.html">玛雅征服史外传</a></p></div><div id="intro">谭笑笑说:我是极品美女!彭莹诗说:我是极品熟女!尹宝儿说:我是极品萝莉!上官无道说:我还是极品公子呢……叶潇震撼登场:吵什么吵,少爷才是主角,少爷的口号是践踏一切极品,只做人间绝品!</div></div><div id="sidebar"><div id="fmimg"><img alt="绝品邪少" src="/img/114/114495/114495s.jpg" width="120" height="150" /><span class="a" ></span></div></div> </div>

小说作者:

小说简介:

小说封面:

小说分类:

小说进度:

(4)目录页规则

章节ID:

血红小说网

<div class="box_con"><div id="list"><div class="volume">山村最强小农民 正文<span></span></div><ul class="chapters"><li class="chapter"><a href="/5_5875/13267068.html">第2章/</a></li><li class="chapter"><a href="/5_5875/13267075.html">第3章/</a></li><li class="chapter"><a href="/5_5875/13267083.html">第4章/</a></li>

88读书

<div class="mulu"><ul><li><a href="33794984.html">第一章废物</a></li><li><a href="33794985.html">第二章修罗传承</a></li><li><a href="33794987.html">第三章突破先天</a></li>

顶点小说

<div class="box_con"><div id="list"><dl><dt>《圣尊之门》最新章节(提示:已启用缓存技术,最新章节可能会延时显示,登录书架即可实时查看。)</dt><dd> <a style="" href="424658.html">第一百一十九章 饶我不死的都死了</a></dd><dd> <a style="" href="424589.html">第一百一十八章 自断一臂,饶你不死</a></dd><dd> <a style="" href="424555.html">第一百一十七章 三枪</a></dd><dd> <a style="" href="424526.html">第一百一十六章 名师</a></dd>

31xs首页

<div class="box_con"><div id="list"><dl> <dt>绝品邪少最新章节 (本站开启缓存,刚刚更新的章节书架实时显示。)</dt> <dt>绝品邪少全部章节</dt><dd><a href="javascript:void(0);" onclick="addBookcase(114495,0)">加入书架</a></dd><dd><a href="javascript:void(0);" id="report" articleid="114495">错误反馈</a></dd><dt>正文</dt><dd><a href="/114/114495/38806778.html">第一章 谁睡了我</a></dd><dd><a href="/114/114495/38806849.html">第三章 亲密接触</a></dd><dd><a href="/114/114495/38806915.html">第四章 小保安</a></dd><dd><a href="/114/114495/38806982.html">第五章 冤家路窄</a></dd>

章节名称:

章节地址:

(5)章节页规则

接口URL:

内容规则:

血红小说网

<div id="content">&nbsp;&nbsp;&nbsp;&nbsp;烈日炎炎,天空之上犹..........................立刻心中有了一个大胆的主意。</div><div class="bottem2">

88读书

<div class="yd_text2">&nbsp;&nbsp;&nbsp;&nbsp;“爷爷,你怎么样了?你别吓我啊!”<br />..........................</div><div class="yd_ad1">

顶点小说

</div><div style="text-align: center"><script>read2();</script></div><div id="content"><br/>&lt;span&nbsp;class="Banner"&gt;&nbsp;亲&nbsp;~&nbsp;本站域名:"166小说"的简写谐音,很好记哦!&nbsp;好看的小说&lt;/span&gt;<br/>&lt;strong&nbsp;class="Book_Hot"&gt;强烈推荐:&lt;/strong&gt;&nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;“老子居然又重生了?”陈玄机站在铜镜前,里面是一张略显稚嫩的脸孔,但剑眉星目,鼻若悬胆,模样甚是好看,..........................</div><div class="bottem2">

31xs首页

<div id="content"> &nbsp;<p> 时间总是飞快的,..........................</div>

2,测试后内容不对

(?:\<\!\[CDATA\[)?[内容](?:\]\]\>)?没有写对 [内容]为空

vim /usr/share/wwwphp/ptcms/application/rule/model/collect.php$this->progress("《{$zym_31}》添加新书成功");$this->progress("《{$zym_31}》开始处理章节");;$this->progress("《{$zym_31}》需要处理章节数目:" . count($zym_20));$this->progress("《{$zym_31}》更新小说完成");//ok$this->progress("《{$zym_50['data']['novelname']}》添加新书成功,书号{$zym_30}"); $this->progress("《{$zym_50['data']['novelname']}》添加日志成功"); $zym_31 = $this->model->flush('novelsearch_info', $zym_21['novelid'], 'novel.name'); print_r($zym_31); var_dump($zym_31); vim /usr/share/wwwphp/ptcms/ptcms/core/model.php//刷新public function flush($table, $id, $field = ''){$this->rm($table,$id);return $this->get($table,$id.$field);}//$zym_31得到是一个采集信息数组vim /usr/share/wwwphp/ptcms/application/rule/model/collect_base.phppublic function progress($zym_6, $zym_7 = 'success', $zym_11 = false) { if (empty($_GET['backRun'])) { switch ($zym_7) { case 'success': $zym_13 = 'green'; break; case 'error': $zym_13 = 'red'; break; case 'warning': $zym_13 = "orangered"; break; case 'info': $zym_13 = '#333'; break; default: $zym_13 = $zym_7; } $zym_12 = $zym_11 ? 'bold' : 'normal'; echo "<span style='color:{$zym_13};font-weight:{$zym_12}'>{$zym_6}</span><br />"; @ob_flush(); @flush(); } else { log::record($zym_6); } }

错误原因是

vim /usr/share/wwwphp/ptcms/application/rule/model/collect.php$zym_31 = $this->model->flush('novelsearch_info', $zym_21['novelid'], 'novel.name'); //这里得到的是信息数组改为$zym_31 = $this->model->get('novelsearch_info', $zym_21['novelid'], 'novel.name'); //这里得到的是name

按书号采集成功!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。