自己对正则表达式的学习不够深入,只能浅浅的应用到一部分,通过学习和测试算是对正则表达式有了些了解,之前走了一些弯路,用在线调试JAVASCRIPT的正则测试通过胆和PHP的正则表达式还是有区别的,今天暂且记录一下学习到的如何使用PHP正则表达式提取源代码中的title标题和文章具体内容。
PHP使用正则表达式获取标题和文章内容的方法示例:
<?
$title='<title>PHP使用正则表达式获取标题的方法 - PHP博客 - 毛票票</title>';
$title_regex = '/(<title>){1}.+(\/title>)+/i';
preg_match($title_regex, $title, $title_array);
$v_title=$title_array[0];
$v_title = str_replace('<title>', '', $v_title);
$v_title = str_replace('</title>', '', $v_title);
echo $v_title;
echo "<hr>";
echo "<hr>";
echo "<hr>";
$get_htm = '<div class="information-details-msg">
<span class="send-time">发布时间:<span>2023-01-05 17:04:30</span></span>
<span class="comefrom">来源:<span>毛票票</span></span>
<span class="readmath">阅读:<span id="reading_quantity">91</span></span>
<span class="autour">作者:<span>iii</span></span>
<span class="special">栏目:<a style="color:#9EA7B3;" href="/zixun/kf_webkf/"><span>web开发</span></a></span>
</div>
<p class="introduction">这篇文章主要介绍“index.html指的是什么”,在日常操作中,相信很多人在index.html指的是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”index.html指的是什么”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!</p><p> <span class="content_article_viewer_show"></span></p><blockquote><p>index.html是网站的首页文件。index.html的直译意思是导航页面,但是根据相关互联网协议,这个index.html是<a title="服务器" target="_blank" href="https://www.baidu.com/">服务器</a>、浏览器默认的网站首页;index.html文件存储在Web服务器的网站根目录中。</p></blockquote><p><strong>index.html是网站的首页文件。</strong></p><p>HTML是网页文件,也叫超文本文件(HyperTextMarkupLanguage)的后缀,所有的网页文件都是要转化成html文件展示在浏览器里的。HTML是用于超文本文件编写的技术规范,其主要内容就定义用于超文本文件中的标记符号及其作用。</p><p>而index的本毛票票的意思,网站行业也叫导航目录。</p><p><strong>index.html的直译意思是<a title="PHP博客" target="_blank" href="https://www.maopiaopiao.com/">PHP博客</a>www.maopiaopiao.com导航页面,但是根据相关互联网协议,这个index.html是服务器、浏览器默认的网站首页。</strong></p><p>超文本文件(Hypertext)就是指具有超链接功能的文件,它可以将文件中已经定义好的关键字(Keyword),经过鼠标的点取(Click),便可以得到该关键字的相关解释,这种方法使用户使用起来更感舒适。类似于早期使用的WIN32下的HELP文件。</p><p>超文本文件是一种含有特殊标记的文本文件,其作用类似于WPS中的排版标记,超文本文件被保存在WWW服务器上,当用户通过浏览器软件浏览某一超文本文件时,WWW服务器将该超文本文件发送给浏览器,浏览器首先对其中的特殊标记进行解释,然后以特定的方式在用户屏幕上显示出来。</p><p><strong>index.html怎么创建?</strong></p><p>我们可以用 HTML 编辑器或者电脑记事本直接创建。例子如下:</p><p><code><pre class="brush:html;toolbar:false"><!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title></title>
</head>
<body>
</body>
</html></pre></code></p><p>这是网页的基本框架,我们只需在此框架内填入我们想要的内容即可。</p><p><strong>index.html基本结构</strong></p><p>当我们查看index.html文件时,我们可以看到存在一些基本结构,该结构主要在大多数网站的其他页面中使用。</p><ul class=" list-paddingleft-2"><li><p>“菜单”将包含指向网站其他页面的快捷方式。</p></li><li><p>“主要内容”通常包含有关网站的信息以及有关该网站的一些最新或通用或权威性信息。</p></li><li><p>“页脚”可能包含一些社交媒体链接,联系信息,版权信息等。</p></li></ul><p><strong>index.html的位置</strong></p><p>index.html文件存储在Web服务器的网站根目录中。 如果Web服务器是Apache2,则默认路径是/var/www并且网站文件夹名称。 如果Web服务器是IIS,则默认情况下路径为C:\inetpub\sites ,但根据特定的网站配置进行更改。</p><p class="introduction">到此,关于“index.html指的是什么”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!</p> </div>
<div class="tj-read-box">
<div class="tit">推荐阅读:</div>
<ol>
<li>
<a href="/zixun/293768.html">springboot省去web.xml配置的方法是什么</a>
</li>
<li>
<a href="/zixun/293770.html">如何使用spring cloud Bus刷新配置</a>
</li>
</ol>
</div>
<div class="zixun-tj-product adv-bottom"></div>
<div class="information-explain">>';
$message_regex = '/<p\s?(class=\"introduction\">)+(.|\n|\r)*?<p\s?(class=\"introduction\">)+/i';
preg_match($message_regex, $get_htm, $message_array);
$v_message=$message_array[0];
//过滤不要的标签
$v_message = str_replace('<p class="introduction">', '', $v_message);
echo $v_message;
?>