php 正则表达式匹配所有字符(可匹配换行)

 更新时间:2016年11月25日 17:42  点击:1910
对于很多同学和我一样觉得匹配所有字符串我们可能使用.*来获取了,但是测试发现如果在一行没有问题,如果有换行就不行了,那么要如何处理。

对正则我是一知半解,我对正则的理念就是,能用就行!

对于所有字符,我一开始的理解就是 .*

后来GOOGLE了一下,才知道.*连在一起就意味着任意数量的不包含换行的字符。

所以可以使用 [\s\S]* 它的意思是任意空白字符和非空白字符。同理,也可以用 “[\d\D]*”、“[\w\W]*” 来表示。 d和D,w和W,s和S都是反义,加起来就是全部字符了。

注意:写在文本中的n是不会自动视为换行符的,测试$_="asdfnasdf";s/./-/;print;即可明白


补充

匹配中文字符的正则表达式: [\u4e00-\u9fa5]
匹配双字节字符(包括汉字在内):[^\x00-\xff]
匹配空行的正则表达式:\n[\s| ]*\r
匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正则表达式:(^\s*)|(\s*$)

正则字母与数字是php正则表达式中最为简单也是常用的一个功能了,如果是单数字我们只要判断intval就可以了,如果是单字母也可以简单的W就可以判断了,但是组合的话有一点不一样,下面我们一起来学习一下吧。

数字正则过滤

 代码如下 复制代码

if(preg_match("/^\d*$/",$yebihai))  
echo('是数字');
else 
echo('不是数字');


或者用函数

if(is_numeric($yebihai))
echo('是数字');
else
echo('不是数字');

这两种方法的区别是  is_numeric小数也会认为是数字,而前面正则会把小数点当作字符。

正则表达式如下 数字和字母 :

 代码如下 复制代码

$password='abc12';
if(!preg_match("/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i",$password)){
 echo '密码必须由数字和字母的组合而成';
}

如果要限制长度6-15位的英文字符和数字

只要加个strlen来进行判断就可以了 如下$plen<6||$plen>15

 代码如下 复制代码

$password='abc123';
$plen=strlen($password);
if(!preg_match("/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i",$password)||$plen<6||$plen>15){
 echo '密码必须为6-15位的数字和字母的组合';
}

其实我们还可以直接使用正则来限制长度

关于长度我们可参考一下规则.

验证n位的数字:^\d{n}$
验证至少n位数字:^\d{n,}$
验证m-n位的数字:^\d{m,n}$

上面是数字了,我们组合验证也只要在后面加一个{}就可以了。

 代码如下 复制代码

$password='abc123';
$plen=strlen($password);
if(!preg_match("/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*{8,}$/i",$password)||$plen<6||$plen>15){
 echo '密码必须为8位的数字和字母的组合';
}

//长度是8或更多   其实就是在正则后面加了一句{8,}就可以了,

php利用preg_match_all()正则获取字符串中指定参数链接地址很简单的,我们只要配合正则规则就可以实现了我们想要的结果了,下面看一个例子,非常的简单。

程序代码

<?php
 $html = <<<HTML
  <a href="http://www.111cn.net /?source=2008hao123banner">a1</a>
  <a href="http://www.111cn.net /?source=2009hao123banner">a2</a>
HTML;

 // echo $html;

$m = array();
preg_match_all("|<a href=\"http://www.111cn.net /\?source=(\d+)hao123banner\">(.*?)</a>|",$html,$m);

print_r($m);

运行结果

Array
(
    [0] => Array
        (
            [0] => <a href="http://www.111cn.net /?source=2008hao123banner">a1</a>
            [1] => <a href="http://www.111cn.net /?source=2009hao123banner">a2</a>
        )

    [1] => Array
        (
            [0] => 2008
            [1] => 2009
        )

    [2] => Array
        (
            [0] => a1
            [1] => a2
        )

)

正则提取页面指定内容非常的简单我们可以通过preg_match执行正则表达式来实现了,下面整理了一些例子,希望对各位朋友会带来帮助哦。

例子代码如下,可常用于采集哦、

 代码如下 复制代码


1、获取页面标题

//提取标题
            preg_match('/<title>(?<title>.*?)<\/title>/i', $html, $titleArr);
            $title = $titleArr['title'];
2、获取body主体内容,并将背景图片提取出来替换成其他图片地址

/**
 * 获取BODY主体区域内容
 * @param $html
 * @param $urlRoot
 * @return mixed
 */
function getBody($html,$urlRoot = null){
    //提取BODY主体
    preg_match('/<!--body-->(.*?)<!--body-->/is ', $html, $bodyArr);
    if(!$bodyArr){
        preg_match('/<body.*?>(.*?)<\/body>/is ', $html, $bodyArr);
    }
    $body = $bodyArr[1];
    //替换img文件
    $body =  preg_replace('/(<[img|IMG].*src=[\'|"])(\.\.\/)*(img.[^\'||^"]+)/',"$1$urlRoot$3",$body);
    //替换html文件内的css背景图片
    $body =  preg_replace('~\b(background(-image)?\s*:(.*?)\(\s*[\'|"]?)(\.\.\/)*(img.*?)?\s*\)~i',"$1$urlRoot$5)",$body);
    return $body;
}
3、提取页面Description内容

function getDescription($html){
    // Get the 'content' attribute value in a <meta name="description" ... />
    $matches = array();
 
    // Search for <meta name="description" content="Buy my stuff" />
    preg_match('/<meta.*?name=("|\')description("|\').*?content=("|\')(.*?)("|\')/i', $html, $matches);
    if (count($matches) > 4) {
        return trim($matches[4]);
    }
 
    // Order of attributes could be swapped around: <meta content="Buy my stuff" name="description" />
    preg_match('/<meta.*?content=("|\')(.*?)("|\').*?name=("|\')description("|\')/i', $html, $matches);
    if (count($matches) > 2) {
        return trim($matches[2]);
    }
 
    // No match
    return null;
}
4、替换css文件的背景图片地址

/**
 * 获取CSS内容
 * @param $cssCnt
 * @param $urlRoot
 * @return mixed
 */
function getCss($cssCnt,$urlRoot =null){
    //匹配包含 img文件夹的相对路径图片 (含义绝对路径的不包含在其中)
    //匹配替换不一定准确,因为只是将 含义 ../ 的地址转为url 而没有考虑 ../../ 之类的层级关系
    $css =  preg_replace('~\b(background(-image)?\s*:(.*?)\(\s*[\'|"]?)(\.\.\/)*(img.*?)?\s*\)~i',"$1$urlRoot$5)",$cssCnt);
    //添加css前缀
    $css =  preg_replace('/\b.(.*?)[,|{]/',"pat .$0",$cssCnt);
    //TODO 压缩css
    return $css;
}


 

从上面例子来看其实都是非常的简单就是批有规律的标签为开始与结束节点,这样我们可以获取这两个字符之类的内容也就是我们要提取的内容了哦,只是在中间有字符或空格的一些处理了哦。

正则表达式是一篇艺术了,下面我来给各位朋友详细总结了在我们开发应用中正则表达式的一些例子,包括了常用的函数与常用的例子。

正则语法规则

    我们先介绍三个东西,然后可以进行简单的例子了。
一、定界符    "/" 左斜线
php采用左斜线作为定界符,规定规则的边界,成对出现,两个定界符之间的内容就是需要被匹配的规则

二、元字符---出现模式类

匹配方式,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。
比如出现一次,出现多于一次,出现多次,没有出现。等等。
常用的有:
    +     1次或多次
    *     0次或1次或多次
    ?    0次或1次
  {2,6}   2-6次
   {2}    恰巧2次
   {3,}   至少3次,>=3

三、元字符---特定字符类

代表一个特定的字符
\s     空白字符(单个空格符、tab键和换行符)
\S     非空白字符
\d     数字(单个 0到9)
\w     字母,数字或下划线字符
\W     非(字母,数字或下划线字符)
 .     除换行符之外的所有字符


1. preg_match()函数

函数原型:int preg_match (string $pattern, string $content [, array $matches])
preg_match ()函数在$content字符串中搜索与$pattern给出的正则表达式相匹配的内容。如果提供了$matches,则将匹配结果放入其 中。$matches[0]将包含与整个模式匹配的文本,$matches[1]将包含第一个捕获的与括号中的模式单元所匹配的内容,以此类推。该函数只 作一次匹配,最终返回0或1的匹配结果数。代码6.1给出

preg_match()函数在字符串中搜索模式,如果存在则返回true,否则返回false

 代码如下 复制代码

$pattern='/php/';
$str='111cn.net';
echo preg_match($pattern,$str);

输出结果:1

2. preg_grep()函数

preg_grep()函数搜索数组中的所有元素,返回由与某个模式匹配的所有元素组成的数组

 代码如下 复制代码

$pattern='/p$/';
$strArray=array('asp','php','jsp','python','ruby');
print_r(preg_grep($pattern,$strArray));

输出结果:
 Array
(
 [0] => asp
 [1] => php
 [2] => jsp
)

3. preg_match_all()函数

preg_match_all()函数在字符串中匹配模式的所有出现,然后将所有匹配到的全部放入数组

 代码如下 复制代码

<?php
 
//preg_match("正则表达式","字符串")用于在字符串中查找匹配项
 
$email = "987044391@qq.com";
if (preg_match("/^([a-zA-Z0-9])+([.a-zA-Z0-9_-])*@([.a-zA-Z0-9_-])+([.a-zA-Z0-9_-]+)+([.a-zA-Z0-9_-])$/",$email)){
 echo '匹配成功<hr />';
}else {
 echo '匹配失败<hr />';
}
 
//preg_quote("字符串") 在每个有正则表达式语法前面加入一个转义字符即\
 
$str = "php点点通是一个学习php的网站,(⊙o⊙)…";
echo preg_quote($str);
echo "<hr />";
 
//preg_split("正则","字符串")分割字符串
$php = "+php++点点通++++是好网站";
$field = preg_split("/\+{1,}/",$php);
foreach($field as $f){
 echo $f." ";
}
echo "<hr />";
//preg_grep("正则","字符串") 与数组匹配后返回新数组
$phpddt = array("php点点通","php100","呵呵","hahaha","phpchina");
$item = preg_grep("/^php/",$phpddt);
print_r($item);
 
echo "<hr />";
//preg_replace("正则","替换内容","原字符串")    很重要,很常用
$a = "欢迎光临http://www.111cn.net/";  //给http开头的加上超链接
echo preg_replace("/http:\/\/(.*)\//","<a href=\"\${0}\">\${0}</a>","$a");
 
?>

4. preg_quote()函数

preg_quote()函数在每个对于正则表达式语法而言有特殊含义的字符前插入一个反斜线。

echo preg_quote('苹果的价格是:$5/千克');

输出结果:苹果的价格是:\$5/千克

5. preg_replace()函数

preg_replace()函数搜索到所有的匹配,然后替换成想要的字符串返回

 代码如下 复制代码

$pattern='/php[1-5]/';
$str='php1php2php3php4php5php6php7php8';

echo preg_replace($pattern,'PHP',$str);

输出结果:PHPPHPPHPPHPPHPphp6php7php8

6. preg_split()函数

preg_split()函数以不区分大小写的方式分割字符串,将所得到的字串组成数组并返回

 代码如下 复制代码

$pattern='/[\.@]/';
$str='feng.yingyuan@sina.com.cn';

print_r(preg_split($pattern,$str));

输出结果:
Array
(
 [0] => feng
 [1] => yingyuan
 [2] => sina
 [3] => com
 [4] => cn
)


 

ereg()和eregi()

ereg()是POSIX扩展库中正则表达式的匹配函数。eregi()是ereg()函数的忽略大小写的版 本。二者与preg_match的功能类似,但函数返回的是一个布尔值,表明匹配成功与否。需要说明的是,POSIX扩展库函数的第一个参数接受的是正则 表达式字符串,即不需要使用分界符。例如,代码6.2是一个关于文件名安全检验的方法。
代码6.2 文件名的安全检验

 代码如下 复制代码

<?php
$username = $_SERVER['REMOTE_USER'];
$filename = $_GET['file'];
//对文件名进行过滤,以保证系统安全
if (!ereg('^[^./][^/]*$', $userfile))
{
die('这不是一个非法的文件名!');
}
//对用户名进行过滤
if (!ereg('^[^./][^/]*$', $username))
{
die('这不是一个无效的用户名');
}
//通过安全过滤,拼合文件路径
$thefile = "/home/$username/$filename";
?>

通常情况下,使用与Perl兼容的正则表达式匹配函数perg_match(),将比使用ereg()或eregi()的速度更快。如果只是查找一个字符串中是否包含某个子字符串,建议使用strstr()或strpos()函数

preg_replace()

函数原型:mixed preg_replace (mixed $pattern, mixed $replacement, mixed $subject [, int $limit])
preg_replace较ereg_replace的功能更加强大。其前三个参数均可以使用数组;第四个参数$limit可以设置替换的次数,默认为全部替换。代码6.7是一个数组替换的应用实例

 代码如下 复制代码

<?php
//字符串
$string = "Name: {Name}<br>/nEmail: {Email}<br>/nAddress: {Address}<br>/n";
//模式
$patterns =array(
"/{Address}/",
"/{Name}/",
"/{Email}/"
);
//替换字串
$replacements = array (
"No.5, Wilson St., New York, U.S.A",
"Thomas Ching",
"tom@emailaddress.com",
);
//输出模式替换结果
print preg_replace($patterns, $replacements, $string);
?>

[!--infotagslink--]

相关文章

  • PHP正则表达式取双引号内的内容

    取双引号内的内容我们如果一个字符串中只有一个可以使用explode来获得,但如果有多个需要使用正则表达式来提取了,具体的例子如下。 写程序的时候总结一点经验,如何只...2016-11-25
  • 一个关于JS正则匹配的踩坑记录

    这篇文章主要给大家介绍了一个关于JS正则匹配的踩坑记录,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2021-04-13
  • PHP正则表达式之捕获组与非捕获组

    今天遇到一个正则匹配的问题,忽然翻到有捕获组的概念,手册上也是一略而过,百度时无意翻到C#和Java中有对正则捕获组的特殊用法,搜索关键词有PHP时竟然没有相关内容,自己试了一下,发现在PHP中也是可行的,于是总结一下,分享的同...2015-11-08
  • php 验证只能输入汉字、英语、数字的正则表达式

    正则表达式是一门非常有用的并且进行模糊判断的一个功能了,我们下面来看通过正则来验证输入汉字、英语、数字,具体如下。 收藏了正则表达式。可以验证只能输入数...2016-11-25
  • java正则表达式判断前端参数修改表中另一个字段的值

    这篇文章主要介绍了java正则表达式判断前端参数修改表中另一个字段的值,需要的朋友可以参考下...2021-05-07
  • 常用的日期时间正则表达式

    常用的日期时间正则表达式 下面收藏了大量的日期时间正则匹配函数,包括分钟,时间与秒都能达到。 正则表达式 (?n:^(?=d)((?<day>31(?!(.0?[2469]|11))|30(?!.0?2)|29(...2016-11-25
  • PHP正则表达式匹配验证提取网址URL实例总结

    网址规则是可寻的,所以我们可以使用正则表达式来提取字符串中的url地址了,下面一起来看看小编整理的几个PHP正则表达式匹配验证提取网址URL实例. 匹配网址 URL 的...2016-11-25
  • 正则表达式中两个反斜杠的匹配规则详解

    这篇文章主要介绍了正则表达式中两个反斜杠的匹配规则,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-05-07
  • JS中使用正则表达式g模式和非g模式的区别

    这篇文章给大家详细介绍了JS中使用正则表达式g模式和非g模式的区别,非常不错,具有参考借鉴价值,需要的朋友参考下吧...2017-04-03
  • C#正则表达式使用方法示例

    这篇文章主要介绍了C#正则表达式使用方法,大家参考使用...2020-06-25
  • 常用C#正则表达式汇总介绍

    c#正则表达式,用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。...2020-06-25
  • JavaScript利用正则表达式替换字符串中的内容

    本文主要介绍了JavaScript利用正则表达式替换字符串中内容的具体实现方法,并做了简要注释,便于理解。具有一定的参考价值,需要的朋友可以看下...2017-01-09
  • 一文秒懂python正则表达式常用函数

    这篇文章主要介绍了python正则表达式常用函数及使用方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-05-07
  • Idea使用正则表达式批量替换字符串的方法

    这篇文章给大家介绍了Idea使用正则表达式批量替换字符串的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧...2021-07-21
  • js正则学习小记之匹配字符串字面量

    关于匹配字符串问题,有很多种类型,今天讨论 js 代码里的字符串匹配,因为我想学完之后写个语法高亮练手,所以用js代码当作例子...2021-05-07
  • PHP正则表达式之捕获组与非捕获组

    今天遇到一个正则匹配的问题,忽然翻到有捕获组的概念,手册上也是一略而过,百度时无意翻到C#和Java中有对正则捕获组的特殊用法,搜索关键词有PHP时竟然没有相关内容,自己试了一下,发现在PHP中也是可行的,于是总结一下,分享的同...2015-11-08
  • C# 中使用正则表达式匹配字符的含义

    正则表达式的作用用来描述字符串的特征。本文重点给大家介绍C# 中使用正则表达式匹配字符的含义,非常不错,具有一定的参考借鉴价值,需要的朋友参考下吧...2020-06-25
  • Python验证的50个常见正则表达式

    这篇文章主要给大家介绍了关于利用Python验证的50个常见正则表达式的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2021-03-11
  • C#编程自学之运算符和表达式

    这篇文章主要介绍了C#运算符和表达式,这是自学C#编程的第五篇,希望对大家的学习有所帮助。...2020-06-25
  • PHP正则表达式过滤html标签属性(DEMO)

    这篇文章主要介绍了PHP正则表达式过滤html标签属性的相关内容,实用性非常,感兴趣的朋友参考下吧...2016-05-06