php中字符串和正则表达式详解
一、字符串类型的特点
1、PHP是弱类型语言,其他数据类型一般都可以直接应用于字符串函数操作。
<"123456",2,4); //输出345
echo substr(123456,2,4); //输出345
echo hello; //先查找hello常量,若没找到,将hello看做字符串使用
"www.jb51.net";
echo $str[0];
echo $str[1];
echo $str[2];
"https://www.jb51.net">www.jb51.net;
echo $str{0};
echo $str{1};
echo $str{2};
"dwqs",'add' => "www.ido321.com");
echo "$arr[name]"; //可以解析,但是在方括号中不能使用引号
//echo "$arr['name']"; 错误
echo "{$arr['name']}"; //可以解析,用花括号包含元素,name不带引号也是可以的
//假设存在对象$square
echo "$square->width"; //可以解析
echo "$square->width00 cent"; //不可以解析,用花括号解决
echo "{$square->width}width00 cent"; //可以解析
"echo" src="/UploadFiles/2021-04-02/2014102310214215.png">三、常用的字符串格式函数
PS:PHP的字符串处理函数大部分不对源字符串做修改,而是返回新的字符串
四、正则表达式
正则表达式描述了一种字符串匹配的模式,通过这个模式在特定的函数中对字符串进行匹配、查找、替换和分隔等操作,由原子、元字符和模式修正符三部分组成的文字模式。
在PHP中,有两套正则的处理函数库:PCRE和POSIX。前者以preg_前缀命名,与Perl兼容;后者以ereg_前缀命名。二者功能相似,但PCRE的效率略高。
与Perl语言兼容的正则表达式处理函数:
1、语法
1.1 定界符:在与Perl兼容的正则函数中使用模式时,必须给模式加上定界符。除了字母、数字和反斜线(\)之外的任何字符都可以作为定界符号
<"yuan" src="/UploadFiles/2021-04-02/2014102310214218.png">1.4 模式修正符:在正则的定界符之外使用,扩展正则在匹配、替换等方面的功能。
2.与Perl兼容的正则表达式函数
2.1 preg_match(string pattern,string subject[,array matches]):用于对字符串的查找和匹配。参数说明:
pattern是正则,subject是需要处理的字符串,可选的matches用于保存于pattern的各个子模式的匹配结果,matches[0]保存了与pattern匹配的整体内容,matches[1]保存了pattern中第一个小括号中匹配的内容,以此类推。
<"content-type:text/html;charset=utf8");
$pattern = '/(http):\/\/(www)\.([^\.\/]+)\.(com|net|org)/i';
$subject = "我的博客:http://www.ido321.com";
if(preg_match($pattern, $subject,$matches)){
echo "搜索的URL是:".$matches[0]."<br/>"; //数组第1个元素保存整个匹配结果
echo "URL中的协议是:".$matches[1]."<br/>";//数组第2个元素保存第1个字表达式
echo "URL中的主机是:".$matches[2]."<br/>";//数组第3个元素保存第2个字表达式
echo "URL中的域名是:".$matches[3]."<br/>";//数组第4个元素保存第3个字表达式
echo "URL中的顶域是:".$matches[4]."<br/>";//数组第5个元素保存第4个字表达式
}
"test" src="/UploadFiles/2021-04-02/2014102310214220.png">preg_match_all()与preg_match()函数类似,不同的是前者会一直匹配到字符串末尾,后者在第一次匹配后就停止匹配。
2.2 preg_grep(string pattern,array iput):匹配数组中的元素,返回与正则匹配的数组单元。参数说明:
pattern是正则,input是需要匹配的数组。
<"",$text); //将所有HTML标记替换为空
echo preg_replace($pattern,"",$text,2); //值替换前2个HTML标记
"/[\s,]+/","hypertext language,programming");
//输出:Array([0]=>hypertext [1]=>language,[2[=>programming)
print_r($kerwords);
?>