pcre匹配[通俗易懂]

pcre匹配[通俗易懂]实例://来源网上http://blog.csdn.net/sulliy/article/details/6247155#definePCRE_STATIC//静态库编译选项#include#include#include#defineOVECCOUNT30/*shouldbeamultipleof3*/#defineEBUFLEN128

大家好,欢迎来到IT知识分享网。

实例://来源网上http://blog.csdn.net/sulliy/article/details/6247155

#define PCRE_STATIC // 静态库编译选项

#include <stdio.h>

#include <string.h>

#include <pcre.h>

#define OVECCOUNT 30 /* should be a multiple of 3 */

#define EBUFLEN 128

#define BUFLEN 1024

int main()

{

    pcre  *re;

    const char *error;

    int  erroffset;

    int  ovector[OVECCOUNT];

    int  rc, i;

    char  src [] = “111 <title>Hello World</title> 222”;   // 要被用来匹配的字符串

    char  pattern [] = “<title>(.*)</(tit)le>”;              // 将要被编译的字符串形式的正则表达式

    printf(“String : %s/n”, src);

    printf(“Pattern: /”%s/”/n”, pattern);

    re = pcre_compile(pattern,       // pattern, 输入参数,将要被编译的字符串形式的正则表达式

                      0,            // options, 输入参数,用来指定编译时的一些选项

                      &error,       // errptr, 输出参数,用来输出错误信息

                      &erroffset,   // erroffset, 输出参数,pattern中出错位置的偏移量

                      NULL);        // tableptr, 输入参数,用来指定字符表,一般情况用NULL

    // 返回值:被编译好的正则表达式的pcre内部表示结构

    if (re == NULL) {                 //如果编译失败,返回错误信息

        printf(“PCRE compilation failed at offset %d: %s/n”, erroffset, error);

        return 1;

    }

    rc = pcre_exec(re,            // code, 输入参数,用pcre_compile编译好的正则表达结构的指针

                   NULL,          // extra, 输入参数,用来向pcre_exec传一些额外的数据信息的结构的指针

                   src,           // subject, 输入参数,要被用来匹配的字符串

                   strlen(src),  // length, 输入参数, 要被用来匹配的字符串的指针

                   0,             // startoffset, 输入参数,用来指定subject从什么位置开始被匹配的偏移量

                   0,             // options, 输入参数, 用来指定匹配过程中的一些选项

                   ovector,       // ovector, 输出参数,用来返回匹配位置偏移量的数组

                   OVECCOUNT);    // ovecsize, 输入参数, 用来返回匹配位置偏移量的数组的最大大小

    // 返回值:匹配成功返回非负数,没有匹配返回负数

    if (rc < 0) {                     //如果没有匹配,返回错误信息

        if (rc == PCRE_ERROR_NOMATCH) printf(“Sorry, no match …/n”);

        else printf(“Matching error %d/n”, rc);

        pcre_free(re);

        return 1;

    }

    printf(“/nOK, has matched …/n/n”);   //没有出错,已经匹配

    for (i = 0; i < rc; i++) {             //分别取出捕获分组 $0整个正则公式 $1第一个()

        char *substring_start = src + ovector[2*i];

        int substring_length = ovector[2*i+1] – ovector[2*i];

        printf(“$%2d: %.*s/n”, i, substring_length, substring_start);

    }

    pcre_free(re);                     // 编译正则表达式re 释放内存

    return 0;

}

PCRE提供了19个接口函数,这里只介绍上实例用到的几个的用法:

1. pcre_compile

       原型:

         #include <pcre.h>

pcre *pcre_compile(const char *pattern, int options, const char **errptr, int *erroffset, const unsigned char *tableptr);

功能:将一个正则表达式编译成一个内部表示,在匹配多个字符串时,可以加速匹配。同pcre_compile2功能一样只是缺少一个参数errorcodeptr

参数:

pattern    正则表达式

options     为0,或者其他参数选项

        errptr       出错消息

        erroffset  出错位置

tableptr   指向一个字符数组的指针,可以设置为空NULL

2. pcre_compile2

       原型:

#include <pcre.h>

pcre *pcre_compile2(const char *pattern, int options, int *errorcodeptr, const char **errptr, int *erroffset, const unsigned char *tableptr);

功能:将一个正则表达式编译成一个内部表示,在匹配多个字符串时,可以加速匹配。同pcre_compile功能一样只是多一个参数errorcodeptr

参数:

pattern    正则表达式

options     为0,或者其他参数选项

errorcodeptr    存放出错码

        errptr       出错消息

        erroffset  出错位置

tableptr   指向一个字符数组的指针,可以设置为空NULL

3. pcre_exec

       原型:

#include <pcre.h>

int pcre_exec(const pcre *code, const pcre_extra *extra, const char *subject, int length, int startoffset, int options, int *ovector, int ovecsize);

功能:使用编译好的模式进行匹配,采用与Perl相似的算法,返回匹配串的偏移位置。。

参数:

code         编译好的模式

extra     指向一个pcre_extra结构体,可以为NULL

subject    需要匹配的字符串

length      匹配的字符串长度(Byte)

startoffset       匹配的开始位置

options     选项位

ovector    指向一个结果的整型数组

ovecsize   数组大小

实例中rc是匹配成功的个数。ovector定义为整形数组,返回的是匹配到的字符串的起始偏移和结束偏移,char *substring_start = src + ovector[2*i];这一行的结果使得指针substring_start指向匹配到的字符串的首地址。int substring_length = ovector[2*i+1] – ovector[2*i];计算出匹配到的字符串的长度,并赋值给substring_length。”%.*s”是c语音中的用法,”*”对应数字,”.”与后面的结合表示指定必须输出这个宽度(substring_length),如果所输出的字符串3长度大于这个数,则按此宽度输出,如果小于,则输出实际长度。

因为ovector返回的是起始偏移和结束偏移,即两个整数,所以要进行2*i的循环处理。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/13026.html

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信