C++中正则表达式(regex) 迭代器(iterator) 详解
正则表达式(regex), 利用boost的regex头文件, 是C++11的新尺度, 可是gcc4.8.1并未完全支持, 所以利用boost库;
详细安装: http://blog.csdn.net/caroline_wendy/article/details/17282187
正则表达式的书写类型, 以ECMAScript为例, 利用迭代器可以遍历原字符串, 输出切合要求的所有字符串;
利用prefix()和suffix()要领, 可以输出前一个未匹配的字符串和后一个未匹配的字符串;
正则表达式的子表达式(subexpressions), 可以分段输出正则表达式, 在正则表达式中, 以括号"()"解析;
代码如下:
#include <iostream> #include <string> #include <algorithm> #include <boost/regex.hpp> using namespace std; using namespace boost; int main() { std::string pattern("[^c]ei"); pattern = "[[:alpha:]]*" + pattern + "[[:alpha:]]*"; boost::regex r(pattern, regex::icase); //忽略巨细写 std::string str("Ruby Carolinei biubiubiu Weindy SpikeI Winnceiy"); //利用正则迭代器举办遍历 for(boost::sregex_iterator it(str.begin(), str.end(), r), end_it; it!=end_it; ++it) std::cout << it->str() << std::endl; //输出正则表达式的前后字符串 std::cout << std::endl; for(boost::sregex_iterator it(str.begin(), str.end(), r), end_it; it!=end_it; ++it){ auto pos = it->prefix().length(); pos = pos>40 ? pos-40 : 0; std::cout << it->prefix().str().substr(pos) /*输出前一个未匹配的字符串*/ << "\n\t\t>>>" << it->str() << "<<<\n" << it->suffix().str().substr(0, 40) /*输出之后的字符串*/ <<std::endl; } //匹配子表达式 std::string filename("File.cqp MyGod.cpP"); boost::regex rsub("([[:alnum:]]+)\\.(cpp|cxx|cc)$", regex::icase); smatch results; if(boost::regex_search(filename, results, rsub)) std::cout << results.str(1) << std::endl; }
输出:
Carolinei Weindy SpikeI Ruby >>>Carolinei<<< biubiubiu Weindy SpikeI Winnceiy biubiubiu >>>Weindy<<< SpikeI Winnceiy >>>SpikeI<<< Winnceiy MyGod
作者:csdn博客 Spike_King