正則表達式Regex(regular expression)是一種強大的描述字符序列的工具。在許多語言中都存在著正則表達式,C++11中也將正則表達式納入了新標準的一部分。
C++ regex正則表達式的規則和其他編程語言差不多,如下:
一、校驗字符的表達式
1 漢字:^[\\\\u4e00-\\\\u9fa5]{0,}$
2 英文和數字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3 長度為3-20的所有字符:^.{3,20}$
4 由26個英文字母組成的字符串:^[A-Za-z]+$
5 由26個大寫英文字母組成的字符串:^[A-Z]+$
6 由26個小寫英文字母組成的字符串:^[a-z]+$
7 由數字和26個英文字母組成的字符串:^[A-Za-z0-9]+$
8 由數字、26個英文字母或者下劃線組成的字符串:^\\w+$ 或 ^\\w{3,20}$
9 中文、英文、數字包括下劃線:^[\\\\u4E00-\\\\u9FA5A-Za-z0-9_]+$
10 中文、英文、數字但不包括下劃線等符號:^[\\\\u4E00-\\\\u9FA5A-Za-z0-9]+$ 或 ^[\\\\u4E00-\\\\u9FA5A-Za-z0-9]{2,20}$
11 可以輸入含有^%&',;=?$\\"等字符:[^%&',;=?$\\\\x22]+
12 禁止輸入含有~的字符:[^~\\\\x22]+
二、校驗數字的表達式
1、 n位的數字:^\\d{n}$
2 、數字:^[0-9]*$
3、 m-n位的數字:^\\d{m,n}$
4、 至少n位的數字:^\\d{n,}$
5、 零和非零開頭的數字:^(0|[1-9][0-9]*)$
6 、非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
7、 帶1-2位小數的正數或負數:^(\\-)?\\d+(\\.\\d{1,2})?$
8 、正數、負數、和小數:^(\\-|\\+)?\\d+(\\.\\d+)?$
9 、有兩位小數的正實數:^[0-9]+(.[0-9]{2})?$
10 、有1~3位小數的正實數:^[0-9]+(.[0-9]{1,3})?$
11 、非零的正整數:^[1-9]\\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\\+?[1-9][0-9]*$
12 、非零的負整數:^\\-[1-9][]0-9"*$ 或 ^-[1-9]\\d*$
13 、非負整數:^\\d+$ 或 ^[1-9]\\d*|0$
14 、非正整數:^-[1-9]\\d*|0$ 或 ^((-\\d+)|(0+))$
15 、非負浮點數:^\\d+(\\.\\d+)?$ 或 ^[1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*|0?\\.0+|0$
16 、非正浮點數:^((-\\d+(\\.\\d+)?)|(0+(\\.0+)?))$ 或 ^(-([1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*))|0?\\.0+|0$
17 、正浮點數:^[1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*$ 或 ^(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 、負浮點數:^-([1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*)$ 或 ^(-(([0-9]+\\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 、浮點數:^(-?\\d+)(\\.\\d+)?$ 或 ^-?([1-9]\\d*\\.\\d*|0\\.\\d*[1-9]\\d*|0?\\.0+|0)$
三、特殊需求表達式
1、 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
2、 Email地址:^\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\\.\\w+([-.]\\w+)*$
3、手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$
4、 InternetURL:[a-zA-z]+://[^\\s]* 或 ^http://([\\w-]+\\.)+[\\w-]+(/[\\w-./?%&=]*)?$
5、 國內電話號碼(0511-4405222、021-87888822):\\d{3}-\\d{8}|\\d{4}-\\d{7}
6 、電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\\(\\d{3,4}-)|\\d{3.4}-)?\\d{7,8}$
7 、短身份證號碼(數字、字母x結尾):^([0-9]){7,18}(x|X)?$ 或 ^\\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
8 、身份證號(15位、18位數字):^\\d{15}|\\d{18}$
9 、帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10、 密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-zA-Z]\\w{5,17}$
11 、強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字符,長度在8-10之間):^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
12 、日期格式:^\\d{4}-\\d{1,2}-\\d{1,2}
13、 一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
14、 一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
C++ regex函數有3個:regex_match、 regex_search 、regex_replace
regex_match
regex_match是正則表達式匹配的函數,下面以例子說明。
輸出如下:
regex_search
regex_match是另外一個正則表達式匹配的函數,下面是regex_search的例子。regex_search和regex_match的主要區別是:regex_match是全詞匹配,而regex_search是搜索其中匹配的字符串。
輸出如下:
regex_replace
regex_replace是替換正則表達式匹配內容的函數,下面是regex_replace的例子。
輸出如下:
注意了,在C++反斜槓字符(\\)會被轉義
regex和異常處理
如果我們的正則表達式存在錯誤,則在運行的時候標準庫會拋出一個regex_error異常,他有一個名為code的成員,用於標記錯誤的類型,具體錯誤值和語義如下表所示:
結束語
每天進步一點點,每天消化一點點。如果你有更高的想法,歡迎一起交流。如果覺得文章寫得還不錯,點個讚唄。
閱讀更多 懷念感覺12 的文章