. |
Соответствует любому одиночному символу. |
[ ] |
Обозначает класс символов. Соответствует любому символу в скобках (например, [abc] соответствует "a", "b" и "c"). |
^ |
Если этот метасимвол стоит в начале класса символов, он обозначает отрицание этого класса. Класс символов с отрицанием соответствует любому символу, кроме находящихся в скобках (например, [^abc] соответствует всем символам, кроме "a", "b" и "c"). Если символ ^ находится в начале регулярного выражения, он совпадает с началом ввода (например, ^[abc] соответствует только вводу, начинающемуся с "a", "b" или "c"). |
- |
В классе символов обозначает диапазон символов (например, [0-9] соответствует любой из цифр от "0" до "9"). |
? |
Означает, что предыдущее выражение необязательно: соответствие может появиться ноль или один раз (например, [0-9][0-9]? соответствует "2" и "12"). |
+ |
Означает, что соответствие предыдущему выражению может появиться один или несколько раз (например, [0-9]+ соответствует "1", "13", "456" и т. д.). |
* |
Означает, что соответствие предшествующему выражению может не появиться ни разу или появиться несколько раз (например, |
??, +?, *? |
Экономные версии ?, + и *. Соответствие появляется как можно меньшее количество раз, в отличие от обычных версий, где соответствие появляется как можно большее количество раз (например, для выражения "<abc><def>", <.*?> соответствует "<abc>", а <.*> соответствует "<abc><def>"). |
( ) |
Оператор группировки. Пример: (\d+,)*\d+ соответствует списку чисел, разделенных запятыми (например, "1" или "1,23,456"). |
{ } |
Обозначает группу соответствий. |
\ |
Escape-символ: интерпретирует следующий символ в буквальном смысле (например, [0-9]+ соответствует одной или нескольким цифрам, [0-9]\+ соответствует цифре, за которой следует знак плюса). Также используется для сокращений (например, \a для любого буквенно-цифрового символа; см. следующую таблицу).
Если за знаком \ следует число n, он соответствует n-ной группе соответствия (их номера начинаются с 0). Пример: <{.*?}>.*</\0> соответствует "<head>Contents</head>".
|
$ |
В конце регулярного выражения этот символ соответствует концу ввода (например, [0-9]$ соответствует цифре в конце ввода). |
| |
Оператор чередования: разделяет два выражения, для одного из которых имеется точное соответствие (например, T|the соответствует "The" или "the"). |
! |
Оператор отрицания: выражение, следующее за символом !, не соответствует введенному значению (например, a!b соответствует "a", за которым не следует "b"). |