. |
Entspricht einem einzelnen Zeichen. |
[ ] |
Gibt eine Zeichenklasse an. Entspricht einem beliebigen Zeichen innerhalb der eckigen Klammern (z. B [abc] entspricht „a“, „b“ und „c“). |
^ |
Wenn dieses Metazeichen am Anfang einer Zeichenklasse auftritt, negiert es die Zeichenklasse. Eine negierte Zeichenklasse entspricht beliebigen Zeichen mit Ausnahme jener innerhalb der eckigen Klammern (z. B. [^abc] entspricht allen Zeichen außer „a“, „b“ und „c“). Wenn ^ am Anfang des regulären Ausdrucks steht, entspricht es dem Beginn der Eingabe (z. B.^[abc] entspricht nur einer Eingabe, die mit „a“, „b“ oder „c“ beginnt). |
- |
Zeigt in einer Zeichenklasse einen Bereich von Zeichen an (z. B. [0-9] entspricht einer beliebigen Ziffer „0“ bis „9“). |
? |
Gibt an, dass der vorhergehende Ausdruck optional ist: Er stimmt einmal oder gar nicht überein (z. B. [0-9][0-9]? entspricht „2“ und „12“). |
+ |
Gibt an, dass der vorherige Ausdruck einmal oder mehrmals übereinstimmt (z. B. [0-9]+ entspricht „1“, „13“, „456“ usw.). |
* |
Gibt an, dass der vorherige Ausdruck keinmal oder mehrmals übereinstimmt. |
??, +?, *? |
Nicht-gierige Versionen von ?, + und *. Diese haben so wenige Übereinstimmungen wie möglich, im Gegensatz zu den gierigen Versionen, die so viele Übereinstimmungen wie möglich haben (zum Beispiel für die Eingabe „<abc><def>“ gilt: <.*?> entspricht „<abc>“ während <.*> „<abc><def>“) entspricht. |
( ) |
Gruppierungs-Operator. Beispiel: (\d+,)*\d+ entspricht einer Liste von Nummern, die durch Kommas getrennt sind (z. B. „1“ oder „1,23,456“). |
{ } |
Gibt eine Übereinstimmungsgruppe an. |
\ |
Escape-Zeichen: Interpretieren Sie das nächste Zeichen wörtlich (z. B. [0-9]+ entspricht einer oder mehreren Ziffern, [0-9]\+ aber entspricht einer Ziffer gefolgt von einem Pluszeichen). Wird auch für Abkürzungen verwendet (z. B. \a für jedes alphanumerische Zeichen; siehe auch die folgende Tabelle).
Wenn auf \ eine Zahl n folgt, entspricht sie der n-ten Übereinstimmungsgruppe (beginnend mit 0). Beispiel: <{.*?}>.*</\0> entspricht „<head>Inhalt</head>“.
|
$ |
Am Ende eines regulären Ausdrucks entspricht dieses Zeichen dem Ende der Eingabe (z. B. [0-9]$ entspricht einer Ziffer am Ende der Eingabe). |
| |
Wechsel-Operator: Trennt zwei Ausdrücke, von denen genau einer übereinstimmt (z. B. T|the entspricht „die“ oder „Die“). |
! |
Verneinungs-Operator: Der auf ! folgende Ausdruck entspricht nicht der Eingabe (z. B. a!b entspricht „a“ nicht gefolgt von „b“). |