Skip to content

Commit ed9ece8

Browse files
authored
Merge pull request #200 from Aakodal/9.12-regexp-backreferences
Backreferences in pattern: \N and \k
2 parents 32fc82e + 82d1303 commit ed9ece8

File tree

2 files changed

+48
-44
lines changed

2 files changed

+48
-44
lines changed
Lines changed: 26 additions & 22 deletions
Original file line numberDiff line numberDiff line change
@@ -1,14 +1,14 @@
1-
# Mode multiligne des ancres ^ $, marqueur "m"
1+
# Multiline mode of anchors ^ $, flag "m"
22

3-
Le mode multiligne est activé avec le marqueur `pattern:m`.
3+
The multiline mode is enabled by the flag `pattern:m`.
44

5-
Il affecte seulement le fonctionnement des ancres `pattern:^` et `pattern:$`.
5+
It only affects the behavior of `pattern:^` and `pattern:$`.
66

7-
Dans le mode multiligne, elles ne vérifient pas seulement le début et la fin d'une chaîne de caractères, mais également le début et la fin d'une ligne.
7+
In the multiline mode they match not only at the beginning and the end of the string, but also at start/end of line.
88

9-
## Recherche au début de ligne ^
9+
## Searching at line start ^
1010

11-
Dans l'exemple ci-dessous, le texte comporte plusieurs lignes. Le paterne `pattern:/^\d/gm` prend un chiffre au début de chaque ligne:
11+
In the example below the text has multiple lines. The pattern `pattern:/^\d/gm` takes a digit from the beginning of each line:
1212

1313
```js run
1414
let str = `1st place: Winnie
@@ -20,7 +20,7 @@ alert( str.match(/^\d/gm) ); // 1, 2, 3
2020
*/!*
2121
```
2222

23-
Sans le marqueur `pattern:m`, seul le premier chiffre est renvoyé :
23+
Without the flag `pattern:m` only the first digit is matched:
2424

2525
```js run
2626
let str = `1st place: Winnie
@@ -32,17 +32,19 @@ alert( str.match(/^\d/g) ); // 1
3232
*/!*
3333
```
3434

35-
Cela est dû au fait que, par défaut, l'accent circonflexe `pattern:^` ne vérifie que le début d'un texte, et dans le mode multiligne -- le début de n'importe quelle ligne.
35+
That's because by default a caret `pattern:^` only matches at the beginning of the text, and in the multiline mode -- at the start of any line.
3636

3737
```smart
38-
"Début de ligne" désigne formellement "immédiatement après un saut à la ligne" : le test `pattern:^` en mode multiligne vérifie à toutes les positions suivant un caractère de retour à la ligne `\n`, en plus du début du texte.
38+
"Start of a line" formally means "immediately after a line break": the test `pattern:^` in multiline mode matches at all positions preceeded by a newline character `\n`.
39+
40+
And at the text start.
3941
```
4042

41-
## Recherche en fin de ligne $
43+
## Searching at line end $
4244

43-
Le signe dollar `pattern:$` se comporte similairement.
45+
The dollar sign `pattern:$` behaves similarly.
4446

45-
L'expression régulière `pattern:\d$` prend le premier chiffre à la fin de chaque ligne.
47+
The regular expression `pattern:\d$` finds the last digit in every line
4648

4749
```js run
4850
let str = `Winnie: 1
@@ -52,19 +54,21 @@ Eeyore: 3`;
5254
alert( str.match(/\d$/gm) ); // 1,2,3
5355
```
5456

55-
Sans le marqueur `pattern:m`, le signe dollar `pattern:$` vérifierait uniquement la fin de tout le texte, donc uniquement le tout dernier chiffre serait trouvé.
57+
Without the flag `m`, the dollar `pattern:$` would only match the end of the whole text, so only the very last digit would be found.
5658

5759
```smart
58-
"Fin de ligne" désigne formellement "immédiatement avant un saut à la ligne" : le test `pattern:$` en mode multiligne vérifie à toutes les positions précédant un caractère de retour à la ligne `\n`, en plus de la fin du texte.
60+
"End of a line" formally means "immediately before a line break": the test `pattern:$` in multiline mode matches at all positions succeeded by a newline character `\n`.
61+
62+
And at the text end.
5963
```
6064

61-
## Recherche de \n au lieu de ^ $
65+
## Searching for \n instead of ^ $
6266

63-
Pour chercher un retour à la ligne, nous pouvons non seulement utiliser les ancres `pattern:^` et `pattern:$`, mais également le caractère de retour à la ligne `\n`.
67+
To find a newline, we can use not only anchors `pattern:^` and `pattern:$`, but also the newline character `\n`.
6468

65-
Quelle est la différence ? Regardons un exemple.
69+
What's the difference? Let's see an example.
6670

67-
Ici, nous cherchons `pattern:\d\n` au lieu de `pattern:\d$`:
71+
Here we search for `pattern:\d\n` instead of `pattern:\d$`:
6872

6973
```js run
7074
let str = `Winnie: 1
@@ -74,10 +78,10 @@ Eeyore: 3`;
7478
alert( str.match(/\d\n/gm) ); // 1\n,2\n
7579
```
7680

77-
Comme nous pouvons le voir, il y a 2 correspondances au lieu de 3.
81+
As we can see, there are 2 matches instead of 3.
7882

79-
C'est parce qu'il n'y a pas de retour à la ligne après `subject:3` (il y a la fin du texte cependant, donc ça correspond avec `pattern:$`).
83+
That's because there's no newline after `subject:3` (there's text end though, so it matches `pattern:$`).
8084

81-
Une autre différence : maintenant, chaque correspondance inclue un caractère de retour à la ligne `match:\n`. Contrairement aux ancres `pattern:^` `pattern:$`, qui ne testent qu'une condition (début/fin d'une ligne), `\n` est un caractère, donc il devient une partie du résultat.
85+
Another difference: now every match includes a newline character `match:\n`. Unlike the anchors `pattern:^` `pattern:$`, that only test the condition (start/end of a line), `\n` is a character, so it becomes a part of the result.
8286

83-
Ainsi, un `\n` dans le paterne est utilisé quand nous avons besoin dudit caractère dans le résultat, tandis que les ancres sont utilisées pour chercher quelque chose au début/à la fin d'une ligne.
87+
So, a `\n` in the pattern is used when we need newline characters in the result, while anchors are used to find something at the beginning/end of a line.

9-regular-expressions/12-regexp-backreferences/article.md

Lines changed: 22 additions & 22 deletions
Original file line numberDiff line numberDiff line change
@@ -1,33 +1,33 @@
1-
# Backreferences in pattern: \N and \k<name>
1+
# Rétro référence dans le paterne : \N et \k<name>
22

3-
We can use the contents of capturing groups `pattern:(...)` not only in the result or in the replacement string, but also in the pattern itself.
3+
Nous pouvons utiliser le contenu des groupes de capture `pattern:(...)` non seulement dans le résultat ou dans la chaîne de caractères de remplacement, mais également dans le paterne en lui-même.
44

5-
## Backreference by number: \N
5+
## Rétro référence par un nombre : \N
66

7-
A group can be referenced in the pattern using `pattern:\N`, where `N` is the group number.
7+
Un groupe peut être référencé dans le paterne par `pattern:\N`, `N` est le numéro du groupe.
88

9-
To make clear why that's helpful, let's consider a task.
9+
Pour rendre son utilité claire, considérons la tâche ci-dessous.
1010

11-
We need to find quoted strings: either single-quoted `subject:'...'` or a double-quoted `subject:"..."` -- both variants should match.
11+
Nous devons trouver des chaînes citées : soit par des apostrophes `subject:'...'`, soit par des guillemets `subject:"..."` -- les deux variantes devraient correspondre.
1212

13-
How to find them?
13+
Comment les trouver ?
1414

15-
We can put both kinds of quotes in the square brackets: `pattern:['"](.*?)['"]`, but it would find strings with mixed quotes, like `match:"...'` and `match:'..."`. That would lead to incorrect matches when one quote appears inside other ones, like in the string `subject:"She's the one!"`:
15+
Nous pouvons mettre les deux types entre crochets : `pattern:['"](.*?)['"]`, mais ce paterne pourrait correspondre avec des mélanges comme `match:"...'` ou `match:'..."`. Cela mènerait à des correspondances incorrectes lorsqu'une citation apparaît dans une autre, comme dans le texte `subject:"She's the one!"`:
1616

1717
```js run
1818
let str = `He said: "She's the one!".`;
1919

2020
let regexp = /['"](.*?)['"]/g;
2121

22-
// The result is not what we'd like to have
22+
// Le résultat n'est pas celui que nous aimerions avoir
2323
alert( str.match(regexp) ); // "She'
2424
```
2525

26-
As we can see, the pattern found an opening quote `match:"`, then the text is consumed till the other quote `match:'`, that closes the match.
26+
Comme nous pouvons le voir, le paterne trouve des guillemets ouvrant `match:"`, puis le texte est récupéré jusqu'au `match:'`, ce qui termine la correspondance.
2727

28-
To make sure that the pattern looks for the closing quote exactly the same as the opening one, we can wrap it into a capturing group and backreference it: `pattern:(['"])(.*?)\1`.
28+
Pour faire en sorte que le paterne vérifie que le caractère terminant la citation est précisément le même que celui qui l'ouvre, nous pouvons l'envelopper dans un groupe de capture et le rétro référencier : `pattern:(['"])(.*?)\1`.
2929

30-
Here's the correct code:
30+
Voilà le code correct :
3131

3232
```js run
3333
let str = `He said: "She's the one!".`;
@@ -39,27 +39,27 @@ let regexp = /(['"])(.*?)\1/g;
3939
alert( str.match(regexp) ); // "She's the one!"
4040
```
4141

42-
Now it works! The regular expression engine finds the first quote `pattern:(['"])` and memorizes its content. That's the first capturing group.
42+
Maintenant, ça fonctionne ! Le moteur trouve le premier caractère de citation `pattern:(['"])` et mémorise son contenu. C'est le premier groupe de capture.
4343

44-
Further in the pattern `pattern:\1` means "find the same text as in the first group", exactly the same quote in our case.
44+
Plus loin dans le paterne, `pattern:\1` signifie "cherche le même texte que dans le premier groupe de capture", le même caractère de citation dans notre cas.
4545

46-
Similar to that, `pattern:\2` would mean the contents of the second group, `pattern:\3` - the 3rd group, and so on.
46+
Similairement, `pattern:\2` voudrait référencier le 2nd groupe, `pattern:\3` - le 3e groupe, et ainsi de suite.
4747

4848
```smart
49-
If we use `?:` in the group, then we can't reference it. Groups that are excluded from capturing `(?:...)` are not memorized by the engine.
49+
Si nous utilisons `?:` dans le groupe, alors nous ne pouvons pas le référencer. Les groupes exclus de la capture `(?:...)` ne sont pas mémorisés par le moteur.
5050
```
5151

52-
```warn header="Don't mess up: in the pattern `pattern:\1`, in the replacement: `pattern:$1`"
53-
In the replacement string we use a dollar sign: `pattern:$1`, while in the pattern - a backslash `pattern:\1`.
52+
```warn header="Ne mélangez pas : dans le paterne, `pattern:\1`, dans le replacement : `pattern:$1`"
53+
Dans la chaîne de remplacement, on utilise un signe dollar : `pattern:$1`, alors que dans un paterne - un antislash `pattern:\1`.
5454
```
5555
56-
## Backreference by name: `\k<name>`
56+
## Rétro référence par le nom: `\k<name>`
5757
58-
If a regexp has many parentheses, it's convenient to give them names.
58+
Si une expression régulière a beaucoup de groupes, il est pratique de leur attribuer un nom.
5959
60-
To reference a named group we can use `pattern:\k<имя>`.
60+
Pour référencer un groupe nommé, on peut utiliser `pattern:\k<имя>`.
6161
62-
In the example below the group with quotes is named `pattern:?<quote>`, so the backreference is `pattern:\k<quote>`:
62+
Dans l'exemple ci-dessous, le groupe du caractère de citation s'appelle `pattern:?<quote>`, donc la rétro référence est `pattern:\k<quote>`:
6363
6464
```js run
6565
let str = `He said: "She's the one!".`;

0 commit comments

Comments
 (0)