Сканер (Scanner)

Вихідний код сканера TypeScript повністю знаходиться у файлі scanner.ts. Сканер контролюється внутрішньо парсером для перетворення вихідного коду в AST. Ось бажаний результат.

SourceCode ~~ scanner ~~> Token Stream ~~ parser ~~> AST

Використання парсером

У файлі parser.ts створено сканер (як сінглтон), щоб уникнути витрат на створення сканерів знову і знову. Цей сканер потім запускається синтаксичним аналізатором на вимогу за допомогою функції initializeState.

Нижче наведено спрощену версію коду синтаксичного аналізатора, яку ви можете запустити для демонстрації цієї концепції:

code/compiler/scanner/runScanner.ts

import * as ts from "ntypescript";

// TypeScript has a singleton scanner
const scanner = ts.createScanner(ts.ScriptTarget.Latest, /*skipTrivia*/ true);

// That is initialized using a function `initializeState` similar to
function initializeState(text: string) {
    scanner.setText(text);
    scanner.setOnError((message: ts.DiagnosticMessage, length: number) => {
        console.error(message);
    });
    scanner.setScriptTarget(ts.ScriptTarget.ES5);
    scanner.setLanguageVariant(ts.LanguageVariant.Standard);
}

// Sample usage
initializeState(`
var foo = 123;
`.trim());

// Start the scanning
var token = scanner.scan();
while (token != ts.SyntaxKind.EndOfFileToken) {
    console.log(ts.formatSyntaxKind(token));
    token = scanner.scan();
}

У результаті буде виведено наступне:

VarKeyword
Identifier
FirstAssignment
FirstLiteralToken
SemicolonToken

Стан сканера (Scanner State)

Після виклику scan сканер оновлює свій локальний стан (позицію у скануванні, поточні дані токенів тощо). Сканер надає набір утиліт для отримання поточного стану сканера. У наведеному нижче прикладі ми створюємо сканер, а потім використовуємо його для ідентифікації токенів, а також їх позицій у коді.

code/compiler/scanner/runScannerWithPosition.ts

// Sample usage
initializeState(`
var foo = 123;
`.trim());

// Start the scanning
var token = scanner.scan();
while (token != ts.SyntaxKind.EndOfFileToken) {
    let currentToken = ts.formatSyntaxKind(token);
    let tokenStart = scanner.getStartPos();
    token = scanner.scan();
    let tokenEnd = scanner.getStartPos();
    console.log(currentToken, tokenStart, tokenEnd);
}

У результаті буде виведено наступне:

VarKeyword 0 3
Identifier 3 7
FirstAssignment 7 9
FirstLiteralToken 9 13
SemicolonToken 13 14

Самостійний сканер (Standalone scanner)

Незважаючи на те, що парсер TypeScript має сінглтон сканера, ви також можете створити самостійний сканер, використовуючи createScanner, і використовувати його методи setText/setTextPos для сканування різних частин файлу на ваш розсуд або задоволення.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

scanner.md

scanner.md

Сканер (Scanner)

Використання парсером

Стан сканера (Scanner State)

Самостійний сканер (Standalone scanner)

Files

scanner.md

Latest commit

History

scanner.md

File metadata and controls

Сканер (Scanner)

Використання парсером

Стан сканера (Scanner State)

Самостійний сканер (Standalone scanner)