refactor: simplify parser APIs and fix StringUnescaper bugs (v2.0 sync)

rainx · rainx · commit ecc72b43abaa · 2026-03-13T14:07:50.000+08:00
- Remove deprecated constructor params from ConstExprParser (unescapeStrings, quoteAwareConstExprString) and PhpDocParser (requireWhitespaceBeforeDescription, preserveTypeAliasesWithInvalidTypes, textBetweenTagsBelongsToDescription)
- Always unescape strings in ConstExprParser, always preserve type aliases with invalid types
- Fix StringUnescaper single-quote regex: match \' not \. for PHP single-quoted string escaping
- Fix StringUnescaper double-quote regex: properly escape backslash before quote in parseEscapeSequences
- Remove unused eslint-disable directive in PhpDocParser
- Update tests for simplified APIs
diff --git a/src/phpdoc-parser/parser/const-expr-parser.ts b/src/phpdoc-parser/parser/const-expr-parser.ts
@@ -23,14 +23,13 @@ export class ConstExprParser {
    * @param usedAttributes is an object that may have 'lines' and 'indexes' properties
    */
   constructor(
-    private unescapeStrings: boolean = false,
     usedAttributes: { lines?: boolean; indexes?: boolean } = {},
   ) {
     this.useLinesAttributes = usedAttributes.lines ?? false;
     this.useIndexAttributes = usedAttributes.indexes ?? false;
   }
 
-  public parse(tokens: TokenIterator, trimStrings = false): ConstExprNode {
+  public parse(tokens: TokenIterator): ConstExprNode {
     const startLine = tokens.currentTokenLine();
     const startIndex = tokens.currentTokenIndex();
     if (tokens.isCurrentTokenType(Lexer.TOKEN_FLOAT)) {
@@ -63,15 +62,8 @@ export class ConstExprParser {
         Lexer.TOKEN_DOUBLE_QUOTED_STRING,
       )
     ) {
-      let value = tokens.currentTokenValue();
+      const value = StringUnescaper.unescapeString(tokens.currentTokenValue());
       const type = tokens.currentTokenType();
-      if (trimStrings) {
-        if (this.unescapeStrings) {
-          value = StringUnescaper.unescapeString(value);
-        } else {
-          value = value.substring(1, value.length - 1);
-        }
-      }
       tokens.next();
 
       return this.enrichWithAttributes(
diff --git a/src/phpdoc-parser/parser/php-doc-parser.ts b/src/phpdoc-parser/parser/php-doc-parser.ts
@@ -63,14 +63,7 @@ export class PhpDocParser {
   constructor(
     public typeParser: TypeParser,
     public constantExprParser: ConstExprParser,
-    public requireWhitespaceBeforeDescription: boolean = false,
-    public preserveTypeAliasesWithInvalidTypes: boolean = false,
-    usedAttributes: { lines: boolean; indexes: boolean } = {
-      lines: false,
-      indexes: false,
-    },
-    public parseDoctrineAnnotations: boolean = false,
-    private textBetweenTagsBelongsToDescription: boolean = false,
+    usedAttributes: { lines?: boolean; indexes?: boolean } = {},
   ) {
     this.useLinesAttributes = usedAttributes.lines ?? false;
     this.useIndexAttributes = usedAttributes.indexes ?? false;
@@ -177,21 +170,11 @@ export class PhpDocParser {
   private parseText(tokens: TokenIterator): PhpDocTextNode {
     let text = '';
 
-    let endTokens = [
-      Lexer.TOKEN_PHPDOC_EOL,
-      Lexer.TOKEN_CLOSE_PHPDOC,
-      Lexer.TOKEN_END,
-    ];
-    if (this.textBetweenTagsBelongsToDescription) {
-      endTokens = [Lexer.TOKEN_CLOSE_PHPDOC, Lexer.TOKEN_END];
-    }
+    const endTokens = [Lexer.TOKEN_CLOSE_PHPDOC, Lexer.TOKEN_END];
 
     let savepoint = false;
 
-    while (
-      this.textBetweenTagsBelongsToDescription ||
-      !tokens.isCurrentTokenType(Lexer.TOKEN_PHPDOC_EOL)
-    ) {
+    while (true) {
       const tmpText =
         tokens.getSkippedHorizontalWhiteSpaceIfAny() +
         tokens.joinUntil(Lexer.TOKEN_PHPDOC_EOL, ...endTokens);
@@ -201,14 +184,12 @@ export class PhpDocParser {
         break;
       }
 
-      if (this.textBetweenTagsBelongsToDescription) {
-        if (!savepoint) {
-          tokens.pushSavePoint();
-          savepoint = true;
-        } else if (tmpText !== '') {
-          tokens.dropSavePoint();
-          tokens.pushSavePoint();
-        }
+      if (!savepoint) {
+        tokens.pushSavePoint();
+        savepoint = true;
+      } else if (tmpText !== '') {
+        tokens.dropSavePoint();
+        tokens.pushSavePoint();
       }
 
       tokens.pushSavePoint();
@@ -742,34 +723,29 @@ export class PhpDocParser {
     // support psalm-type syntax
     tokens.tryConsumeTokenType(Lexer.TOKEN_EQUAL);
 
-    if (this.preserveTypeAliasesWithInvalidTypes) {
-      const startLine = tokens.currentTokenLine();
-      const startIndex = tokens.currentTokenIndex();
+    const startLine = tokens.currentTokenLine();
+    const startIndex = tokens.currentTokenIndex();
 
-      try {
-        const type = this.typeParser.parse(tokens);
-        if (!tokens.isCurrentTokenType(Lexer.TOKEN_CLOSE_PHPDOC)) {
-          if (!tokens.isCurrentTokenType(Lexer.TOKEN_PHPDOC_EOL)) {
-            throw new Error('Expected end of line');
-          }
+    try {
+      const type = this.typeParser.parse(tokens);
+      if (!tokens.isCurrentTokenType(Lexer.TOKEN_CLOSE_PHPDOC)) {
+        if (!tokens.isCurrentTokenType(Lexer.TOKEN_PHPDOC_EOL)) {
+          throw new Error('Expected end of line');
         }
-        return new TypeAliasTagValueNode(alias, type);
-      } catch (e) {
-        this.parseOptionalDescription(tokens);
-        return new TypeAliasTagValueNode(
-          alias,
-          this.enrichWithAttributes(
-            tokens,
-            new InvalidTypeNode(e as ParserException),
-            startLine,
-            startIndex,
-          ),
-        );
       }
+      return new TypeAliasTagValueNode(alias, type);
+    } catch (e) {
+      this.parseOptionalDescription(tokens);
+      return new TypeAliasTagValueNode(
+        alias,
+        this.enrichWithAttributes(
+          tokens,
+          new InvalidTypeNode(e as ParserException),
+          startLine,
+          startIndex,
+        ),
+      );
     }
-
-    const type = this.typeParser.parse(tokens);
-    return new TypeAliasTagValueNode(alias, type);
   }
 
   private parseTypeAliasImportTagValue(
@@ -941,7 +917,6 @@ export class PhpDocParser {
       }
 
       if (
-        this.requireWhitespaceBeforeDescription &&
         !tokens.isCurrentTokenType(
           Lexer.TOKEN_PHPDOC_EOL,
           Lexer.TOKEN_CLOSE_PHPDOC,
diff --git a/src/phpdoc-parser/parser/string-unescaper.ts b/src/phpdoc-parser/parser/string-unescaper.ts
@@ -13,8 +13,7 @@ export class StringUnescaper {
     const quote = input[0];
 
     if (quote === "'") {
-      // eslint-disable-next-line no-useless-escape
-      return input.slice(1, input.length - 1).replaceAll(/\\([\\\.])/g, '$1');
+      return input.slice(1, input.length - 1).replaceAll(/\\([\\'])/g, '$1');
     }
 
     return this.parseEscapeSequences(input.slice(1, input.length - 1), '"');
@@ -23,7 +22,7 @@ export class StringUnescaper {
   // Implementation based on https://github.com/nikic/PHP-Parser/blob/b0edd4c41111042d43bb45c6c657b2e0db367d9e/lib/PhpParser/Node/Scalar/String_.php#L90-L130
   private static parseEscapeSequences(input: string, quote: string): string {
     // eslint-disable-next-line no-param-reassign
-    input = input.replaceAll(new RegExp(`\\${quote}`, 'g'), quote);
+    input = input.replaceAll(new RegExp(`\\\\${quote}`, 'g'), quote);
 
     return input.replaceAll(
       /\\([\\nrtfve]|[xX][0-9a-fA-F]{1,2}|[0-7]{1,3}|u\{([0-9a-fA-F]+)\})/g,
diff --git a/src/phpdoc-parser/parser/type-parser.ts b/src/phpdoc-parser/parser/type-parser.ts
@@ -307,7 +307,7 @@ export class TypeParser {
     }
 
     try {
-      const constExpr = this.constExprParser.parse(tokens, true);
+      const constExpr = this.constExprParser.parse(tokens);
       if (constExpr instanceof ConstExprArrayNode) {
         throw exception;
       }
@@ -766,7 +766,7 @@ export class TypeParser {
     }
 
     try {
-      const constExpr = this.constExprParser.parse(tokens, true);
+      const constExpr = this.constExprParser.parse(tokens);
 
       if (constExpr instanceof ConstExprArrayNode) {
         throw exception;
diff --git a/tests/parser/const-expr-node.test.ts b/tests/parser/const-expr-node.test.ts
@@ -85,11 +85,11 @@ const floatNodeParseData = [
 ] as TestFixtureDataItem[];
 
 const stringNodeParseData = [
-  // String
-  ['"foo"', new ConstExprStringNode('"foo"', ConstExprStringNode.DOUBLE_QUOTED)],
-  ['"Foo \\n\\"\\r Bar"', new ConstExprStringNode('"Foo \\n\\"\\r Bar"', ConstExprStringNode.DOUBLE_QUOTED)],
-  ["'bar'", new ConstExprStringNode("'bar'", ConstExprStringNode.SINGLE_QUOTED)],
-  ["'Foo \\' Bar'", new ConstExprStringNode("'Foo \\' Bar'", ConstExprStringNode.SINGLE_QUOTED)],
+  // String - values are always unescaped in v2.0
+  ['"foo"', new ConstExprStringNode('foo', ConstExprStringNode.DOUBLE_QUOTED)],
+  ['"Foo \\n\\"\\r Bar"', new ConstExprStringNode('Foo \n"\r Bar', ConstExprStringNode.DOUBLE_QUOTED)],
+  ["'bar'", new ConstExprStringNode('bar', ConstExprStringNode.SINGLE_QUOTED)],
+  ["'Foo \\' Bar'", new ConstExprStringNode("Foo ' Bar", ConstExprStringNode.SINGLE_QUOTED)],
 ] as TestFixtureDataItem[];
 
 const arrayNodeParseData = [
@@ -224,7 +224,7 @@ describe('ConstExprParser', () => {
         const visitor = new NodeCollectingVisitor();
         const traverser = new NodeTraverser([visitor]);
 
-        parser = new ConstExprParser(true, {
+        parser = new ConstExprParser({
           lines: true,
           indexes: true,
         });
diff --git a/tests/parser/upstream-v2-features.test.ts b/tests/parser/upstream-v2-features.test.ts
@@ -114,9 +114,9 @@ describe('Upstream v2.0+ Features', () => {
 
     it('should parse single-quoted string in const expr', () => {
       const lexer = new Lexer();
-      const parser = new ConstExprParser(true);
+      const parser = new ConstExprParser();
       const tokens = new TokenIterator(lexer.tokenize("'hello'"));
-      const node = parser.parse(tokens, true);
+      const node = parser.parse(tokens);
       expect(node).toBeInstanceOf(ConstExprStringNode);
       const strNode = node as ConstExprStringNode;
       expect(strNode.value).toBe('hello');
@@ -125,9 +125,9 @@ describe('Upstream v2.0+ Features', () => {
 
     it('should parse double-quoted string in const expr', () => {
       const lexer = new Lexer();
-      const parser = new ConstExprParser(true);
+      const parser = new ConstExprParser();
       const tokens = new TokenIterator(lexer.tokenize('"world"'));
-      const node = parser.parse(tokens, true);
+      const node = parser.parse(tokens);
       expect(node).toBeInstanceOf(ConstExprStringNode);
       const strNode = node as ConstExprStringNode;
       expect(strNode.value).toBe('world');

Original file line number	Diff line number	Diff line change
`@@ -307,7 +307,7 @@ export class TypeParser {`
`307`	`307`	`}`
`308`	`308`
`309`	`309`	`try {`
`310`		`- const constExpr = this.constExprParser.parse(tokens, true);`
	`310`	`+ const constExpr = this.constExprParser.parse(tokens);`
`311`	`311`	`if (constExpr instanceof ConstExprArrayNode) {`
`312`	`312`	`throw exception;`
`313`	`313`	`}`
`@@ -766,7 +766,7 @@ export class TypeParser {`
`766`	`766`	`}`
`767`	`767`
`768`	`768`	`try {`
`769`		`- const constExpr = this.constExprParser.parse(tokens, true);`
	`769`	`+ const constExpr = this.constExprParser.parse(tokens);`
`770`	`770`
`771`	`771`	`if (constExpr instanceof ConstExprArrayNode) {`
`772`	`772`	`throw exception;`