midas/parser/midas.py

from typing import Optional

from core.ast.midas import (
    ConstraintExpr,
    OpStmt,
    PropertyStmt,
    Stmt,
    TypeBodyExpr,
    TypeExpr,
    TypeStmt,
)
from lexer.token import Token, TokenType
from parser.base import Parser
from parser.errors import ParsingError


class MidasParser(Parser):
    SYNC_BOUNDARY: set[TokenType] = {TokenType.TYPE, TokenType.OP, TokenType.CONSTRAINT}

    def parse(self) -> list[Stmt]:
        statements: list[Stmt] = []
        while not self.is_at_end():
            stmt: Optional[Stmt] = self.declaration()
            if stmt is None:
                print("Early stop")
                break
            statements.append(stmt)
        return statements

    def synchronize(self):
        self.advance()
        while not self.is_at_end():
            if self.previous().type == TokenType.NEWLINE:
                return
            if self.peek().type in self.SYNC_BOUNDARY:
                return
            self.advance()

    def declaration(self) -> Optional[Stmt]:
        try:
            if self.match(TokenType.TYPE):
                return self.type_declaration()
            if self.match(TokenType.OP):
                return self.op_declaration()
            # if self.match(TokenType.CONSTRAINT):
            #     return self.constraint_declaration()
        except ParsingError:
            self.synchronize()
            return None

    def type_declaration(self) -> TypeStmt:
        name: Token = self.consume(TokenType.IDENTIFIER, "Expected type name")
        self.consume(TokenType.LESS, "Expected '<' after type name")
        bases: list[TypeExpr] = []
        while not self.check(TokenType.GREATER) and not self.is_at_end():
            bases.append(self.type_expr())
            if not self.check(TokenType.GREATER):
                self.consume(TokenType.COMMA, "Expected ',' between type bases")
        self.consume(TokenType.GREATER, "Expected '>' after base type")

        body: Optional[TypeBodyExpr] = None

        if self.check(TokenType.LEFT_BRACE):
            body = self.type_body_expr()
        return TypeStmt(name=name, bases=bases, body=body)

    def type_expr(self) -> TypeExpr:
        name: Token = self.consume(TokenType.IDENTIFIER, "Expected type name")
        constraints: list[ConstraintExpr] = []

        while not self.is_at_end() and self.match(TokenType.PLUS):
            constraints.append(self.constraint_expr())

        return TypeExpr(name=name, constraints=constraints)

    def constraint_expr(self) -> ConstraintExpr:
        # TODO
        return ConstraintExpr()

    def type_body_expr(self) -> TypeBodyExpr:
        self.consume(TokenType.LEFT_BRACE, "Expected '{' to start type body")
        properties: list[PropertyStmt] = []
        while not self.check(TokenType.RIGHT_BRACE) and not self.is_at_end():
            properties.append(self.property_stmt())
        self.consume(TokenType.RIGHT_BRACE, "Unclosed type body")
        return TypeBodyExpr(properties=properties)

    def property_stmt(self) -> PropertyStmt:
        name: Token = self.consume(TokenType.IDENTIFIER, "Expected property name")
        self.consume(TokenType.COLON, "Expected ':' after property name")
        type: TypeExpr = self.type_expr()
        return PropertyStmt(name=name, type=type)

    def op_declaration(self) -> OpStmt:
        self.consume(TokenType.LESS, "Expected '<' before first type")
        left: TypeExpr = self.type_expr()
        self.consume(TokenType.GREATER, "Expected '>' after first type")

        op: Token = self.advance()

        self.consume(TokenType.LESS, "Expected '<' before second type")
        right: TypeExpr = self.type_expr()
        self.consume(TokenType.GREATER, "Expected '>' after second type")

        self.consume(TokenType.EQUAL, "Expected '=' after second type")

        self.consume(TokenType.LESS, "Expected '<' before result type")
        result: TypeExpr = self.type_expr()
        self.consume(TokenType.GREATER, "Expected '>' after result type")

        return OpStmt(left=left, op=op, right=right, result=result)