Implementando Lox en Haskell

O, en resumen,

Qué tal estuvo implementar un lenguaje de programación con tipado dinámico y orientado a objetos, con clases y herencia, utilizando programación funcional pura y estáticamente tipada.

Jean-Baptiste Emmanuel Zorg diciendo mi favorito.

Transparencia referencial, inmutabilidad, evaluación perezosa, programación guiada por tipos, mónadas, cálculo lambda y otros amigos.

Siempre me atrajo la programación funcional propuesta por Haskell.

Programar utilizando propiedades matemáticas, de forma declarativa y con las dependencias explícitas, ver cómo encajan todas las piezas (y el compilador acepta el programa) cuando tu modelo de tipos se ajusta al problema, notar cómo tu entendimiento mejora en el proceso.

Otra historia.

Como también me pasa con Nix, toda aquella pieza de tecnología con estos principios —a menudo tras curvas de aprendizaje popularmente elevadas—, que prometa a cambio una mejor perspectiva sobre la programación o alguno de sus aspectos tangenciales suele ganar mi interés.

Quizá solamente es porque juego al Bloodborne y aplico su filosofía a todos los demás aspectos de mi vida. En cualquier caso, desde hace años, Haskell es mi lenguaje para proyectos paralelos y mis entornos de desarrollo y despliegue se describen vía Nix.

Estas perspectivas me acompañan hoy día en mi trabajo diario con Rust, mi lenguaje profesional. Creo que soy mejor programador gracias a ellas.

Fabricando intérpretes

Algunos miembros del equipo de Agent Control en New Relic tenemos un club de lectura semanal. Hace unos meses seleccionamos Crafting Interpreters de Robert Nystrom (puedes leerlo gratis en su web), en gran parte por ser de naturaleza más práctica que las lecturas anteriores (Rust for Rustaceans de Jon Gjenset y Asynchronous Programming in Rust de Carl Fredrik Samson).

El libro implementa un lenguaje de programación orientada a objetos simple llamado Lox. Lo hace dos veces, con estrategias y lenguajes diferentes cada vez. Primero en Java (jlox) mediante recorrido de árboles, luego en C (clox) con una máquina virtual de bytecode.

Como no queríamos hacer la primera parte en Java (xd) cada uno de nosotros escogió su propio lenguaje para la primera parte del libro.

Así que ahora ya sabes a qué vino la introducción.

Este artículo explora varios aspectos de mi implementación de jlox en Haskell.

¡Puedes ver mi implementación mientras lees!

El código de mi implementación, llamada (no muy originalmente) hox, está publicado en GitHub. Pasa toda la suite de tests del repositorio oficial de Crafting Interpreters (más sobre esto a continuación) para jlox, por lo que es conforme a lo especificado en el libro.

Vamos allá.

Entorno reproducible con Nix

Te lo dije.

Haskell utiliza cabal como gestor de proyectos. Creo que, aún con sus asperezas, es una herramienta bastante buena. Sin embargo, como ya decía al principio, me gustan mis dependencias controladas y descritas lo más completamente posible. #nix es un viejo conocido en este sitio, y por descontado la mejor herramienta a día de hoy para encargarse de eso.

Así que antes de escribir mi primera línea de Haskell me aseguré de que mi entorno de desarrollo fuese un flake en condiciones. Con el flake pude establecer algunos aspectos que quería desde el minuto uno:

La versión del compilador que me interesaba (GHC 9.12.2, para probar las extensiones de GHC2024)
Un formateador “único” para todos los tipos de fuentes del proyecto con treefmt.
Pre-commit hooks para todas las comprobaciones que me interesaban, incluyendo hooks custom (hlint, weeder, doctest, etc).
Un shell de desarrollo con todas las dependencias listas (incluyendo formateador y hooks).

Más relevante que todos estos aspectos para comprender la potencia de Nix es el cómo pude utilizarlo para ejecutar los tests del repositorio de Crafting Interpreters.

El código de los bancos de tests está escrito en Dart 2, y desde 2023 Dart está en la versión 3. Dart 3 obliga a asegurar la Null Safety, cosa que los tests no habían hecho porque la versión 2 no lo requiere, así que estos tests no funcionan con la última versión. Si fuese un programador de Dart y tuviese instalada la versión 3 tendría que pelear con mi entorno para instalar la versión 2 y poder ejecutar los tests sin alterar mi entorno habitual. Tal vez alguna herramienta tipo nvm para Dart, asdf o contenedores…

Pero como uso Nix, no tengo que preocuparme de este problema en absoluto. No tengo que conocer herramientas específicas para el lenguaje de turno ni arriesgarme a conflictos con herramientas instaladas globalmente (un saludo, Python).

Busco Dart en el repositorio de paquetes de Nix, nixpkgs, el más grande y más actualizado del mundo. Busco la revisión de git de nixpkgs que contenga la versión de Dart que me sirve. Fijo la revisión como entrada a mi flake… y listo, Dart 2.19.6 listo para ejecutar en mi terminal. Gracias a direnv, en el momento en el que salgo del directorio del proyecto el ejecutable de dart desaparece o, si fuese un programador de Dart con una instalación global, volvería a la última a fecha de escribir el artículo (3.9.4).

De nuevo, tirando de las funciones de Nix escribo un script, también en Haskell, (inline!) que llama a Dart como si fuese un script de Bash, de forma que puedo ejecutar los tests de cada capítulo de forma aislada y pasándole mi implementación del intérprete.

¿Cómo? mira esto (sacado del repo de Shh):

writers.writeHaskellBin "example" { libraries = [ haskellPackages.shh ]; } ''
  {-# LANGUAGE TemplateHaskell #-}
  import Shh

  -- Load binaries from Nix packages. The dependencies will be captured
  -- in the closure.
  loadFromBins ["${git}", "${coreutils}", "${curl}"]

  main :: IO ()
  main = do
    cat "/a/file"
    cp "/a/file" "/b/file"
''

Fíjate en el comentario del centro. Hasta la versión de las coreutils está fijada por Nix.

Es un nivel de control inigualable, no vuelves a mirar (ni a ejecutar) un script de Bash igual.

Por supuesto, automatizar la ejecución de estos tests en la CI (mismas versiones de programas, etc, etc) es trivial. Esto da confianza absoluta: puedo saber si mi implementación actual supera los tests oficiales y seleccionar granularmente cuántos y cuáles capítulos compruebo, independientemente del lenguaje que haya escogido.

Escribí mi CI para que cada pull request al repositorio implementando un capítulo debiese pasar todos los tests de dicho capítulo. Nada de medias tintas.

Si quieres verlo, echa un vistazo a mi flake.nix.

Escaneando: de la mutabilidad a la recursión de cola

El primer paso de cualquier intérprete es el escáner (o lexer). En Java, Nystrom usa estructuras habituales, whiles que avanzan sobre la cadena de caracteres de entrada, mutando el estado en cada iteración (while (!isAtEnd()) { start = current; ... }).

¿Cómo te aproximas a esto en Haskell, donde casi todo es inmutable y no hay estado? No es cuestión de tirar de map o foldl sobre listas de caracteres, porque puedes necesitar más que un carácter cada vez para determinar ante qué token te encuentras. Cuando llegas a = necesitas más para saber si estás ante un signo de igual o ante un operador lógico ==.

La respuesta a que no haya estado mutable es llevar el estado contigo en la función, llamándola recursivamente y pasando explícitamente el estado actualizado. ¿Te suena lo de las dependencias explícitas?.

Este es el tipo de mi función de escaneo en Haskell.

First time?

Si nunca has visto una firma de tipos de Haskell, asume que todos los tipos que aparecen excepto el último son parámetros de la función, y el tipo que aparece al final es el tipo de retorno.

Para saber más, lee sobre el currying.

-- | Scans the input strings and tracks the state: the current line number and the accumulated tokens
naiveScanTokens ::
  -- | Input string (a linked list of characters, `String` == `[Char]`)
  [Char] ->
  -- | Current line number
  Int ->
  -- | Accumulated tokens (my state!)
  [TokenResult] -> 
  -- | Resulting list of tokens, a non-empty list, can contain scanning errors
  NonEmpty TokenResult

¿Naíf?

La función se llama naiveScanTokens porque inicialmente exploré, aparte de esta versión literalmente escrita caso a caso según leía, otra versión utilizando combinadores de parsers monádicos (ya, ya. Sigue leyendo) y la biblioteca megaparsec.

Finalmente descarté esta segunda opción por una cuestión didáctica a varios niveles:

Calentamiento después de un par de meses sin tocar Haskell.
No usar bibliotecas externas en la implementación.
La sección de parsing ya me permitiría usar, también manualmente, los combinadores.
Introducir algunos patrones de programación funcional y Haskell a mis compañeros de equipo.
Escribir este artículo algún día.

La implementación simplemente hace pattern matching sobre los caracteres de entrada y llama a la misma función actualizando el estado hasta que termina. Fíjate en cómo capturo cada carácter y cómo vinculo el resto de la lista a ss con el operador : en los argumentos de entrada, en el lado izquierdo de la definición, para pasarla a la nueva llamada en el lado derecho, y cómo en el caso base añado del estado de entrada (el argumento tt) el token EOL a la lista de salida (por eso nunca está vacía) con :|.

-- We start with the base case: no more characters to process, I just add the EOF token
naiveScanTokens "" l tt = validToken EOF l :| tt
naiveScanTokens ('(' : ss) l tt = naiveScanTokens ss l (validToken LEFT_PAREN l : tt)
naiveScanTokens (')' : ss) l tt = naiveScanTokens ss l (validToken RIGHT_PAREN l : tt)
-- ...
-- Operators
naiveScanTokens ('!' : '=' : ss) l tt = naiveScanTokens ss l (validToken BANG_EQUAL l : tt)
naiveScanTokens ('!' : ss) l tt = naiveScanTokens ss l (validToken BANG l : tt)
-- ...
-- Whitespaces (no newlines)
naiveScanTokens (s : ss) l tt
  | s == ' ' || s == '\r' || s == '\t' =
      naiveScanTokens ss l tt
-- ... all other cases
-- If we reach here, it means we encountered an unexpected character
naiveScanTokens (s : ss) line tt = naiveScanTokens ss line (syntaxError "Unexpected character." line [s] : tt)

Tienes una función definida varias veces según los diferentes comportamientos que quieres. Es como sobrecargar una función por posibles sus valores de entrada.

El código es casi una transcripción directa de las instrucciones del libro. Iba añadiendo los casos a la función según los leía, pero sin contadores manuales ni constructos de control de flujo while o for. Llamada Datos y estado de entrada, transformación, y nueva llamada con nuevos datos y estado.

Solo hay que pasar un estado inicial (la primera línea y la lista vacía de resultados) junto a la entrada, que es lo que hago con scanTokens (esta solo tiene que aceptar el verdadero input):

scanTokens :: String -> NonEmpty TokenResult
scanTokens s = reverse (naiveScanTokens s 1 [])

Puedes ver la implementación completa de naiveScanTokens en mi repositorio (Scanner/Naive.hs)

Visitor vs Pattern Matching de tipos suma

La sección Working with trees del capítulo 5 explora las diferencias expresivas entre el paradigma orientado a objetos y el paradigma funcional, y cómo el patrón de diseño visitor trata de acercar el estilo funcional al orientado a objetos.

Por supuesto, al acercarme al problema desde la programación puramente funcional, no iba a necesitar implementar el patrón visitor. Como el propio libro menciona:

Each kind of expression in Lox behaves differently at runtime. That means the interpreter needs to select a different chunk of code to handle each expression type. With tokens, we can simply switch on the TokenType. But we don’t have a “type” enum for the syntax trees, just a separate Java class for each one.

¡Nosotros sí que tenemos ese “type” enum!

El sistema de tipos de Haskell es una de sus grandes fortalezas. En particular, tenemos a nuestra disposición los ADTs (Algebraic Data Types), y su forma de tipos suma (que también se ve en los enum de Rust) cubre este caso con total naturalidad, particularmente con la sintaxis de Haskell.

La gramática formal para las expresiones de Lox empieza así, sacada tal cual del libro:

expression     → literal
               | unary
               | binary
               | grouping ;

Y la primera versión de mi AST de expresión expresada como un tipo en Haskell se veía así:

-- | Represents an expression in the AST.
data Expression = Literal Literal
                | Unary UnaryOperator Expression
                | Binary BinaryOperator Expression Expression
                | Grouping Expression

Hay información que falta en cada uno de los fragmentos, claro, pero imagino que pillas la idea 😎.

El intérprete se reduce a una función que encaja cada patrón, como el escáner, pero esta vez sobre los constructores de variantes del tipo. Es una solución más concisa que evita escribir un puñado de clases sin métodos para implementar visitor, y por supuesto te ahorra escribir el generador que el autor tiene que fabricar para agilizar el añadido de dichas clases (son 21).

Puedes ver mi tipo de expresión actual en Syntax/Expression.hs.

Parseando: combinadores de parsers monádicos

Esta sección creció demasiado, así que he decidido extraerla en su propio artículo para darle la atención que merece.

Si quieres saber cómo funcionan los parsers monádicos, qué tienen que ver con Result::and_then en Rust y cómo se combinan para crear estructuras complejas a partir de piezas simples, echa un vistazo a mi Introducción a los Combinadores de Parsers Monádicos

Allí explico en detalle cómo pasamos de la idea de un escáner manual a una abstracción mucho más potente, declarativa y reutilizable.

Codificando la distancia de resolución de variables en el AST

Uno de los desafíos más interesantes fue el capítulo de Resolución de Variables. En Lox, para manejar cierres (closures) correctamente, necesitamos saber a cuántos “saltos” (scopes léxicos) de distancia está definida una variable.

La solución Java: Side-Tables

En Java, el Resolver recorre el árbol y guarda esta información en un Map<Expr, Integer> separado. El AST no cambia. Esto funciona en Java porque cada objeto Expr tiene identidad (dirección de memoria) y puede usarse como clave en un mapa.

El problema en Haskell

En Haskell, los valores son inmutables y estructurales. Variable "a" es idéntico a otro Variable "a". No tienen “identidad” por defecto. Para usar un Map, necesitaría adjuntar IDs únicos a cada nodo de forma incremental, lo que no escalaría demasiado, o usar trucos inseguros como salir a IO para obtener uno aleatorio.

Type-Driven Development

En lugar de una tabla lateral, decidí que la información de resolución debía vivir dentro del propio AST. Pero el Parser no conoce esa información en el momento en que emite nuestro AST. ¿Cómo definimos un AST que a veces tiene resolución y a veces no de forma segura?

Con esto de “segura” me refiero a que quiero validar estáticamente que mi AST está en el estado correcto en cada etapa de su procesamiento. Es decir, mi parser debe ser una función de tipo (obviando posibilidad de errores y otras cosas cubiertas con anterioridad):

parser :: [Token] -> UnresolvedAST

Y que, del mismo modo, la etapa de resolución sea llevada a cabo por una función resolver de tipo:

resolver :: UnresolvedAST -> ResolvedAST

De forma que al intérprete real del programa solo pueda pasársele el tipo ResolvedAST:

interpret :: ResolvedAST -> Either RuntimeError ()

Esto es la seguridad de tipos o type safety, ninguna función debe poder recibir un valor de un tipo que no le corresponde. Nada de pasarle ASTs ya “resueltos” al resolver, o ASTs sin resolver al interpret.

Esto se podría lograr parametrizando el tipo de AST con un genérico, pero entonces tendríamos que preocuparnos de que solo los genéricos apropiados puedan servir como parámetros del AST. Un simple AST a no vale, necesito algún tipo de restricción sobre a… Rust utiliza técnicas como traits sellados para lograr esto, pero en Haskell, gracias a su completo sistema de tipos, hay otras opciones.

Para expresar esto, utilicé los conceptos de Data Kinds y Type Families.

¿Qué es eso de Kinds?

He pasado de forma extremadamente superficial en otro de mis artículos, pero aquí ahondo un poco más.

Puedes definir un tipo como el conjunto de valores contenidos en ese tipo:

Bool es un tipo que contiene a los valores True y False.
Int es un tipo que contiene a los valores enteros (…, -2, -1, 0, 1, 2, etc).

Se puede decir que los valores (terms) pertenecen al universo de sus tipos. False pertenece al universo de Bool, -1 al universo de Int, etc.

Los tipos, a su vez, tienen su propia clasificación, subiendo un nivel de abstracción, llamada Kind. En función de cómo de genéricos son, los tipos están englobados en sus propios universos o Kinds.

Type es el universo (Kind) de los tipos básicos.
- Bool e Int son tipos dentro de este universo.
- Maybe Int o Either String () también pertenecen a este universo.
Type -> Type es el universo de los tipos que tienen un parámetro genérico desconocido.
- Maybe (¡pero no Maybe Int!) pertenece a este universo.
- Either String (¡pero no Either String ()!) también pertenece a este universo.
Type -> Type -> Type es el universo de los tipos que tienen dos parámetros genéricos desconocidos.
- Either (sin especificar ninguno de sus parámetros) pertenece a este universo.

Hay otros universos, y pueden combinarse de varias formas.

Sabemos que en Haskell puedes crear tus propios tipos. ¿Podríamos crear nuestros propios Kinds? Si creo mi propio Kind, ¿Qué tipos viven dentro de él? ¿Qué valores tienen esos tipos?

Eso es permitido por lo que se conoce como Data Kinds. Cada vez que definimos un tipo, Haskell crea un Kind con el mismo nombre, y los constructores de valor del tipo original son como tipos, aunque no se pueden construir valores de estos.

data MyBool   -- This is a type
  = MyTrue    -- This is a value constructor
  | MyFalse   -- This is another value constructor

{-
-- behind the scenes, it's like Haskell created the following:
kind MyBool    -- This is a Kind
  = MyTrue    -- This is a type!
  | MyFalse   -- This is a type!
-}

Pero si no puedo construir valores de estos extraños tipos promocionados a partir de un tipo convencional, ¿para qué sirven? Una respuesta fácil es etiquetar otros tipos, de forma que obtengo la restricción que buscaba para el parámetro genérico de mi tipo AST.

-- Definimos las fases de resolución del AST
data Phase = Unresolved | Resolved

-- Haskell crea la `Kind` llamada `Phase` entre bambalinas.

-- El AST usa esta `Kind` como parámetro, `p` solo puede ser `Unresolved` o `Resolved`!
data Expression (p :: Phase)
  = ...

Aún nos queda un detalle. Si este Kind no puede generar valores, y mi resolución necesita esta información dinámicamente (una variable puede estar definida 2 scopes léxicos por encima, o 3, o podría ser una variable global) ¿Cómo la incorporamos al AST si hemos restringido los tipos genéricos a este Kind?

Aquí intervienen las Type Families.

Type Families

Una familia de tipos o type family no es otra cosa que una función de tipo a tipo. Como tal, solo existe en tiempo de compilación, pero eso no la hace ni mucho menos inútil.

Siendo que nuestro AST está parametrizado por un Kind que tiene tipos pero no puede tener valores en tiempo de ejecución, la type family puede relacionar los tipos de este Kind con tipos que sí puedan tener valores.

Siguiendo con nuestro ejemplo:

-- Definimos las fases de resolución del AST
data Phase = Unresolved | Resolved

-- Un tipo sin valores posibles, "zero-sized"
data NotResolved

-- Un tipo con valores que representa una resolución concreta, global o local
data Resolution
  = Global -- Variable global
  | Local Int -- Variable local a X (Int) scopes de distancia

-- Haskell crea la `Kind` llamada `Phase` entre bambalinas.
-- También crearía `Kind`s para `NotResolved` y `Resolution`, pero no nos interesan.

-- Una familia de tipos que cambia según la fase
-- Funciones que reciben un tipo (de `Kind Phase`) y devuelven otro tipo (de `Kind Type`),
-- en este caso, los tipos definidos anteriormente
type family ResolutionInfo (p :: Phase) :: Type where
  ResolutionInfo 'Unresolved = NotResolved 
  ResolutionInfo 'Resolved = Resolution

-- El AST usa esta familia de tipos
data Expression (p :: Phase)
  = VariableExpr
      Int                -- Línea
      String             -- Nombre
      (ResolutionInfo p) -- La type family es aplicada a `p`
  -- ...

La type family es una función, en tiempo de compilación relaciona el Kind Phase con un tipo concreto, de esta forma el tipo genérico p de nuestro AST no puede ser cualquier cosa, solo lo que nosotros definamos, ¡y en tiempo de compilación!

¡Esto es Type-Driven Development!

El Parser produce un Program 'Unresolved.
El Resolver toma un Program 'Unresolved y devuelve un Program 'Resolved.
El Interpreter solo acepta Program 'Resolved.

-- Interpreter.hs
programInterpreter :: Program 'Unresolved -> Interpreter ()
programInterpreter prog = do
  let (resolvedProg, errors) = runResolver (programResolver prog)
  if null errors
    then interpretProgram resolvedProg -- Aquí GHC sabe que es seguro
    else throwError (Resolve errors)

Note

Fíjate en que las firmas de tipo mencionan los tipos del Kind Phase como 'Unresolved y 'Resolved respectivamente, con un apóstrofe delante. Esto es para desambiguar con los constructores de valores del tipo convencional Phase, que sigue pudiendo definir valores en tiempo de ejecución aunque no se use para ello.

Si intento ejecutar un programa sin resolver, ¡el código ni siquiera compila! Es una garantía de seguridad que otros lenguajes, ni siquiera Rust, pueden ofrecer tan fácilmente.

Un breve paso por los GADTs

Otra forma que exploré para codificar esto fueron los GADTs (Generalized Algebraic Data Types), tipos genéricos cuyo parámetro concreto está determinado por su constructor de datos, pero finalmente la solución con Data Kinds y Type Families estaba más alineada con lo que quería lograr.

Gestionando el Estado: Restricciones por clases y MTL

En Java, el intérprete es una clase con campos mutables (environment). En Haskell, la mutabilidad y los efectos deben ser explícitos. Mi implementación utiliza la librería MTL (Monad Transformer Library) para construir una pila de efectos cuyo requerimiento es que cumplan la interfaz mónada:

newtype InterpreterT m a = Interpreter
  { runInterpreterT :: StateT (ProgramState Value) (ExceptT InterpreterError m) a
  }
  deriving newtype
    ( Functor,
      Applicative,
      Monad,
      MonadState (ProgramState Value),
      MonadError InterpreterError,
      MonadIO
    )

type Interpreter = InterpreterT IO -- concrete implementation

Visualmente, la pila de efectos se ve así:

graph BT
    IO["IO (Base: Efectos de consola)"]
    ExceptT["ExceptT (Manejo de Errores)"] -->|envuelve| IO
    StateT["StateT (Entorno y Variables)"] -->|envuelve| ExceptT
    InterpreterT["InterpreterT (Newtype Wrapper)"] -->|envuelve| StateT

La capacidad de Haskell de generar las implementaciones de Functor, Applicative, Monad y las clases de transformadores (MonadState, MonadError, MonadIO) automáticamente, como se ve en ese deriving newtype ... hace muy sencillo trabajar con ellas.

Lo interesante aquí no es solo la pila de mónadas ni que las implementaciones se generen automáticamente, sino cómo se utilizan. La mayoría de las funciones del intérprete no conocen el tipo concreto sobre el que operan. En su lugar, utilizan restricciones de clases de tipos (typeclass constraints):

evaluateExpr :: (
  MonadState (ProgramState Value) m,
  MonadError InterpreterError m
  ) => Expression 'Resolved -> m Value

Esta firma dice: “esta función funciona en cualquier mónada m que tenga un estado de tipo ProgramState y pueda lanzar errores de tipo InterpreterError”. Esto desacopla la lógica de la implementación concreta (mi tipo Interpreter), facilitando los tests y permitiendo reutilizar funciones en diferentes contextos (como el Resolver, que comparte algunas de estas capacidades pero no todas, teniendo una estructura en cierto modo similar al Interpreter).

No es más que inyección de dependencias para efectos en Haskell, donde efecto es algo tan general como “puede fallar con este tipo de error”, “gestiona estados de este tipo”, etc.

Un detalle elegante es cómo se manejan los scopes. En Java podríamos usar try-catch-finally para asegurar que, al salir de un bloque, el entorno anterior se restaura. En Haskell, uso catchError (una función que es proporcionada por la clase MonadError, nada que ver con excepciones) junto con las primitivas de estado:

executeBlock decls = do
  modify pushScope        -- Entrar en nuevo scope
  -- Si 'go decls' falla, ejecutamos el handler que hace popScope y relanza el error
  r <- catchError (go decls) (\e -> modify popScope >> throwError e)
  modify popScope         -- Salir del scope (caso exitoso)
  pure r

Haskell también tiene excepciones, pero trato de no utilizarlas en favor de tratar lo más posible a los errores como valores.

Errores como Valores

Una de las diferencias filosóficas más grandes de mi implementación respecto a la del libro es el manejo de errores. En lugar de que el flujo de control salte mágicamente (con las exceptiones), los errores son valores (Left InterpreterError) que se propagan.

Aunque ExceptT o la implementación monádica de Either b hacen que parezca imperativo trabajar con errores (puedes hacer short-circuiting), su estatus de tipos de pleno derecho te obliga a ser consciente de en qué partes del código pueden fallar las cosas y con qué valores pueden fallar. ¡La firma de tipos lo indica!

Da una tranquilidad enorme saber que, en general, mirar una firma de tipos ya te dice si una función puede fallar o no. Esto se extiende a saber si una función es pura o interactúa de alguna forma con el mundo exterior (cuando IO _ aparece en el valor de retorno).

Azúcar Sintáctico: Pattern Synonyms

En mi implementación del flujo de control y particularmente en los retornos de función (esos return true;), de nuevo queriendo distanciarme del uso de excepciones para expresarlas, como hace la implementación de Java (😭💀) me encontré con un patrón común. Necesitaba un tipo que representara “seguir ejecutando” o “detenerse y devolver un valor”.

Podría haber usado Either b c, pero quería algo más descriptivo, y estando familiarizado con el tipo ControlFlow de Rust decidí crear mi propia versión, sin que fuera nada del otro mundo:

data ControlFlow b c
  = Break b     -- Detener el flujo con un valor (ej. return)
  | Continue c  -- Seguir ejecutando (también con un valor, ¿quién sabe?)

Sin embargo, leer Break cuando estamos implementando una sentencia return me producía un poco de disonancia cognitiva, así que eché mano de otra de las herramientas de tipado de Haskell, los Pattern Synonyms. Me permiten crear un “constructor virtual” que hace de alias de uno existente:

{-# LANGUAGE PatternSynonyms #-}

{-# COMPLETE Return, Continue #-}
data ControlFlow b c
  = Break b
  | Continue c
  deriving stock (Show, Eq)

-- | Pattern synonym for 'Break' to represent a return value in control flow.
pattern Return :: b -> ControlFlow b c
pattern Return x = Break x

Añadiendo un pragma COMPLETE para que el chequeo de patrones del compilador considere que cubrir Continue y Return sea exhaustivo sobre todas las variantes del tipo ControlFlow, mi código del intérprete puede usar Return como si fuera un constructor real, haciendo que la intención sea muy clara:

runFunctionBody ::
  ( MonadState (ProgramState Value) m,
    MonadError InterpreterError m,
    MonadIO m -- functions can print to screen, check the time, etc
  ) =>
  [Declaration 'Resolved] -> m Value
runFunctionBody [] = pure VNil
runFunctionBody (d : ds) =
  interpretDeclF d >>= \case
    Return v -> pure v -- yeah Return as Break!
    Continue () -> runFunctionBody ds

Es un pequeño detalle, pero demuestra cómo Haskell te permite modelar el dominio de tu problema no solo en los tipos, sino también en la sintaxis misma. ¿Es sobre-ingeniería para este intérprete? Totalmente. Pero parte de la diversión de usar un lenguaje así de expresivo en el tipado (y en general) es ver hasta dónde puedes llegar con él.

Testeo de propiedades

Además de la suite oficial de tests de Lox, que son casos de ejemplo específicos que analizan la salida de tu programa, lo que no te permite saber dónde tienes el bug, aproveché el ecosistema de Haskell para añadir Property-Based Testing con QuickCheck, una utilidad de test muy conocida, que utilizé desde el framework tasty.

En lugar de escribir assert(scan("((") == [LEFT_PAREN, LEFT_PAREN]), defino propiedades universales que mi código debe cumplir para cualquier entrada generada aleatoriamente. Por ejemplo, mi escáner debe cumplir siempre que:

La lista de tokens resultante nunca puede ser más larga que la cadena de entrada (más uno por el EOF).
El escaneo siempre termina en un token EOF o en un error de “String no terminado”.

-- test/Scanner/Props.hs
scannerProperties :: TestTree
scannerProperties = 
  testGroup "Scanner Property Tests"
    [ testProperty "Always ends in EOF or an unterminated string error" eofOrUnterminatedString
    , testProperty "Less or equal tokens than input length" lessOrEqualTokensThanInputLength
    ]

Es una forma limitada de fuzz testing que comprueba una propiedad en tus funciones generando muchos parámetros aleatorios, pasándolos a tu función repetidas veces y, por medio de técnicas de shrinking, mostrándote el mínimo ejemplo donde tus invariantes no se cumplen si lo hay. Es ideal para encontrar esos casos esquineros (como cadenas vacías, o llenas de caracteres nulos) que a veces se nos pasa cubrir con tests unitarios convencionales.

Conclusiones

Uff, ¡Vaya tocho me ha quedado! A ver si vamos cerrando.

Orientación a objetos por medio de lo funcional

En resumen, implementar Lox en Haskell ha sido un ejercicio de traducción cultural. No solo es que el lenguaje propuesto para implementar Lox sea Java, sino que el propio Lox es orientado a objetos, con herencia y todo, ¡y además con tipado dinámico! Ha sido instructivo ver cómo implementar estos paradigmas desde un lenguaje que en cierto modo es todo lo contrario.

En el club de lectura hemos bromeado en que ahora solo me falta implementar un lenguaje funcional y estáticamente tipado utilizando Java. Creo que mejor más adelante…

Como Haskell es mi “lenguaje hobby”, ya estaba familiarizado a un nivel u otro con todas las herramientas que acabé utilizando. Con todo, me ha venido bien este repaso: tratar de adaptar los conceptos de Java según iban apareciendo, implementar algunas cosas a mano en lugar de tirar de librerías (e.g. megaparsec para los parsers) y atacar un proyecto con múltiples secciones (escáner, parser, resolver, intérprete) con el que poder visitar un aspecto diferente cada vez (funciones a mano, parser combinators, monad transformers).

El proyecto han sido menos de 2500 líneas de Haskell, aderezados con algo de Nix y otras cosas. Esto es lo que me muestra tokei:

$ tokei
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 Language              Files        Lines         Code     Comments       Blanks
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 Cabal                     1          212          129           59           24
 Haskell                  23         2985         2261          394          330
 Markdown                  2           90            0           56           34
 Nix                       2          295          152          134            9
 Shell                     1           15            5            5            5
 TOML                      1            9            5            3            1
─────────────────────────────────────────────────────────────────────────────────
 HTML                      1           39           37            0            2
 |- JavaScript             1          943          759           30          154
 (Total)                              982          796           30          156
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
 Total                    31         4588         3348          681          559
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

No sé de dónde ha salido el HTML y JavaScript, imagino que estará contando alguna ubicación con la documentación renderizada por cabal.

Cosas que me han gustado

El estilo del autor

Es un libro fresco, ilustrativo y muy entretenido de leer. Con muchos diagramas e ilustraciones, símiles con comida, algunos sarcasmos y bromas sin llegar a saturar, etc.

Siendo teleco, nunca estudié formalmente compiladores ni gramáticas, pero al princpio percibía estos temas desde fuera como algo más bien arcano. Esta percepción también la tenía el propio Nystrom, como menciona en la introducción, así que es loable su intento, más que exitoso, de darle un enfoque más fresco a algo tradicionalmente arduo.

Armado con lo que este libro te proporciona, puedes animarte a seguir explorando el tema por tu cuenta y quizá incluso hasta vencer a ese dragón.

No sé si su otro libro (Game Programming Patterns) será igual.

Un paradigma frente a otro

Es curioso ver frente a frente las diferencias entre un paradigma y otro.

Donde OOP con Java ve Comportamiento encapsulado con datos, FP con Haskell ve Datos puros y funciones transformadoras.
Donde OOP con Java usa Objetos con distinta identidad, FP con Haskell usa Tipos con igualdad estructural.
Donde OOP con Java usa Excepciones y mutabilidad, FP con Haskell usa Tipos, mónadas y transformadores.

A día de hoy, sigo sabiendo con cuál me quedo para representar y resolver mis problemas, pero sería de idiotas no estar familiarizado con los paradigmas de la mayoría del código que se sigue escribiendo por ahí.

Arquitecturas como la Resolución basada en Tipos me han mostrado un poder de expresividad y seguridad que difícilmente quiero abandonar para volver al mundo de void foo(). Haskell es una herramienta inmensamente poderosa que no solo resuelve problemas, sino que afila la mente del programador en el proceso.

La suite de testing de Crafting Interpreters

Es muy completa y recomiendo a cualquier persona que quiera seguir el libro que dedique un poco de tiempo a configurar algo de CI de forma que se ejecuten los tests de cada capítulo con tu intérprete.

En mi caso ensució un poco el código (tuve que mantener expuestas las funciones que emitían la lista de tokens, usar funciones que formateaban la salida de estas representaciones intermedias tal y como los tests esperaban, etc), pero da bastante paz mental abrir una Pull Request por capítulo a tu propio repositorio y ver cómo los tests correspondientes al capítulo de la suite oficial pasan al completo.

Una consecuencia algo negativa de esto es que me hizo no escribir tantos tests unitarios o property-based testing como habría sido ideal. Total, si pasaban los tests oficiales es que iba por buen camino.

No es todo lo exhaustiva que habría deseado, particularmente en un aspecto que comento justo a continuación, pero es más que suficiente.

Cosas que no me han gustado

Reporte de errores

No es solo que le tenga manía a las excepciones y el libro las haya usado en gran medida para gestionar los errores, sino que el reporte de errores es introducido en los primeros capítulos, creo que en el 4 (Scanning), y carece en todo momento de tests exhaustivos o unas directrices homogéneas que definan exactamente cómo debe portarse en todos los casos.

Al llegar al capítulo 6 (Parsing Expressions) se pasa un poco por encima de la sincronización, la recuperación del panic mode, etc, pero no hay unos tests que te digan que tu reporte de errores está en la forma correcta. Pasa lo propio cuando llegamos a la implementación del intérprete, el resolver, etc. La única forma que tienes de darte cuenta es cuando los tests te fallan porque el mensaje de error no está emitido como espera el test de turno, que recuerdo puede ser un test del intérprete, del resolver, del parser o de lo que haya tocado.

Esto causó que hubiera pocos capítulos en los que no tuviera que toquetear la gestión de los errores después de hacer algo que no estaba relacionado más allá de especificar el tipo de error en la firma de las funciones. Unos tests dedicados al principio podían haber hecho que me peleara un poco más con ese aspecto en ese momento para luego no volver a tocarlo más.

Cuando terminé la implementación del intérprete y pasé la suite de tests al completo tuve un único error. Un único error de mi implementación de los cientos de casos cubiertos a lo largo de todos los capítulos.

¿El comportamiento que rompió el test? Exacto, el maldito error reporting en el resolver, que se implementa varios capítulos antes. ¿Relacionado con lo que había implementado por último (herencia)? !No! Pero hasta en la última línea de código que escribí, el último commit del último capítulo, ahí estaba el error reporting no comportándose como debía.

Unos tests dedicados a cubrir esto desde el principio, en lugar de pasar superficialmente en cada capítulo, me habrían ahorrado luchas con un componente que debía estar ahí durante el desarrollo real sin molestar demasiado.

Bastante frustrante.

Un poco repetitivo

Quizá sea por lo que comentaba al principio de que no me ha enseñado nada totalmente nuevo de Haskell, quizá es debido a que Haskell es especialmente idóneo para desarrollar lenguajes y lo convierte en un trámite, o quizá sea más probablemente por la propia naturaleza del proyecto, pero en mi percepción la implementación se volvía algo repetitiva con el tiempo:

Añade este nuevo elemento a la gramática.
Añade variantes al AST.
Añade funciones al parser para emitir esas nuevas variantes de tu AST.
Añade gestión de las nuevas variantes del AST en el resolver.
Añade gestión de las nuevas variantes del AST en el intérprete.

Ciertamente había algo de desafío cada vez. ¿Cómo se interpreta exactamente this o super? ¿Cómo se llaman las funciones o métodos? ¿Cómo se crea una instancia de una clase y se saben los métodos que tiene la instancia a su disposición, etc? Pero había toda una ceremonia a repetir con cada nuevo rasgo que añadías al lenguaje que lo volvía algo tedioso.

Siguientes pasos

Mejorar el rendimiento

Mi implementación es una traducción en algunos casos equivalente a la de Java que iba siguiendo, en otros casos necesitada de enfoques alternativos.

Cuando la sección del tree-walk interpreter da paso a la sección de la bytecode virtual machine, el autor de Crafting Interpreters propone ver cuánto tarda nuestra implementación de Lox en evaluar un programa con la típica implementación básica del cálculo de sumas de números de Fibonacci:

fun fib(n) {
  if (n < 2) return n;
  return fib(n - 1) + fib(n - 2); 
}

var before = clock();
print fib(40);
var after = clock();
print after - before;

¡Huelga decir que el rendimiento de mi implementación deja bastante que desear!

La elección de determinadas estructuras de datos, por ejemplo las listas enlazadas tan ubicuas en Haskell, la inmutabilidad o la evaluación perezosa por defecto pueden hacer difícil analizar tus cuellos de botella con claridad, así que una de las próximas áreas de trabajo es mejorar en este aspecto.

Benchmarks en CI

No se puede mejorar lo que no se mide. Para asegurarme de que mis cambios futuros realmente mejoren el rendimiento del intérprete, o al menos no lo empeoren, integré una suite de benchmarks utilizando tasty-bench.

Elegí tasty-bench sobre el clásico criterion por su integración natural con el resto de mi infraestructura de tests, que ya estaba basada en el ecosistema de tasty. Utilicé como benchmark inicial para intérpretes es la función de Fibonacci de antes, que estresa la resolución de variables, las llamadas a función y las operaciones aritméticas básicas.

Pero ejecutar benchmarks en mi máquina no es suficiente. Quería visualizar la tendencia histórica. Para ello, escribí un workflow de GitHub Actions que:

Ejecuta los benchmarks en Linux (x64 y ARM) y macOS.
Convierte los resultados a JSON usando un pequeño script de Python.
Utiliza la acción benchmark-action/github-action-benchmark para generar gráficas de evolución y notificarme si un commit introduce una regresión de rendimiento superior al 150%.

Esto convierte el rendimiento en una propiedad observable del proyecto, a la espera de que haga algo por mejorarla.

La bytecode virtual machine, en Rust

Como ya mencioné, el libro Crafting Interpreters tiene una segunda parte: una máquina virtual de bytecode escrita en C (clox). Esta vez todos los compañeros del club de lectura hemos estado de acuerdo en utilizar Rust pero, ya que lo utlizamos diariamente en su forma segura, aprovecharemos para seguir los detalles de la implementación en C y sumergirnos de lleno en ámbitos unsafe, creando nuestras propias estructuras de datos desde cero (nuestros propios arrays dinámicos en lugar de usar Vec, etc). Ya veremos cuando lleguemos a la sección de garbage collection… ¡Tiene pinta de que lo vamos a pasar especialmente “bien”!

Al momento de escribir este artículo apenas estamos empezando, pero puedes seguir el desarrollo de mi implementación de rox (otro nombre original) aquí.

¡Hasta otra!