Sin él no existirían los programas: qué es un compilador

Rubén Velasco Publicado el 01 de junio, 2021 • 13:00

Cuando escribimos un programa, normalmente solemos hacerlo en un lenguaje de programación. Este puede ser de bajo nivel (si está más cerca del lenguaje máquina que del nuestro) o de alto nivel (cuando tiene una sintaxis sencilla). Sin embargo, por muy bajo que sea el nivel del lenguaje de programación que usemos, las máquinas siguen sin entender nuestras instrucciones como tal, ya que trabajan con órdenes binarias. Por ello, si queremos que nuestro programa funcione es necesario usar un compilador.

Qué es un compilador de código

Un compilador es, a grandes rasgos, un traductor. Es el encargado de transformar el código fuente del programa que hemos creado (generalmente usando un lenguaje de alto nivel), junto con todas las dependencias y librerías necesarias para que el programa pueda ejecutarse y funcionar sin problemas, en un archivo binario. Este compilador se encarga de comprobar que no hay errores en el código (para evitar fallos críticos), así como de analizar y agrupar la sintaxis y la estructura del programa. Si todo está correcto, lo pasa a un lenguaje intermedio común, ensamblador, para, posteriormente, optimizarlo y traducirlo a lenguaje binario. De esta manera, a través del sistema operativo, el programa se puede ejecutar en la máquina.

Normalmente, los compiladores no pasan directamente las instrucciones de nuestro código fuente a código binario, sino que suelen realizar sus tareas a lo largo de 3 fases.

Fase de análisis

La primera de ellas es la fase de análisis. En esta fase, el compilador se encarga de analizar que la estructura y la semántica del programa esté correcta para generar un código intermedio (bytecode). Se analiza el léxico del código para agrupar todos los componentes que tienen un significado para el programa. En este paso, por ejemplo, es donde se elimina toda la información innecesaria, como los comentarios o los espacios. A continuación comienza el análisis sintáctico. En ella, los componentes léxicos se agrupan jerárquicamente en frases gramaticales, las cuales se utilizarán para crear la salida del programa. Y, por último, tiene lugar el análisis semántico. En él, basándose en la estructura jerárquica anterior, el compilador busca posibles errores en el código para evitar fallos críticos en el sistema. Cuando todo está correcto, entonces empieza la fase de síntesis.

Fase de síntesis

La fase de síntesis es la encargada de generar el código objeto a partir del código fuente. Esta fase solo comienza cuando la fase de análisis no ha dado ningún error, evitando así que puedan ocurrir posibles problemas tanto en la compilación como en la ejecución de un programa corrupto. El código objeto suele estar casi siempre en lenguaje ensamblador, uno de los lenguajes de más bajo nivel que podemos encontrar. Pero aún no está en binario, por lo que es necesario un último paso, lo que se conoce como optimización.

Fase de optimización

Partiendo del código objeto, el compilador da comienzo a la fase de optimización. Lo que hace en esta fase es interpretar el código y buscar posibles optimizaciones para que las instrucciones sean lo más cortas posible y puedan ejecutarse con mayor rapidez en el ordenador. Pueden ejecutarse distintos tipos de optimización en función de si queremos un programa menos optimizado, pero que se compile más rápido, o más optimizado pero que tarde mucho más tiempo en compilar.

Esquema compilar programa

Tipos de compiladores

No todos los compiladores de código son iguales. Inicialmente, en las primeras décadas de la era de la informática, los compiladores eran los programas más complejos que podíamos encontrar. Normalmente, los programadores usaban ensamblador, o directamente binario, para crear estas herramientas. Hoy en día las cosas han cambiado mucho y, aunque siguen siendo elementos muy complejos, en realidad no son tan complicados de crear ni de actualizar para mejorarlos.

Hay varios tipos de compiladores. Y cada compilador puede pertenecer a uno o varios grupos:

Cruzados: son los que están diseñados para generar un código para ejecutarse en un sistema operativo distinto al que se está ejecutando. Por ejemplo, si compilamos un programa de Android desde Windows.
De una sola pasada: se encargan de generar el código máquina (binario) a partir de una sola lectura del código fuente. Normalmente no hacen uso de optimizadores avanzados ni otras fases intermedias.
De varias pasadas: necesitan dar varias pasadas al código para comprobar que todo está correcto y optimizarlo antes de producir el código máquina.
JIT (Just In Time): compilan el código en tiempo real a medida que va siendo necesario.
Optimizadores: hacen cambios en el código para mejorar el rendimiento del programa y optimizarlo, pero sin estropear la funcionalidad del programa original.

Cómo compilar un programa

Los sistemas operativos, y los IDE de programación, tienen sus propios compiladores. Por ejemplo, en Linux nos encontramos con una conocida herramienta llamada «Make«. la cual se utiliza para compilar código desde terminal sin tener que escribir largos y complejos comandos en la consola del sistema. Cuando tenemos un programa complejo, es capaz de saber qué partes del código han cambiado para recopilar solo lo necesario en lugar de todo el programa.

Si usamos un IDE de programación, como Visual Studio, este contará con sus propios compiladores para dar forma a los programas que escribamos en C, C++, C# o Visual Basic. Otros IDEs de programación, como Android Studio, tienen su propio compilador que nos permite crear los ejecutables para poder ejecutar las apps en Android.

Luego, también podemos encontrar compiladores de terceros que nos ayudan a dar forma a los programas que no incluyen sus propios compiladores. Esto es común, por ejemplo, si usamos Visual Studio Code, el IDE OpenSource de Microsoft, para crear programas. A diferencia de su hermano mayor, este no trae compiladores propios, por lo que tendremos que bajar una alternativa, como MinGW, que nos permita compilar código.

La consola de depuración: el mejor aliado del programador

El proceso de compilación suele ser automático (no podemos interferir en él) y, normalmente, invisible. Sin embargo, tanto los compiladores como los IDEs cuentan con entornos de depuración que nos pueden ser de mucha utilidad a la hora de detectar y reparar errores que podamos haber cometido.

Gracias a estas consolas de depuración vamos a poder controlar una a una las instrucciones que se van ejecutando para generar el código máquina del programa. Lo más normal es mostrar solo los avisos y los errores, ya que todo lo que se compile correctamente no aporta ningún valor. Si hay un error, la consola nos dirá exactamente dónde ha ocurrido (y muchas veces por qué) para que podamos solucionarlo fácilmente. Lo mismo cada vez que aparezca un warning, o aviso. Estos no tienen por qué detener la compilación del programa, pero nos pueden ayudar a optimizar el funcionamiento del programa.