La vida se escribe con 64 palabras de tres letras (y hay cuatro letras distintas). ¿Tiene esto algún profundo significado cabalístico?
No es probable, pero al menos los científicos están empezando a darse cuenta de que este curioso lenguaje encierra sugerentes regularidades y de que no lo ha configurado solamente el azar.
Un hecho muy llamativo es que el código genético es prácticamente universal: tanto las bacterias como las plantas y los animales hablan el mismo idioma para traducir la secuencia de nucleótidos del
ADN a la secuencia de aminoácidos de una proteína. Sólo aparecen unas cuantas excepciones (algunas palabras tienen un significado distinto en hongos y en mitocondrias, por ejemplo).
Hasta hace poco se pensaba que el código genético no poseía ninguna propiedad especial que lo diferenciara de otros códigos posibles que pudieron haber adoptado los primeros organismos. Se habría originado por azar y a partir de ahí quedaría “congelado”, pues cualquier alteración en él tendría consecuencias catastróficas en los organismos (a diferencia de una mutación puntual en una proteína, una alteración del significado de una sola de las palabras del código ocasiona cambios en casi todas las proteínas). Pero se ha constatado que el código también es capaz de evolucionar lentamente (como prueban las excepciones), por lo que pudo haberse originado él mismo por evolución, sujeto a las leyes de la selección natural.
Ya que existen 4 nucleótidos en el ADN y 20 aminoácidos en las proteínas, no basta con palabras de dos letras para codificarlos (el número de posibles combinaciones de dos letras es 16). Se necesitan pues palabras compuestas al menos por tres letras: las combinaciones posibles son 64. Al principio se creía que 20 palabras codificarían los aminoácidos y las palabras sobrantes no significaban nada, pero pronto quedó claro que había muchos sinónimos en este diccionario: varios tripletes codifican el mismo aminoácido (aunque es un poco sorprendente que algunos aminoácidos tienen hasta seis sinónimos y otros sólo dos). 61 tripletes codifican para aminoácidos y 3 para la señal “detención de la síntesis proteica” (la señal de inicio es un aminoácido concreto).
Esta redundancia presenta la ventaja de que el código se hace así más resistente a los errores. Muchos tripletes que codifican el mismo aminoácido presentan las dos primeras letras iguales y sólo cambia la tercera, con lo que una mutación en esa posición no afectará para nada a la proteína. También se había observado que los aminoácidos de similares propiedades solían compartir letras en los tripletes. Esto permitiría que los cambios accidentales hicieran variar poco las propiedades finales de la proteína y que siguiera siendo funcional. También los aminoácidos que derivan por modificación química unos de otros, como la alanina y la fenilalanina, suelen ser codificados por tripletes parecidos.
Todos estos eran indicios fuertes de que el código genético no era fruto de un azar congelado, sino de la evolución dirigida por la selección natural. Un grupo de investigadores recientemente decidió comprobar la consistencia de esta hipótesis elaborando simulaciones informáticas con millones de códigos genéticos posibles y midiendo su capacidad de tolerar los fallos, de producir proteínas funcionales a pesar de pequeñas alteraciones.
Se centraron para su estudio en una propiedad de los aminoácidos, la hidrofobicidad, la más importante para determinar el plegamiento correcto de la proteína en el entorno acuoso celular y en consecuencia su capacidad de ejercer bien su función. La hidrofobicidad indica en qué grado un aminoácido repele el agua o siente afinidad por ella (los aminoácidos hidrófobos suelen situarse en el interior de la proteína y los no hidrófobos en el exterior).
Generaron muestras aleatorias de distintos códigos genéticos y observaron que sólo un centenar entre un millón de códigos era más resistente a los fallos que el código real (es un resultado muy bueno, que apoya la hipótesis de la evolución del código, aunque las particularidades del código que usaban los primeros organismos imposibilita que el ajuste fuera el mejor de los posibles). Pero es que si se consideran además otros factores, como el parecido en los tripletes que codifican aminoácidos que derivan unos de otros, el código genético real se perfila como uno de los más adecuados, superado sólo por muy pocos.
Una vez que se conoció, en los años 40 y 50, el papel del ADN en la transmisión de la información genética y su estructura molecular, que sugería inmediatamente un método para su replicación, se inició una carrera para averiguar cuál era el método que había escogido la naturaleza para traducir la información de los genes a las proteínas. Se idearon ingeniosos métodos geométricos en los que el ADN sirve como molde directamente para la formación de las proteínas, pero ninguno funcionaba.
Cuando finalmente se descubrió el verdadero modo de operar del código, por medio de una gran cantidad de moléculas intermediarias, cada una de ellas asociada a un triplete particular y capaz de llevar un aminoácido determinado hasta el lugar del ensamblaje de la proteína, se tuvo la impresión de que la solución era muy artificiosa y muy poco elegante. Pero como vemos, la naturaleza casi siempre tiene razón a la larga: este método es muy adecuado porque minimiza las consecuencias de las mutaciones dañinas para los organismos.