Historia y Principio de Difracción de Rayos X para el Análisis de Estructura de Proteínas

Desde el comienzo del siglo XIX, a los científicos les tomó más de 100 años identificar los 20 aminoácidos que componen las proteínas. Sin embargo, conocer meramente la estructura primaria de las proteínas o la secuencia de aminoácidos es insuficiente, ya que las funciones biológicas de las proteínas están determinadas por su estructura tridimensional a nivel atómico. Muy pocas herramientas pueden detectar directa o indirectamente la posición de cada átomo, excepto por los rayos de alta energía o los electrones, ya que sus longitudes de onda son comparables a la distancia entre los átomos. Por lo tanto, las tecnologías dominantes actualmente usadas para el análisis de la estructura de proteínas son la difracción de rayos X y el microscopio crioelectrónico.

Descubrimiento de los Rayos X y la Cristalografía

Después de que Röntgen los descubriera en 1895, las personas aún eran incapaces de determinar la naturaleza de los rayos X. Los científicos sostenían dos puntos de vista sobre esto: los rayos X son una partícula neutra altamente penetrante o una onda electromagnética de longitud de onda muy corta. Robert Pohl observó en sus experimentos que el haz de rayos X, de hecho, se ensanchaba al pasar por una rendija en forma de cuña, pero se sospechó que se trataba de un error experimental debido a lo débil del fenómeno. Luego, Sommerfeld estimó la longitud de onda de los rayos X en 0.5 Å, basándose en los patrones de las fotografías de Robert Pohl. Para obtener una imagen de difracción clara, la distancia entre cada rendija en la red debe alcanzar niveles atómicos. Obviamente, tal precisión estaba muy por encima de la tecnología de la época.

Si los átomos en un cristal están realmente dispuestos en una red espacial regular como describió Auguste Bravais en su teoría; si los rayos X son realmente una onda electromagnética con una longitud de onda muy corta comparable a la distancia entre átomos, entonces el cristal sería equivalente a una red natural para difractar rayos X. Esto fue lo que pensó el físico alemán Max von Laue en 1912. Poco después, observó la difracción cuando un rayo X incidió sobre un cristal de sulfato de cobre en su experimento diseñado por él mismo. En 1913, Bragg y su hijo propusieron la ley de Bragg para explicar la relación entre la distancia de los planos de la red y la longitud de onda.

Difracción de Rayos X para el Análisis de la Estructura de Proteínas

Los primeros en usar rayos X para explorar la estructura de proteínas fueron John Bernal y Dorothy Hodgkin. En 1934, tomaron la fotografía del cristal de pepsina. Debido a que la fase de difracción no podía resolverse, no podía calcularse la estructura tridimensional. Sin embargo, fueron los primeros en demostrar que los cristales de proteínas podían producir patrones de difracción de rayos X claros. Este descubrimiento inspiró enormemente a los biólogos estructurales y promovió el desarrollo de la cristalografía de proteínas. La difracción de rayos X de proteínas fibrosas insinuó que había módulos repetitivos en las proteínas. En 1951, Linus Pauling y Robert Corey propusieron la estructura secundaria de las proteínas, la α-Hélice y la β-Lámina, basada en los enlaces de hidrógeno en los aminoácidos.

Aunque el Método Directo deduce la fase perdida a través de la intensidad de difracción y la teoría de probabilidades, este método solo es adecuado para moléculas pequeñas en lugar de macromoléculas biológicas. Max Perutz inventó el reemplazo de átomos pesados. La proteína se sumerge en una solución de metal pesado para introducir átomos pesados en grupos que contienen pares de electrones libres, como -SH, -COOH, -NH₂ y grupos carbonilos. Luego, comparando el patrón de difracción de la proteína original se revela la fase faltante, y la densidad de nube de electrones se calcula a partir de la fase y la intensidad de la difracción. Aunque Max Perutz inventó el método para el cálculo de fases, su colega John Kendrew se convirtió en el primer hombre de la historia en determinar la estructura de la proteína (mioglobina) en 1957. La razón es que la mioglobina tiene solo una cadena polipeptídica que contiene 153 aminoácidos, mientras que la hemoglobina está compuesta por cuatro subunidades, y cada subunidad es un polipéptido con alrededor de 150 aminoácidos. No fue hasta 1960 que se determinó la estructura de la hemoglobina por Perutz.

Desde entonces, se han creado más y más métodos de análisis de fases y la cristalografía de rayos X se utilizó ampliamente en el análisis estructural de macromoléculas biológicas: Lisozima (1965, David Phillips), centro de reacción fotosintético bacteriano (1985, Johann Deisenhofer, Robert Huber, Hartmut Michel), ATP Sintasa (1994, John E. Walker).

Recombinación Génica y Cribado de Alta Capacidad para Cristales de Proteínas

El crecimiento de cristales de proteínas a menudo requiere muestras de alta pureza en cantidades de miligramos. Antes de la tecnología de recombinación de ADN, a los científicos les encantaba estudiar proteínas abundantes en organismos naturales, como la hemoglobina, la mioglobina y el colágeno. Sin embargo, las enzimas y hormonas con funciones fisiológicas importantes y en cantidades muy bajas tenían que extraerse de enormes cantidades de desechos de matadero (como cientos de litros de sangre o toneladas de órganos). Este proceso no solo era tedioso, sino que también resultaba en baja pureza. La recombinación de ADN simplificó enormemente el proceso de extracción. La secuencia de ADN de la proteína objetivo se inserta en el material genético de E. coli. Estos procariotas proliferan rápidamente bajo condiciones adecuadas para reemplazar el arduo trabajo de molido de órganos. Los científicos pueden obtener una gran cantidad de proteína pura para crear cristales de proteína perfectos.

Antes de la década de 1990, no había un enfoque sistemático para el cribado y cultivo de cristales de proteínas. Los investigadores intentaban obtener cristales por prueba y error con diversas soluciones de alta salinidad. Desde entonces, los científicos han diseñado el cribado de alta capacidad: microplacas con cientos a miles de pozos combinan al azar valores de pH, precipitantes, concentraciones de sal y aditivos. Esto acorta en gran medida el tiempo para obtener las condiciones óptimas de cristalización.

Computadoras y software ayudan en análisis de estructura de proteínas.

La transición de patrones de difracción de rayos X en 2D a conformaciones de proteínas en 3D requiere cálculos matemáticos masivos, tales como iteración, operaciones de matrices, integración y transformada de Fourier, especialmente fase, mapa de densidad de electrones y refinamiento de modelo, que consumen una enorme cantidad de recursos computacionales. Cualquier cálculo manual es imposible. Afortunadamente, la Transformada Rápida de Fourier y las computadoras de alta velocidad (procesadores multinúcleo y GPUs) han reducido en gran medida el tiempo de cálculo. El software moderno procesa automáticamente los datos de difracción y la información de secuencia de aminoácidos para completar la determinación de fases, construcción de modelos y refinamiento. Además, la interfaz visual presenta directamente la estructura tridimensional de las proteínas a los investigadores, ayudándolos a comprender mejor sus funciones.

Desde su nacimiento hasta 2010, la cristalografía de rayos X es el método dominante para analizar estructuras de proteínas. Hoy en día, el microscopio crioelectrónico ha alcanzado resolución a nivel atómico. Tiene ventajas significativas en el estudio de proteínas dinámicas o regiones flexibles. Así, el microscopio crioelectrónico está reemplazando gradualmente a la cristalografía de rayos X.

Preguntas frecuentes

¿Cuál es el principio básico de la difracción de rayos X en el análisis de estructuras de proteínas?

La distancia entre átomos es comparable a la longitud de onda de los rayos X, por lo que ocurre difracción cuando los rayos X pasan a través de un cristal de proteínas. En el patrón de difracción, la posición de cada átomo se registra en intensidad y fase. Según esta información, podemos calcular la densidad de nube de electrones. Luego, los científicos identifican la columna vertebral de acuerdo con la forma y el contorno de la nube de electrones, e insertan átomos de nitrógeno (N), carbono (C) y oxígeno (O) en la imagen. Se eligen las cadenas laterales adecuadas para coincidir con la nube de electrones de cada residuo de aminoácido. Finalmente, el software con algoritmos de optimización ajusta ligeramente la posición de los átomos para que el modelo se ajuste a la nube de electrones, y las longitudes y ángulos de los enlaces cumplan con las propiedades químicas y físicas.

La intensidad de la difracción se mide directamente con instrumentos, pero la fase solo puede calcularse indirectamente, por lo que encontrar la fase faltante es la clave para restaurar la estructura de la proteína. Si hay una proteína con una secuencia similar en la base de datos, se utiliza como modelo que se rota y se traduce para un ajuste óptimo con el patrón de difracción experimental para calcular la fase (reemplazo molecular, o MR). Si no hay una proteína similar en la base de datos, se pueden introducir átomos pesados en la proteína objetivo. La información de fase se deduce de la difracción anómala causada por los átomos pesados. La Dispersión Anómala de Múltiples Longitudes de Onda (MAD) es adecuada para proteínas que contienen naturalmente átomos pesados (hierro, manganeso, zinc, etc.). La difracción anómala se mide en diferentes longitudes de onda para calcular la fase de otros átomos. MAD requiere una fuente de radiación sincrotrón para controlar precisamente la longitud de onda.