Cartografiando el genoma del Cannabis
El 18 de agosto de 2011, la empresa Medicinal Genomics -con sede en Massachusetts- publicó la secuencia -sin procesar- del genoma de la Cannabis Sativa, recientemente mapeado, y está a punto de publicar el genoma del Cannabis Índica. Este acontecimiento histórico está destinado a tener implicaciones de largo alcance en el campo de la investigación sobre el cannabis medicinal, además de abrir la posibilidad de controles de calidad mucho más precisos y de proporcionar a los productores grandes ventajas para la creación de nuevas variedades.
El 18 de agosto de 2011, la empresa Medicinal Genomics -con sede en Massachusetts- publicó la secuencia -sin procesar- del genoma de la Cannabis Sativa, recientemente mapeado, y está a punto de publicar el genoma del Cannabis Índica. Este acontecimiento histórico está destinado a tener implicaciones de largo alcance en el campo de la investigación sobre el cannabis medicinal, además de abrir la posibilidad de controles de calidad mucho más precisos y de proporcionar a los productores grandes ventajas para la creación de nuevas variedades.
El 18 de agosto de 2011, la empresa Medicinal Genomics -con sede en Massachusetts- publicó la secuencia -sin procesar- del genoma de la Cannabis Sativa, recientemente mapeado, y está a punto de publicar el genoma del Cannabis Índica. Este acontecimiento histórico está destinado a tener implicaciones de largo alcance en el campo de la investigación sobre el cannabis medicinal, además de abrir la posibilidad de controles de calidad mucho más precisos y de proporcionar a los productores grandes ventajas para la creación de nuevas variedades.
El estudio de la genética es un asunto complejo en sí mismo. A primera vista parece incomprensible para casi todos. La mayoría de la gente recuerda vagamente las nociones básicas aprendidas en las clases de biología del instituto pero se vería en dificultades para dar una explicación decente. Soft Secrets os pone al día, además de entrar un poco más en detalles sobre el propio proyecto del genoma del Cannabis y sobre porqué va a tener un impacto tan grande en la investigación sobre el Cannabis.
Kevin McKernan, director general de Medicinal Genomics (c. Medicinal Genomics)
Kevin McKernan, director general de Medicinal Genomics, tiene una larga trayectoria en el desarrollo e implementación de la tecnología de secuenciación. Formó parte del Proyecto del Genoma Humano y fue responsable del diseño de un nuevo instrumento de laboratorio para método de secuenciación SOLID durante su etapa en Life Technologies, una empresa de biotecnología de gran prestigio. Trabajando con Medicinal Genomics consiguió combinar su pericia profesional con la oportunidad única que presentaba el emergente mercado del Cannabis medicinal para iniciar un trabajo propio.
Se estima que el proyecto tiene un coste total de unos 200.000 dólares (algo más de 150.000 euros), cantidad que, evidentemente, Kevin no contempla recuperar a través de autorizar el uso de los datos, ya que el servicio informático de Amazon EC2 ya los ha hecho públicos. En cualquier caso, no parece que la financiación futura vaya a ser un problema porque el interés que ha despertado este proyecto -y sus resultados- ha sido enorme. El número de aplicaciones potenciales para diversos sectores es incontable, todavía se necesita mucho trabajo para interpretar los datos en bruto y obtener una estructura genética precisa. Con un impacto inicial tan grande, esta joven empresa está convencida de que en el futuro volverá a provocar titulares.
En este punto puede ser pertinente una breve introducción a la genómica. De forma muy resumida diríamos que la genómica es la ciencia de la investigación sobre los genoma, una rama altamente especializada de los estudios sobre genética. El genoma es el código genético completo del que está compuesto un individuo, está contenido en el ADN. En la mayoría de especies, el ADN forma cromosomas que contienen tanto genes como ADN sin código. Un gen es un segmento de ADN que controla un rasgo hereditario en una especie; un alelo es la expresión o variación de dicho gen en los individuos de la especie.
El ADN sin código puede representar una amplia proporción del genoma, pero no está codificado como los genes y no todas sus funciones se conocen al completo. El número de cromosomas del genoma difiere entre especies: los humanos tienen cuarenta y seis, el cannabis sólo veinte; también varía el número de genes dentro del cromosoma. El ADN propiamente dicho es un polímero biológico o macro-molécula de repetición, compuesta de millones de secciones llamadas nucleótidos. Estas secciones están constituidas por un azúcar simple, un grupo de fosfatos y una base de nitrógeno (nucleobase). Esta base puede ser uno de estos cuatro compuestos: adenina, guanina, timina y citosina. A través de billones de permutaciones de estas cuatro bases, todas las especies vivientes han desarrollado su propio genoma único.
Las especies que se reproducen sexualmente, como el ser humano y la Cannabis Sativa, suelen tener conjuntos de pares de cromosomas: un conjunto heredado del óvulo de la madre y un conjunto correspondiente del esperma del padre (angiosperma o polen en las plantas). Estos conjuntos se vuelven a combinar aleatoriamente en el proceso de reproducción para formar una descendencia genéticamente diferenciada. Un embrión humano contiene por lo general veintidós pares de cromosomas no sexuales (autosomas) y un par de cromosomas sexuales (alosomas).
La Cannabis Sativa suele tener diez pares de autosomas y un par de alosomas. Para trazar el mapa completo del genoma de una especie con reproducción sexuada es necesario secuenciar todo el conjunto de cromosomas, incluidos tanto la versión masculina como la femenina de los alosomas, o hacer análisis para determinar el orden exacto de las cuatro nucleobases en el polímero. El ADN mitocondrial que contiene el cloroplasto también debe ser mapeado, ya que es diferente del ADN cromosómico y tiene sus propias funciones específicas, dependiendo de cada especie.
Hasta el momento se han mapeado y publicado muy pocos genomas completos de especies vegetales importantes. La Cannabis Sativa es única por ser la primera planta dioica secuenciada originalmente por su valor medicinal, otros genomas completados son de plantas de muestra o de aceites y alimentos. La planta medicinal Artemisia annua fue secuenciada previamente para comprender mejor las secuencias enzimáticas que constituyen la droga anti-malaria de la Artemisa; sin embargo, el ciclo de cultivo de esta planta era mucho más largo que el del Cannabis y sólo tenía un compuesto de interés medicinal. El Cannabis tiene 85 cannabinoides y potencialmente cientos de terpenos de interés terapéutico, lo que la convierte en una planta de mucho mayor valor terapéutico potencial.
Amplificación clónica de fragmentos de ADN (c. Medicinal Genomics)
Medicinal Genomics pretende secuenciar en el futuro el genoma de muchas plantas beneficiosas -¿pero por qué fue el Cannabis su primera elección?- . El director Kevin McKernan conoció inicialmente el tema por un artículo de 2003 en Nature Reviews, en seguida comprendió su valor potencial: no sólo la demanda para el Cannabis medicinal está creciendo a un ritmo de un 50% anual en Estados Unidos, sino que la amplia gama de trastornos que pueden tratarse exitosamente con el Cannabis y sus derivados posiblemente no tenga rival en la naturaleza.
Además, su importancia como cultivo alimentario es incuestionable, aumentará a medida que el mercado empiece a expandirse. Aún más, su potencial como cultivo para biocombustible, en un momento en el que Estados Unidos y otros países desarrollados están extendiendo su producción de bioetanol a un ritmo sin precedentes, puede consolidar su papel en el comercio global del futuro.
Las variedades de Cannabis son muy diferentes entre sí genéticamente, y requerirán una secuenciación por separado -aunque es improbable que tarden demasiado, dado el creciente interés global por el cultivo-. La posibilidad de crear nuevas variedades cada vez más adecuadas a su propósito sería muy ventajosa, conocer la estructura genómica de las variedades utilizadas podría proporcionar las bases para la selección parental, gracias a que se podrán hacer predicciones más precisas sobre el perfil de nutrientes y cannabinoides de la descendencia.
Dependiendo de la complejidad del genoma y del grado de variación posible entre individuos y variedades de la especie en cuestión, se pueden emplear varias técnicas para secuenciar los datos genómicos. Los investigadores de Medicinal Genomics empezaron usando tecnología de secuenciación de corto-lectura, que analiza segmentos cortos de ADN (alrededor de 200 pares básicos) y reúne los resultados para obtener una imagen completa. Sin embargo, este método demostró ser poco eficaz para poner de relieve la verdadera complejidad del código genético, y se necesitaron fragmentos más largos.
La tecnología utilizada para obtener los resultados definitivos, la plataforma GS-FLX, es una tecnología de secuenciación de próxima generación, que lee el ADN en fragmentos de hasta 750 pares de bases de longitud. Se realizaron 49,5 millones de secuencias, cada una de ellas con una longitud de aproximadamente 630 pares de bases. Una cantidad tan pequeña como tres microgramos de ADN genómico, obtenido de cualquier tipo de organismo, es suficiente para realizar un secuenciado.
La purificación del ADN se realizó en el local de la empresa en Ámsterdam, la secuenciación propiamente dicha la realizaron, utilizando la última tecnología de alto rendimiento, varias instituciones de investigación, incluido el laboratorio 454 Life Sciences de Roche. Las variedades empleadas fueron adquiridas a través de la colaboración con DNA Genetics, la empresa de semillas de Ámsterdam, y precisaron programas de cultivo especiales para su desarrollo.
Para la secuencia del genoma de Índica, se utilizó L.A. Confidential de triple retrocruce. Un espécimen retrocruzado es la descendencia de una planta y su progenitor, y se suele crear para consolidar una característica dentro de una variedad, o también para eliminar consecuencias indeseadas de un cruce previo. El retrocruce doble o triple salta generaciones para cruzar a un espécimen con sus abuelos o bisabuelos. Con el triple retrocruce de la variedad L.A., los criadores lograron crear un fenotipo que tenía gran similitud genética con sus ancestros, Indicas puras.
Para el genoma de Sativa, se utilizó el híbrido de Sativa Chemdawg. Es una variedad muy valorada en medicina que, aunque tiene algunos ancestros de Índica, tiene un efecto muy cerebral y muchas características de Sativa. Medicinal Genomics también trabajó con la Greenhouse Seed Company para la investigación de variedades locales altas en CBD y variedades de Ruderalis.
La secuenciación Sanger es el método utilizado para el Proyecto del Genoma Humano. Para purificar el ADN y eliminar el material orgánico sobrante, la muestra se rompe mecánicamente y después se separan los cromosomas en las hebras que los componen, a través de un proceso conocido como la reacción en cadena de polimerasa (PCR). La polimerasa hace referencia a varios enzimas que ayudan a la replicación y reparación del ADN, catalizando las conexiones de nucleótidos en un orden específico, y utilizando una sola cadena corta de ADN (o molde) como patrón. La PCR combina polimerasa con un molde artificial para crear múltiples ejemplos de la misma cadena, siendo cada segmento idéntico- excepto una diferencia de un nucleótido de longitud -.
Después la base final de cada fragmento se tiñe con fluorescente por razones de identificación, y las bases se separan y organizan por medio de un proceso de electroforesis en gel (en el que las partículas dispersas en un fluido son forzadas a migrar por medio de una descarga eléctrica). Las nucleobases teñidas viajan una por una a través del gel, pasan por un rayo láser, que se transforma en una longitud de onda de luz distinta según el tipo de base. Después el rayo se enfoca sobre un espectrógrafo con unas lentes y se lee con un sistema de cámara CCD, el orden en que se registran los diferentes colores determina el orden original de las nucleobases en el polímero de ADN. De esta forma se reconstruyen los cromosomas en su forma original, se denomina ensamblaje del genoma.
Dos métodos diferentes de Secuenciación de Próxima Generación, llamados Secuenciación por Síntesis, se emplearon en el mapeo del genoma de Cannabis Sativa. La Pirosecuenciación de Roche/454 utiliza la PCR (como la Secuenciación Sanger arriba citada), pero una versión masiva en paralelo llamada PCR de Emulsión (agua en solución oleosa). El genoma es fragmentado en 700-1000 fragmentos de bases, que se modifican para tener la misma secuencia de ADN en las terminaciones, y sumergido en una emulsión junto a otras partículas que contienen secuencias de las secuencias molde. La emulsión, con aspecto de aliño de ensalada, aísla una molécula de ADN dentro de una gota de agua utilizando PCR rodeada de sustancia oleosa. Esta única molécula por gota se consigue por simple dilución: de hecho, la mayor parte de las gotas están vacías, y muy pocas tienen una sola molécula de ADN dentro.
¿Cannabis manipulado genéticamente? Sólo simple reproducción para esta "Fresa" Suiza (foto de David Dee).
Cada una de las billones de gotas tendrá una molécula de ADN y otras partículas diferentes en su interior. Una "fotocopiadora" que copia las moléculas de ADN en estas gotas de la emulsión amplifica eficazmente la señal a la que estamos atendiendo en el proceso de secuenciación. Una vez que el ADN se añade a las partículas, se pueden poner en una placa con millones de pocillos adosada a una cámara CCD. La luciferasa (una enzima luminosa) para producir luz que la cámara puede medir cada vez que una de las cuatro letras de la solución se encuentra con el chip.
Cuando vertemos adenosina en el chip, todas las gotas que tienen una T como la siguiente letra en la hebra de ADN crean una luz que la cámara puede medir. El chip se lava y el proceso se repite con las otras tres bases. Las hebras de ADN se cultivan con polimerasa y bases añadidas secuencialmente. Este proceso se repite 500 veces por cada una de las cuatro bases hasta alcanzar más de 700 bases de secuencia y completarlo requiere aproximadamente 24 horas.
La Secuenciación por Síntesis Ilumina es muy diferente y utiliza la PCR de puente, dando como resultado menos moléculas de ADN y por lo tanto menor longitud de lectura del ADN. También requiere diferentes mecanismos de detección, como lásers y colorantes fluorescentes, pero ofrece una mayor precisión de secuenciación -especialmente en tramos de secuencia llamados homopolímeros (tramos largos de la misma letra) como AAAAAAATTTGGG.
L.A. Confidential en plena floración (foto de DNA Genetics)
El resultado fue una secuencia de 131 millones de bases -mucho más alto que los 157 millones encontrados en la planta modelo Arabidopsis thaliana, una especie de planta floreciente, aunque los datos requieren una interpretación más profunda para definir el verdadero tamaño y dimensión de el genoma completo. Es de esperar que la Cannabis Sativa muestre una mayor complejidad genética que la thaliana: ésta pertenece a un género de plantas relativamente simple; por el contrario, el Cannabis tiene sistemas altamente desarrollados, el más obvio, el sistema de producción de cannabinoides.
La variación genómica entre las diferentes muestras examinadas fue de más del 1%, lo que es diez veces más alta que la encontrada en humanos -esta capacidad de expresar genotipos muy diferentes conservando la capacidad de cruzarse entre sí es una de las razones por las que el cannabis es una especie tan adaptable, y por qué aparece en tantas formas distintas-.
Aunque queda mucha investigación e interpretación por hacer, la secuenciación del genoma completo, que posibilitará el estudio de la planta sin necesidad de especimenes físicos, debería arrojar mucha luz sobre preguntas que llevan mucho tiempo sin ser contestadas, como la naturaleza y función exactas del sistema cannabinoide, las diferencias genéticas entre variedades y subespecies como la Índica y la Sativa, así como las complejidades de la reproducción sexual, por señalar sólo unas pocas.
Por ejemplo, utilizando los datos genómicos para determinar la ubicación y función exactas de los genes que controlan el futuro género dentro de los cromosomas, estas podrían resolverse, y la capacidad para la auto-expresión (por ejemplo, cuando se dejan las hembras varias semanas más del tiempo normal de cosecha, y éstas producen semillas genéticamente idénticas en un esfuerzo por conservar el genotipo) podría establecerse con exactitud. A la inversa, para muchos cultivadores tradicionales serían muy deseables programas para eliminar por completo las tendencias hermafroditas. Pero tal vez lo más importante, lo fundamental, sea la cuestión de la función cannabinoide, y cómo es su relación exacta con nuestro propio sistema endocannabinoide.
La publicación de los datos genómicos llevará inevitablemente a que surjan problemas éticos. La modificación genética de los cultivos sigue siendo un tema controvertido, a pesar de su muy extendida implementación todavía hay preguntas sin responder respecto a su efecto en el ecosistema en que son introducidos. Para cultivos de interior, el problema es menor, pero para cultivos de exterior a gran escala, se piensa que en algunos casos podría ser perjudicial para la biodiversidad. Cuando se trata con un tema tan complejo como la química orgánica, es muy difícil predecir el efecto que una sola modificación tendrá en las interacciones normales entre diferentes elementos dentro de un ecosistema.
La cuestión de si es mejor la reproducción selectiva o la modificación genética para obtener un rasgo deseado es difícil de resolver. Los proyectos de reproducción pueden generar resultados más rápidos a través de una selección cuidadosa de fenotipos específicos; desarrollar variedades monitorizando sus patrones genéticos puede llevar más tiempo, pero su resultado final estaría más controlado.
Sin embargo, las implicaciones de los recién publicados datos genómicos tienen un alcance mucho mayor que el de asistencia a los programas de modificación genética. El precedente establecido por el equipo de Medical Genomics de poner sus datos al alcance del público, puede ser un incentivo para que otros hagan lo mismo. Sin duda, se necesitará el compromiso de muchos para completar la siguiente etapa de este proyecto, si el equipo publica su planeada aplicación para iPhone, que permitirá a los usuarios añadir anotaciones genómicas a los datos secuenciados, estarán proporcionando un gran apoyo a la comunidad científica.
Semillas cubiertas de tricomas en la L.A. (foto de DNA Genetics)
La genómica funcional es la rama que utiliza los resultados del proyecto genoma para evaluar las interacciones entre proteínas y genes específicos y su expresión en el fenotipo. Esta suele ser la parte más lenta de la investigación, los datos genómicos en bruto para el Proyecto de Genoma Humano se publicaron por primera vez en 2001 pero no se declararon "completos" (todos los cromosomas mapeados y cada gen de los cromosomas identificado y localizado, sin errores) hasta 2003.
Después del ensamblaje, el genoma debe ser anotado -es decir, las regiones que contienen genes específicos deben ser localizadas y la información biológica relevante agregada a los datos almacenados electrónicamente-. La anotación del genoma continúa a día de hoy para el genoma humano, porque el número total de expresiones diferentes de los miles de genes contenidos en él es asombrosamente alto y requiere su procesamiento por parte de expertos para describirlos. Para evaluar el impacto de un gen específico, se pueden eliminar o interferir los genes en el genoma y observar el efecto en el fenotipo resultante. Este proceso ha ayudado a los investigadores a identificar varias funciones genéticas clave en los humanos, arrojando luz sobre diversos desórdenes y sus causas.
Una vez anotado el genoma, los datos se pueden usar de muchas formas -para determinar el grado de similitud o para identificar los genes responsables de funciones similares (y cómo difieren) entre especies o variedades; para estudiar la evolución de una especie, su ascendencia y su patrón de desarrollo, y cómo encaja en el sistema taxonómico; finalmente, para aportar otra pieza al increíblemente vasto puzzle que es el árbol de la evolución, cuyas raíces son los protozoos de los primeros días de la Tierra, y cuyas ramas son millones-.
La genómica comparativa estudia específicamente la variación entre diferentes genomas, y es importante para comprender cómo y en respuesta a qué presiones ocurre la mutación, y se establece la divergencia. También puede utilizarse para estudiar las mutaciones adversas que pueden aparecer, lo que proporciona al ser humano mucha información sobre la naturaleza de los cánceres y por qué ocurren.
Aunque los avances en investigación genética han aportado muchos conocimientos sobre la naturaleza e importancia de la planta de Cannabis, la publicación del genoma de Cannabis y la investigación que ha puesto en marcha están destinadas a impulsar fuertemente nuestra comprensión global del tema. No sólo eso, también se ha lanzado al público un mensaje claro: que el Cannabis es una planta medicinal que vale la pena considerar seriamente y que la comunidad académica lo reconoce así. En el futuro, los gobiernos refractarios del mundo se verán obligados a hacer lo mismo. El apoyo de fuentes creíbles y respetadas, como Kevin McKernan y su equipo es vital para el éxito del movimiento, bien merece el aplauso que están recibiendo por su extraordinario trabajo.
Nuestro especial agradecimiento a Kevin McKernan por su aportación.