ico english agriculture videos ico videos agricultura Rusia
Toda la Agricultura en Internet
Artículos Noticias Empresas CompraVenta Empleo Precios FyH Cursos Tienda Foro Vídeos Fotos Diccionario Más  

Noticias

Cómo la tecnología que utiliza ChatGPT puede ayudar a las casas de semillas a desarrollar nuevas variedades resistentes

Un investigador de la Universidad de Wageningen está desarrollando una herramienta que comparará los mecanismos a través de los cuales, los genomas de especies emparentadas expresan o no ciertas características clave para los obtentores.

Ingeligencia artificial España

06/06/2024 11:51:21 -

Enviar la noticia
Imprimir
Cultivo de col.

Lo que hace tan sólo unos años veíamos como una realidad propia de las películas de ciencia ficción, la inteligencia artificial, hoy en día ya ha pasado a formar parte de la vida cotidiana, dando lugar a herramientas tan simples como un asesor virtual; o a algunas más complejas que escriben un texto con tan sólo indicarle sobre qué debe tratar, aglutinando el conocimiento previo al que ha tenido acceso, pero la inteligencia artificial ha llegado para quedarse y no sólo para aplicaciones tan mundanas como las mencionadas, o su uso para acciones oscuras, como la falsificación de una voz o una imagen, sino que también tiene aplicaciones en la ciencia y la investigación que pueden dar lugar a avances significativos en el conocimiento, repercutiendo en la aplicación práctica del mismo.

Es el caso de cómo la inteligencia artificial, aplicada a la investigación genética de las plantas, puede descubrir cuestiones que hasta ahora aún son enigmas para los investigadores. En ese sentido, Michael Schön, investigador de la Universidad de Wageningen, en Holanda, está diseñando una herramienta basada en inteligencia artificial que podría acelerar y simplificar el futuro desarrollo de nuevas variedades resistentes a la sequía, o a enfermedades

Si tenemos en cuenta que las proteínas con los elementos básicos de las células y que la información genética para su producción está contenida en el ARN de los genes, dando lugar a ARN codificante, es decir, que contiene dicha información para producir una proteína; es importante asimismo, tener en cuenta que hay genes que producen ARN que carece de dicha información (ARN no codificante), pero que realiza tareas importantes en el desarrollo de los organismos, activando o desactivando genes, cambiando las características de una planta, así como determinando si ésta alcanza la madurez.

Sobre esta premisa, la herramienta que Schön está desarrollando, realizará comparaciones de ARN no codificantes en genomas de plantas que podrían revelar, entre otras cuestiones, por qué una especie que pertenece a una familia determinada, tiene características diferentes. Y es que el investigador parte de la limitación existente en este campo de la investigación, ya que los conocimientos existentes de investigaciones previas existentes se centran principalmente en genes codificantes, lo que dificulta, por ejemplo la comparación de los genes no codificantes de una especie como el Arabidopsis thaliana (thale berro), que supone un organismo modelo en investigación, y de la que Schön tiene ya conocimientos previos de su ARN no codificante gracias a investigaciones anteriores, con otros cultivos de la familia a la que pertenece, la Brassicaceae, también conocida como familia de la mostaza o crucíferas, como pueden ser el brócoli o la coliflor, entre otros. Por tanto, es necesario desentrañar el genoma no codificante de cada cultivo de forma separada a como se viene haciendo habitualmente. “Hay más de 200 secuencias genómicas disponibles para plantas de la familia de la mostaza. Cada genoma se almacena como un gran archivo de texto que consta de millones de letras que representan las bases de una molécula de ADN (A [adenina], C [citosina], T [timina] y G [guanina]). Debido a que los bits no codificantes no están catalogados adecuadamente en estos genomas, es imposible comparar todos los genes no codificantes dispersos dentro de esta montaña de datos. Necesitamos nuevas estrategias y herramientas para eso. Estoy tratando de desarrollarlos”, explica Schön, quien, gracias a la subvención Veni que ha recibido su proyecto, pretende identificar ARN no codificantes utilizando conocimientos de especies relacionadas. 

Para ello, lo primero es saber en qué partes del genoma se ha de buscar. Un desafío que Schön pretende solventar con el desarrollo de una herramienta a la que ha denominado GeneSketch, basada en el método Minimizer Sketch, que sostiene la idea de que sólo es necesario observar una pequeña parte del ADN (un boceto) en lugar de la secuencia completa, prestando atención a unos pocos miles de caracteres por genoma para realizar una comparación, en lugar de millones. Un método que ya ha sido utilizado para construir un árbol genealógico sobre la evolución de los primates, incluyendo a los humanos y a sus parientes cercanos, logrando un árbol genealógico muy preciso a partir de bocetos de menos de un 1% de los respectivos genomas, y por tanto, constituyendo un método muy eficaz de estimar las similitudes del ADN y que debería ser útil para comparar los genomas de las distintas especies dentro de las crucíferas.

Una vez que ya se sepa dónde buscar, es necesario poder entender los datos resultantes. Para ello, GeneSketch emplea la misma tecnología en la que se basa ChatGPT: transformadores. “Puedes pedirle a un transformador que complete una palabra que falta en una oración, por ejemplo. Inicialmente, el transformador te da una palabra aleatoria porque nunca antes había visto palabras. Pero si lo entrenas con millones de oraciones de ejemplo, poco a poco aprende a adivinar las palabras correctas prestando atención a los patrones del texto. Después del entrenamiento, un modelo de lenguaje grande como ChatGPT se vuelve muy bueno en ciertas tareas, como responder preguntas o traducir de un idioma a otro. Se puede entrenar a un transformador para que aprenda no sólo los lenguajes humanos, sino también el lenguaje del ADN, que tiene sus propios patrones distintivos. Estoy trabajando en un modelo para detectar patrones en el ADN de muchas especies diferentes y traducir esos patrones a un lenguaje que nosotros, como humanos, podamos entender”, explica el investigador. Por tanto, Schön entrenará a GeneSketch para que se centre en cómo cambian los genes no codificantes en las distintas especies, aunque existe una limitación: la fiabilidad. “El transformador es una tecnología relativamente nueva y comete errores. ChatGPT, por ejemplo, fue entrenado en muchas fuentes de texto diferentes, pero si le preguntas sobre un tema que nunca vio durante el entrenamiento, necesita inventar algo. Esperas que invente algo razonable basándose en los patrones que ha visto, pero esto nunca es una garantía. Obviamente desea evitar resultados sin sentido. Cuanto más se entrena a un transformador, menos errores produce, pero el entrenamiento puede costar mucho tiempo y dinero. ¿Es mejor entrenar el modelo completamente desde cero o construirlo a partir de modelos existentes? Estoy probando ambos enfoques”, sostiene.

Un proyecto que comenzó en octubre de 2023 y pretende dar sus primeros resultados a finales de este año, cuando Schön espera tener listo un prototipo de la herramienta y poder crear las anotaciones genéticas no codificantes de todos los cultivos que engloban las crucíferas. 

Una herramienta que, de tener éxito en su cometido, supondría un gran avance, no sólo para la investigación, sino también para los obtentores y casas de semillas, que podrán comprender de forma rápida el ADN de un cultivo y sus parientes silvestres, pudiendo los fitomejoradores mejorar los rasgos de las nuevas variedades fijándose en aquellas que, a lo largo de los siglos han desarrollado sus parientes silvestres para hacerlos más resistentes a ciertas condiciones negativas, como la sequía o las enfermedades.

Redacción Infoagro: Lydia Medero


           
PORTADA Contacto Newsletter Publicidad Prensa Trabaja en Infoagro
Aviso legal Política de Privacidad Política de Cookies
English Français Russian

© Copyright Infoagro Systems, S.L.