Lorsque Xiaoxi Meng et Zhikai Liang ont proposé l'idée pour la première fois il y a quelques années, James Schnable était sceptique. Pour dire le moins.
«'Eh bien, vous pouvez essayer, mais je ne pense pas que ça va marcher», se souvient le professeur agrégé d'agronomie et d'horticulture à Meng et Liang, alors chercheurs postdoctoraux dans le laboratoire de Schnable à l'Université du Nebraska-Lincoln.
Il avait tort et, avec le recul, jamais plus heureux d'être. Pourtant, à l'époque, Schnable avait de bonnes raisons de lever un sourcil. L'idée du duo - que les séquences d'ADN de cultures sensibles au froid qui se soumettent à un gel intense pourraient aider à prédire à quel point les plantes plus sauvages et plus résistantes tolèrent les conditions de gel - semblait audacieuse. Pour dire le moins. Pourtant, c'était une proposition à faible risque et à haut rendement. Parce que si Meng et Liang pouvaient le faire fonctionner, cela pourrait simplement accélérer les efforts pour rendre les cultures sensibles au froid un peu, voire beaucoup plus, comme leurs homologues résistantes au froid.
Certaines des cultures les plus importantes du monde ont été domestiquées dans les régions tropicales - le maïs dans le sud du Mexique, le sorgho en Afrique de l'Est - qui n'ont exercé aucune pression sélective sur elles pour qu'elles développent des défenses contre le froid ou le gel. Lorsque ces cultures sont cultivées dans des climats plus rudes, leur sensibilité au froid limite à quelle heure elles peuvent être plantées et à quelle heure elles peuvent être récoltées. Des saisons de croissance plus courtes signifient moins de temps pour la photosynthèse, ce qui se traduit par des rendements plus faibles et moins de nourriture pour une population mondiale qui devrait approcher 10 milliards de personnes d'ici 2050.
Climats froids
Les espèces végétales qui poussent déjà dans les climats plus froids, quant à elles, ont développé des astuces pour supporter le froid. Ils peuvent reconfigurer leurs membranes cellulaires pour maintenir la liquidité à des températures plus basses, empêchant les membranes de geler et de se fracturer. Ils peuvent ajouter des gouttes de sucre aux liquides à l'intérieur et autour de ces membranes, abaissant leur point de congélation de la même manière que le sel fait un trottoir. Ils peuvent même produire des protéines qui étouffent de minuscules cristaux de glace avant que ces cristaux ne se transforment en masses destructrices de cellules.
Toutes ces défenses ont leur origine au niveau génétique, mais pas seulement dans les séquences de l'ADN lui-même. Lorsque les plantes commencent à geler, elles peuvent réagir en désactivant ou en activant essentiellement certains gènes - empêchant ou permettant à leurs manuels d'instructions génétiques d'être transcrits et exécutés. Savoir quels gènes des plantes tolérantes au froid s'éteignent et s'allument face à des températures glaciales, alors, peut aider les chercheurs à saisir les fondements mêmes de leurs fortifications et, finalement, à concevoir des défenses similaires dans les cultures sensibles au froid.
Mais Schnable savait aussi, comme Meng et Liang l'ont fait, que même un gène identique réagit souvent différemment au froid entre les espèces végétales, même les plus proches. Ce qui signifie, de manière frustrante, que comprendre comment un gène réagit au froid chez une espèce a tendance à dire aux phytotechniciens presque rien de concluant sur le comportement du gène chez une autre. Cette imprévisibilité, à son tour, a entravé les efforts pour apprendre les règles dictant ce qui désactivera ou activera les gènes.
«Nous sommes encore vraiment très mal à comprendre pourquoi les gènes s'éteignent et s'allument», a déclaré Schnable.
Plants de maïs
Faute de règles, les chercheurs se sont tournés vers l'apprentissage automatique, une forme d'intelligence artificielle qui peut essentiellement écrire la sienne. Ils ont spécifiquement développé un modèle de classification supervisée - le type qui peut, lorsqu'il est présenté avec suffisamment d'images étiquetées, disons, des chats et des non-chats, finalement apprendre à distinguer les premiers des seconds. L'équipe a initialement présenté son propre modèle avec une énorme pile de gènes séquencés du maïs, ainsi que les niveaux d'activité moyens de ces gènes lorsque la plante était soumise à des températures de congélation. Le modèle a également été alimenté par «toutes les caractéristiques auxquelles nous pouvions penser» pour chaque gène de maïs, a déclaré Schnable, y compris sa longueur, sa stabilité et toutes les différences entre celui-ci et d'autres versions de celui-ci trouvées dans d'autres plants de maïs.
Plus tard, les chercheurs ont testé leur modèle en lui dissimulant une seule information dans un sous-ensemble de ces gènes: s'ils ont répondu à l'apparition des températures de congélation, ou s'ils ne l'ont pas fait. En analysant les caractéristiques des gènes, on lui avait dit qu'ils étaient soit réactifs, soit non réactifs, le modèle a discerné quelles combinaisons de ces caractéristiques étaient pertinentes pour chacune - puis a réussi à placer la majorité des gènes restants de la boîte mystère dans leurs catégories correctes.
C'était un début prometteur, sans aucun doute. Mais le vrai test restait: le modèle pouvait-il suivre la formation qu'il avait reçue sur une espèce et l'appliquer à une autre?
La réponse était un oui définitif. Après avoir été formé avec des données ADN d'une seule des six espèces - maïs, sorgho, mil, proso mil, sétaire ou panic raide - le modèle était généralement en mesure de prédire quels gènes de l'un des cinq autres répondraient à la congélation. À la surprise de Schnable, le modèle a résisté même lorsqu'il a été formé sur une espèce sensible au froid - maïs, sorgho, mil perlé ou proso - mais chargé de prédire les réponses génétiques dans le millet ou le panic raide tolérant au froid.
Modèle
«Les modèles que nous avons formés fonctionnaient presque aussi bien à travers les espèces que si vous aviez réellement des données sur une espèce et utilisiez les données internes pour faire des prédictions dans cette même espèce», a-t-il dit, un soupçon d'émerveillement persistant dans sa voix des mois plus tard. "Je n'aurais vraiment pas prédit cela."
«L'idée que nous pouvons simplement alimenter toutes ces informations dans un ordinateur, et qu'il peut comprendre au moins quelques règles pour faire des prédictions qui fonctionnent, est toujours assez incroyable pour moi.»
Ces prédictions pourraient s'avérer particulièrement utiles lors de l'examen de l'alternative. Depuis environ une décennie, les biologistes des plantes ont en fait été en mesure de mesurer le nombre de molécules d'ARN - celles responsables de la transcription et du transport des instructions d'ADN - produites par chaque gène d'une plante vivante. Mais comparer comment cette expression génique réagit au froid chez des spécimens vivants et chez plusieurs espèces est une entreprise laborieuse, a déclaré Schnable. C'est particulièrement vrai avec les plantes sauvages, dont les graines peuvent même être difficiles à acquérir. Ces graines peuvent ne pas germer comme prévu, voire pas du tout, et peuvent mettre des années à pousser. Même si c'est le cas, chaque plante résultante doit être cultivée dans un environnement identique et contrôlé et étudiée au même stade de développement.
Plus d'espèces
Tout cela pose un énorme défi pour cultiver suffisamment de spécimens sauvages, à partir de suffisamment d'espèces sauvages, pour se reproduire et évaluer statistiquement les réponses de leurs gènes au froid.
«Si nous voulons vraiment savoir quels gènes sont importants - qui jouent en fait un rôle dans la façon dont la plante s'adapte au froid - nous devons examiner plus de deux espèces», a déclaré Schnable. «Nous voulons examiner un groupe d'espèces qui tolèrent le froid et un groupe qui sont sensibles, et regarder les modèles:« Ce même gène répond toujours dans l'un et ne répond toujours pas dans l'autre. »
«Cela commence à devenir une expérience vraiment importante et coûteuse. Ce serait vraiment bien si nous pouvions simplement faire des prédictions à partir des séquences ADN de ces espèces au lieu de, disons, prendre 20 espèces et essayer de les obtenir toutes au même stade, de les soumettre toutes exactement aux mêmes traitements contre le stress, et mesurer la quantité d’ARN produit pour chaque gène de chaque espèce. »
Heureusement pour le modèle, les chercheurs ont déjà séquencé les génomes de plus de 300 espèces végétales. Un effort international continu pourrait porter ce nombre à 10,000 XNUMX au cours des prochaines années.
Bien que le modèle ait déjà largement dépassé ses modestes attentes, Schnable a déclaré que la prochaine étape consistera néanmoins à «convaincre à la fois nous-mêmes et les autres» qu'il fonctionne aussi bien que jusqu'à présent. Dans chaque cas de test à ce jour, les chercheurs ont demandé au modèle de leur dire ce qu'ils savaient déjà. Le test ultime, a-t-il dit, viendra lorsque les humains et la machine partiront de zéro.
«Je pense que la prochaine grande expérience que nous devons faire est de faire des prédictions sur une espèce pour laquelle nous n'avons aucune donnée du tout», a-t-il déclaré. «Pour convaincre les gens que cela fonctionne vraiment dans les cas où même nous ne connaissons pas les réponses.»
L'équipe a rapporté ses conclusions dans la revue Proceedings of the National Academy of Sciences. Meng, Liang et Schnable ont rédigé l'étude avec Rebecca Roston du Nebraska, Yang Zhang, Samira Mahboub et l'étudiant de premier cycle Daniel Ngu, ainsi que Xiuru Dai, chercheur invité de l'Université agricole du Shandong.
Pour plus d’information :
Université du Nebraska Lincoln
www.unl.edu