PDF - Les thèses en ligne de l`INP
Transcription
PDF - Les thèses en ligne de l`INP
REMERCIEMENTS Au terme de ces années de doctorat et au commencement d’une nouvelle étape de ma vie, j’exprime ma sincère gratitude à tous ceux qui ont participé de près ou de loin à la réalisation de mon travail et je tiens ici à les remercier. J’adresse tout d’abord mes remerciements à Mesdames Françoise Corbineau et Isabelle Debeaujon ainsi qu’à Monsieur Philippe Seguin qui ont accepté d’évaluer et de juger ce manuscrit en qualité de rapporteur. Je remercie également Madame Vassilia Théodorou-Bayle qui a accepté de participer à ce jury de thèse. Bien évidemment, j’adresse mes remerciements à mon directeur de thèse, Monsieur Jean Daydé, et à ma co-directrice, Madame Monique Berger, qui ont encadré mon travail de thèse. J’ai beaucoup appris à leurs côtés pendant ces trois années et beaucoup apprécié notre collaboration et l’autonomie qu’ils m’ont accordée. J’adresse également mes chaleureux remerciements aux directeurs des laboratoires où j’ai pu travailler, Madame Vassilia Théodorou-Bayle, directrice de l’équipe de NeuroGastroentérologie et Nutrition au sein de l’UMR Toxalim, à Madame Djamila Lekhal et Monsieur Frédéric Violleau, respectivement directeurs du département d’Agronomie et du laboratoire d’Agrophysiologie de l’E.I. Purpan, pour m’avoir permis d’intégrer leurs équipes respectives et m’avoir soutenue tout au long de ma thèse. Je remercie la Direction Générale de l’Enseignement et de la Recherche (DGER) ainsi que la région Midi Pyrénées qui ont financé mon travail de thèse. Je veux également remercier Christel, pour sa gentillesse, son apport technique si précieux pour moi ainsi que les stagiaires Chloé, Daphné, Clémence et Mathieu qui ont participé à ce sujet de thèse et m’ont aidée dans l’accomplissement de mon projet. Ces années de doctorat ont été l’occasion de nombreuses rencontres qui ont accompagné mon travail avec une dimension humaine que j’ai beaucoup appréciée. J’ai une pensée particulière pour Joëlle, Christiane et Cécile M., pour leur écoute, leur soutien, leurs encouragements et leur amitié. Je tiens à adresser de sincères remerciements à Arnaud, Hervé, Pascal et Philippe pour leur aide, leurs précieux conseils et leur amitié. Egalement un grand grand merci à toute l’équipe des « Neugeuneu » - le girl power ! : Céline, Marion, Guylène, Cathy, Valérie T., Cherryl, Sandrine, Muriel, Mathilde, Valérie « Bé », Lara, Simona, Isa, Delphine, Maïwen, Nabila, Ambre, Valérie « Ba », Corinne, Soraya, Afi, Viorica, Stéphanie, et Hélène – ainsi que les erreurs de casting ! : Laurent, Eric H., Thomas et Eric G. – pour leur sympathie, leur soutien moral et tous ces bons moments passés ensemble. Je n’oublie pas non plus mes collègues de l’E.I. Purpan : Mireille, Anne, Dominique, Cécile, Ophélie, Nathalie, Hélène, Alban et Michäel pour leur gentillesse et leurs conseils. Ma sympathie et ma profonde amitié vont également à mes collègues thésards purpanais – Khalid et Abder (mes « tic et tac » favoris), Marc, Jérôme et Virginie pour leur joie de vivre, leur humour et les bons moments passés ensemble. Je voudrais tout particulièrement remercier Isabelle et Olivier qui ont initié mon goût pour la recherche. Ils m’ont encouragée et guidée vers l’aventure doctorale et m’ont toujours soutenue. Leurs qualités professionnelles mais aussi humaines m’ont profondément aidée à aller de l’avant dans la confiance et la reconnaissance. Me voici donc au terme de cette thèse qui représente une étape très importante de ma vie, avec des hauts et des bas, des rires mais parfois des larmes, des souffrances mais aussi beaucoup de satisfactions. Ce chemin, jamais rectiligne, a été celui d’un apprentissage professionnel mais surtout personnel. J’ai eu la chance d’avoir été accompagnée à chaque étape de cette aventure et d’avoir avancé parmi les personnes que j’aime. Je souhaite exprimer mes plus profonds remerciements à mes amis les plus chers, ils se reconnaîtront, et dont l’amitié et le soutien n’ont jamais défailli. Je dédie cette thèse à ma famille, à mes parents, pour leur amour et leur soutien essentiel au cours de mes années d’études et sans lesquels je n’aurais pas pu réaliser ce long parcours, à Lionel, mon futur époux, pour sa patience, ses encouragements permanents dans mes moments de doute et pour le bonheur qu’il m’apporte chaque jour, à ma grand-mère, pour son écoute, sa sensibilité et son soutien inconditionnel. Je remercie également l’ensemble des membres de ma famille et belle-famille qu’il serait trop long de citer ici, et qui ont, chacun à leur manière, embelli ces années. Enfin, mes pensées vont également vers les belles étoiles qui veillent sur moi, que la vie m’a arrachées bien trop vite, qui me manquent encore plus dans les moments importants de ma vie et avec lesquelles j’aurai tant aimé partager ces instants présents. TABLE DES MATIERES INTRODUCTION GENERALE ................................................................................................... 13 CHAPITRE I : REVUE BIBLIOGRAHIQUE ......................................................................... 17 1- LE SOJA ET SA GRAINE .............................................................................................................. 18 1.1 Le soja ................................................................................................................................... 18 1.1.1 1.1.2 Description générale de la plante ............................................................................................. 18 Croissance et développement de la plante .............................................................................. 20 1.2 La graine de soja ................................................................................................................... 22 1.2.1 La physiologie de la graine ....................................................................................................... 22 1.2.2 Composition de la graine de soja ............................................................................................. 25 2- LES ISOFLAVONES ........................................................................................................................ 29 2.1 2.2 2.3 2.4 Structure, caractéristiques et effets santé ........................................................................ 29 Composition et teneur en isoflavones de la graine de soja et ses compartiments ...... 33 La cinétique d’accumulation des isoflavones dans la graine et ses compartiments .... 33 Facteurs influençant la teneur et la composition en isoflavones dans la graine .......... 36 2.4.1 2.4.2 Facteurs environnementaux ..................................................................................................... 36 Facteurs génétiques ................................................................................................................. 38 2.5 Rôles physiologiques des isoflavones dans la plante ...................................................... 40 2.5.1 Isoflavones et symbiose ........................................................................................................... 40 2.5.2 Isoflavones et défense contre les microorganismes ................................................................ 41 2.5.3 Isoflavones et stress environnementaux .................................................................................. 42 3- BIOSYNTHESE DES ISOFLAVONES DE SOJA ..................................................................... 42 3.1 Description générale de la voie de biosynthèse des isoflavones ................................... 42 3.1.1 3.1.2 3.1.3 3.1.4 Synthèse des composés phénoliques simples : voie des phénylpropanoïdes .......................... 42 La voie des flavonoïdes ............................................................................................................. 43 Variations du schéma de base chez les légumineuses ............................................................. 44 Les formes conjuguées des isoflavones .................................................................................... 45 3.2 Etat des connaissances sur les mécanismes de transport des isoflavones .................... 46 3.2.1 Les principales étapes du transport des isoflavones dans la cellule ........................................ 47 3.2.2 Mise en évidence de leur transport vers la vacuole ................................................................. 47 3.3 Les principales familles d’enzymes intervenant dans cette voie de biosynthèse ........ 48 3.3.1 La famille des lyases ................................................................................................................. 48 3.3.2 Les polykétides synthases (PKS) ............................................................................................... 49 3.3.3 Les cytochromes P450 .............................................................................................................. 52 3.3.4 Autres enzymes intervenant dans cette voie de biosynthèse .................................................. 57 3.3.5 Les enzymes de décoration des isoflavonoïdes ........................................................................ 59 3.4 Localisation et organisation subcellulaire des enzymes de cette voie .......................... 64 4- LA REGULATION DE LA SYNTHESE DES ISOFLAVONES .............................................. 65 4.1 La régulation de la transcription ........................................................................................ 65 4.1.1 ..Régulation de l’expression dans les différents tissus et selon les stades de développement de la plante ............................................................................................................................................................. 68 4.1.2 Effet des facteurs abiotiques et biotiques ............................................................................... 71 4.2 La régulation post-transcriptionnelle ................................................................................. 75 5- OBJECTIFS DE LA THESE ........................................................................................................... 78 CHAPITRE II : MATERIEL ET METHODES ........................................................................ 81 1- MATERIEL VEGETAL UTILISE ................................................................................................. 82 1.1 1.2 Choix des variétés ................................................................................................................ 82 Les conditions de culture ..................................................................................................... 84 1.2.1 1.2.2 Culture en serre ........................................................................................................................ 84 Culture en phytotron ................................................................................................................ 84 2- METHODES GENERIQUES ....................................................................................................... 85 2.1 Les techniques de biologie moléculaire ............................................................................ 85 2.1.1 2.1.2 2.1.3 2.1.4 2.1.5 2.1.6 2.1.7 2.1.8 2.1.9 2.1.10 2.1.11 Extraction des ADN génomiques .............................................................................................. 85 Extraction des ARNs totaux ...................................................................................................... 85 Quantification et vérification de la pureté des ARNs ............................................................... 86 Elimination de l’ADN génomique des extraits d’ARNs totaux .................................................. 86 Transcription inverse (la reverse transcription RT) : ................................................................ 87 Amplification de l’ADN : Polymérase Chain Reaction (PCR) ..................................................... 88 Étude de l’expression par PCR quantitative en temps réel ...................................................... 89 Analyse des produits PCR sur gels d’agarose ........................................................................... 92 Purification des bandes d’ADN après électrophorèse .............................................................. 93 Clonage des fragments d’intérêt .............................................................................................. 93 Séquençage des plasmides et des produits PCR....................................................................... 95 2.2 Les techniques analytiques ................................................................................................. 95 2.2.1 Extraction des isoflavones ........................................................................................................ 95 2.2.2 Analyses HPLC: High Performance Liquid Chromatography ..................................................... 95 2.2.3 Quantification des isoflavones ................................................................................................. 97 2.3 Outils bioinformatiques et statistiques ............................................................................. 98 2.3.1 Traitement des séquences nucléiques et protéiques ............................................................... 98 2.3.2 Traitement statistique des données ......................................................................................... 98 3- LES DIFFERENTES EXPERIMENTATIONS ........................................................................... 99 3.1 Isolement et caractérisation des gènes IFS1 et IFS2 ....................................................... 99 3.1.1 3.1.2 Prélèvements et échantillonnage ............................................................................................. 99 Les différentes étapes de l’expérimentation ............................................................................ 99 3.2 Etude des cinétiques d’accumulation des isoflavones et d’expression des gènes cibles dans les germes et les cotylédons .......................................................................................................... 101 3.2.1 3.2.2 Prélèvements et échantillonnage ........................................................................................... 101 Les différentes étapes de l’expérimentation .......................................................................... 102 3.3 Caractérisation des gènes F6Hs et tests d’expression ................................................... 104 3.3.1 Prélèvements et échantillonnage ........................................................................................... 104 3.3.2 Les différentes étapes de l’expérimentation .......................................................................... 106 CHAPITRE III : ETUDE DE L’EXPRESSION DES GENES DE LA VOIE DE BIOSYNTHESE DES ISOFLAVONES DANS LES COMPARTIMENTS DE LA GRAINE .............................................................................................................................................. 113 1- INTRODUCTION ......................................................................................................................... 114 2- PUBLICATION SCIENTIFIQUE ............................................................................................... 116 3- SYNTHESE ET CONCLUSION ................................................................................................. 143 CHAPITRE IV : ETUDE DE L’EXPRESSION DE GENES CANDIDATS CODANT POUR LA FLAVONOÏDE 6-HYDROXYLASE, INTERVENANT DANS LA BIOSYNTHESE DE LA GLYCITEINE ............................................................. 147 1- INTRODUCTION ......................................................................................................................... 148 2- PUBLICATION SCIENTIFIQUE ............................................................................................... 150 3- SYNTHESE ET CONCLUSION .................................................................................................. 177 CHAPITRE V: DISCUSSION ET CONCLUSION GENERALE TABLE DES ILLUSTRATIONS ................................. 181 ................................................................................................. 191 LISTE DES FIGURES........................................................................................................................ 192 LISTE DES TABLEAUX.................................................................................................................... 195 REFERENCES BIBLIOGRAPHIQUES .................................................................................. 197 RESUME Etude du déterminisme génétique des différences de teneurs et de profils en isoflavones dans la graine de soja (Glycine max L. Merrill). La graine de soja contient de grandes quantités d’isoflavones (génistéine, daidzéine et glycitéine). En raison de leurs propriétés phytoestrogéniques, ces composés peuvent avoir des effets bénéfiques sur la santé humaine, mais ils peuvent aussi être perçus comme perturbateurs endocriniens, en particulier dans les laits pour nourrissons. La teneur et la composition en isoflavones de la graine diffèrent selon la fraction considérée. Les cotylédons contiennent de la génistéine et de la daidzéine, tandis que les germes, avec une teneur quatre à dix fois supérieure, contiennent majoritairement de la daidzéine et de la glycitéine. Le génotype influence fortement la teneur en isoflavones totales. Le déterminisme du pourcentage des isoflavones est essentiellement génétique. Ce travail porte sur l’étude du déterminisme génétique à l’origine des variations de teneurs et de compositions en isoflavones dans les germes et les cotylédons de la graine, en tenant compte également du net décalage de l’accumulation entre ces deux compartiments, au cours du développement de la graine. Dans un premier temps, les gènes des isoflavone synthases (IFS) de variétés très différenciées pour leurs teneurs et profils d’isoflavones ont été séquencés, puis les expressions des gènes clefs de la biosynthèse (neuf chalcone synthases (CHS), une chalcone réductase (CHR), quatre chalcone isomérases (CHI) et les deux isoflavone synthases (IFS) ont été suivies par RT-PCR quantitative dans les cotylédons et dans les germes, à trois stades critiques du développement de la graine (25, 40 et 60 jours après floraison). La seconde partie de ce travail a été consacrée à l’étude de l’expression de différents gènes candidats de la flavonoïde 6-hydroxylase (F6H) catalysant la première étape de la synthèse de la glycitéine. Le polymorphisme des séquences génomiques IFS1 et IFS2 des isoflavone synthases n’a pas montré de lien avec les différences de teneurs en isoflavones entre les variétés. L’activité transcriptionnelle des gènes de biosynthèse des isoflavones souligne l’existence d’une régulation bien distincte de cette synthèse dans ces deux compartiments. Les taux d’expression des gènes cibles ne sont pas toujours reliés avec les différences de teneurs ou de profils dans les germes et les cotylédons, suggérant ainsi l’effet prépondérant des régulations post-traductionnelles, notamment dans la formation du complexe multienzymatique de biosynthèse de ces composés. Nous avons aussi mis en évidence une forte expression du gène CHS9 codant pour la chalcone synthase 9, avec un profil correspondant plus à l’accumulation des isoflavones dans le germe que dans les cotylédons. Les gènes CHS7 et CHS8 codant pour les chalcone synthases 7 et 8, déjà signalés comme fortement corrélés à la synthèse des isoflavones, sont plus liés à l’accumulation dans les cotylédons que dans les germes. Ces travaux montrent aussi que le gène F6H signalé dans la littérature ne s’exprime pas dans les germes. En revanche, deux candidats dont la séquence est similaire à 79% ont été étudiés. Le gène F6H3 est le seul à s’exprimer dans la graine, uniquement dans le germe. Son expression n’a pas été détectée dans les germes d’une lignée mutante qui ne produit pas de glycitéine. Ce gène est donc un candidat potentiel clef pour la synthèse de la glycitéine dans le germe. La structure particulière de l’enzyme correspondante pourrait indiquer une forte implication de l’architecture du complexe enzymatique et des contraintes qui en découlent dans l’utilisation préférentielle d’une voie ou d’une autre dans ce schéma de biosynthèse. Mots clés : graine de soja, isoflavones, glycitéine, biosynthèse des isoflavones, déterminisme génétique, qRT-PCR. ABSTRACT Genetic determinism of isoflavones content and composition in hypocotyls and cotyledons of the soybean seed (Glycine max, L.Merill). The soybean seed contains large amounts of isoflavones (genistein, daidzein, and glycitein). Owing to their phytoestrogenic properties, these compounds can have beneficial effects on human health, but they can also be considered as endocrine disruptors, for example in infant formulas. The isoflavone content and composition in the seed depend on the considered fraction. The cotyledons contain only genistein and daidzein, while the hypocotyls are four to ten times more concentrated and contain three isoflavones, mostly daidzein and glycitein. The genotype has a strong influence on total isoflavone content, and even more on the percentage of individual isoflavones in cotyledons and hypocotyls. The objective of this work is to investigate the genetic determinism that underlies such contrasted contents and compositions between the two seed fractions, and the relation between main biosynthetic steps and genotypic differences. First, the genes of isoflavone synthases (IFS) were sequenced in varieties with highly contrasted content and composition. The expression of different keys genes of the biosynthesis (nine chalcone synthases (CHS), a chalcone reductase (CHR), four chalcone isomerases (CHI) and the two isoflavone synthases (IFS) have then been followed by quantitative RT - PCR in the cotyledons and hypocotyls, at three critical stages of seed development (25, 40 and 60 days after flowering). Second, the expression of different candidate genes for the flavonoid 6-hydroxylase (F6H) which catalyzes the first step in the synthesis of the glycitein has been investigated. The polymorphism of the genomic sequences IFS1 and IFS2 of isoflavone synthases was not correlated with differences in isoflavone contents. The transcriptional activity of key genes of the biosynthesis of isoflavones pointed out the existence of a distinct regulation of isoflavone biosynthesis between the two seed fractions. The expression levels of target genes were not always related to differences in isoflavone content or compositions in the hypocotyls and cotyledons. This suggests the overriding effect of posttranslational regulation, especially in the formation of multienzyme complex of biosynthesis of these compounds. The chalcone synthase gene CHS9 was highly expressed, with a profile similar to the accumulation of isoflavones in hypocotyls. The chalcone synthase genes CHS7 and CHS8 expressions, already reported as highly correlated to the biosynthesis of isoflavones were more related to accumulation in the cotyledons than in hypocotyls. This work has also shown that the F6H gene, reported in the literature was not expressed in the hypocotyls. However, two candidates with as highly similar coding sequence (79%) have been studied. The F6H3 gene is the only one expressed in the seed, more precisely in the hypocotyls but it was not expressed in the cotyledons. Moreover, it was not expressed in a mutant line which did not accumulate glycitein. This gene is therefore a key potential candidate for the synthesis of the glycitein in hypocotyls. The particular structure of the corresponding enzyme may indicate a strong involvement of the architecture of the multienzyme complex of isoflavones biosynthesis and the constraints arising in the preferential use of a track or another in this scheme of biosynthesis. Keywords : soybean seed, isoflavones, glycitein, isoflavone biosynthetic pathway, genetic determinism, qRT - PCR. INTRODUCTION GENERALE 13 La graine de soja, [Glycine max (L.) Merrill], tient une grande place dans l'alimentation humaine et animale. Introduit aux États-Unis au début du 19ème siècle, le soja s'y est fortement développé. En 2010, la production mondiale s’est élevée à 259 millions de tonnes de graines sur 103 millions d’hectares dont plus de 30% aux USA, 23% au Brésil, 17% en Argentine et 8% en Chine (Labalette et al., 2010). En France, les premiers semis ont été réalisés en 1740 par des missionnaires venant de Chine. La production européenne reste aujourd’hui anecdotique à l’échelle mondiale. L'intérêt économique du soja est lié à la qualité de sa graine, et particulièrement à sa teneur élevée en protéines présentant un excellent profil d'acides aminés essentiels. La graine contient également 20% d'huile riche en acide gras polyinsaturés. Les conditions environnementales telles que la température et l'irrigation sont des facteurs importants pour la production et leurs effets se répercutent directement sur le rendement (CETIOM, 2005). Une inoculation des graines par des bactéries Bradyrhizobium japonicum avant le semis, est souvent indispensable afin de maximiser la fixation symbiotique de l'azote par l'intermédiaire des nodosités qui se développent au niveau de la racine de la plante (Broughton et al., 2003). Dans le domaine de la santé, de nombreuses études épidémiologiques ont montré que la population asiatique qui consomme régulièrement des produits à base de soja présente moins de risques de développer des maladies chroniques (Setchell et Cassidy, 1999). La présence de composés majeurs dans la graine de soja tels que les protéines ou d’autres molécules en concentrations plus faibles, comme notamment les isoflavones, induit des effets préventifs et protecteurs vis-à-vis de certaines maladies cardiovasculaires (Nagarajan, 2010), de cancers hormonaux-dépendants (Messina et Wu, 2009), des troubles climactériques (Chedraui et al., 2011), de l’ostéoporose (Castelo-Branco et Cancelo Hidalgo, 2011) ce qui confère au soja son intérêt en alimentation humaine. Du fait de sa forte concentration en isoflavones, par rapport aux autres compartiments de la graine, le germe de soja intéresse aujourd'hui particulièrement les industries pharmaceutiques et agro-alimentaires. Aujourd’hui, les aliments ou compléments alimentaires riches en isoflavones connaissent un fort développement. De nombreuses études ont été réalisées sur les variétés afin de distinguer les plus riches et de caractériser leurs profils en isoflavones. Cependant, les isoflavones peuvent devenir indésirables dans certains produits à base de soja couramment utilisés en alimentation, tels que les préparations infantiles de substitution 14 utilisées en cas d’intolérance au lactose, ou pour l’alimentation des femmes enceintes, conduisant ainsi les autorités françaises à émettre des recommandations de dose maximale quotidienne chez l’adulte et à préconiser de ne pas donner de soja aux enfants de moins de 3 ans (AFSSA et AFSSAPS, 2005). Actuellement, au même titre que des variétés de soja riches en isoflavones, des variétés à faible concentration sont également demandées en fonction des types de consommateurs auxquels les produits dérivés de la graine sont destinés, ceci ayant conduit à considérer les isoflavones dans deux compartiments distincts de la graine: les cotylédons, matière première susceptible d’être appauvrie et le germe qui peut renfermer des teneurs très élevées. Ainsi au cours de ce travail de thèse, nous nous sommes intéressés à l’étude du déterminisme génétique et physiologique à l’origine de la compartimentation des isoflavones dans la graine de soja (germe et cotylédons) afin de permettre in fine une meilleure maîtrise des teneurs et compositions de cette famille de molécules. Cependant, même si les sélectionneurs parviennent à créer des variétés potentiellement riches ou pauvres, le contenu en isoflavones de la graine de soja est sous forte dépendance des facteurs environnementaux comme c’est le cas pour la plupart des molécules issues du métabolisme secondaire des plantes (Daydé et Lacombe, 2000 ; Lozovaya et al., 2005). Le laboratoire d'Agro-physiologie de l'EI Purpan travaille en partenariat avec une équipe de l'Université d'Urbana-Champaign (Illinois, USA) afin d'étudier : les effets des facteurs de régulation sur la teneur en isoflavones totales et leur composition dans le germe et dans les cotylédons mais également l'accumulation des isoflavones dans les graines depuis le début de leur formation jusqu'à leur maturation. Les recherches ont désormais permis d’établir que : l’environnement et les génotypes influencent le contenu en isoflavones de la graine de soja mais que les différences entre les variétés sont généralement conservées; la composition en isoflavones est caractéristique de la fraction de la graine considérée (Rasolohery et al., 2008); l’accumulation dans les cotylédons ne commence que quand celle-ci a déjà atteint un plateau dans les germes (Berger et al., 2008), soulignant ainsi les deux voies distinctes de régulation de la teneur en isoflavones et de leur composition dans les cotylédons et les germes. 15 Après une présentation synthétique des données de la littérature qui sous-tendent notre démarche (Chapitre I), nous décrirons le matériel végétal et les méthodes mises en œuvre pour mener à bien nos travaux (Chapitre II). Le Chapitre III fera l'objet d'une première étude valorisée par une publication scientifique insérée dans le présent document, basée sur des expérimentations réalisées à partir de variétés de soja très différentes pour leur contenu en isoflavones, dont les graines ont été prélevées et disséquées à différents stades de développement. L’objectif de ce travail est d’accéder à une meilleure connaissance du déterminisme génétique pouvant être à l’origine des différences de teneurs et de compositions observées dans les germes et les cotylédons de la graine de soja. Cette approche est réalisée grâce à la mise en œuvre d’une étude du polymorphisme de séquence des isoflavones synthases puis à la caractérisation de la cinétique d’expression des différents gènes cibles codant pour des enzymes clefs de la voie de biosynthèse des isoflavones dans les germes et les cotylédons, depuis la période du début du développement de la graine. Dans le Chapitre IV, nous rendrons compte, également en insérant la publication scientifique valorisant ces travaux, d'une étude réalisée à partir de six variétés de soja très différentes pour leur teneur en glycitéine (une des trois familles d’isoflavones du soja) dans les germes, dont les graines ont été prélevées et disséquées à trois stades différents de développement. Le but de ces expérimentations est de permettre une meilleure compréhension du processus régissant la synthèse de la glycitéine et de cibler un gène candidat codant pour une flavonoïde 6-hydroxylase (F6H), potentiellement impliquée dans la synthèse de ce composé. Enfin, dans le cadre d'une discussion générale (Chapitre V), nous synthétiserons les résultats acquis en considération de ceux de la littérature et nous envisagerons les perspectives qu’ouvre notre travail. Ainsi, serons-nous en mesure d’établir un certain nombre de réponses quant au déterminisme génétique et physiologique à l’origine de la compartimentation des isoflavones dans la graine, dans l’objectif d’une maîtrise des contenus et compositions en isoflavones dans la graine de soja. 16 CHAPITRE I : REVUE BIBLIOGRAPHIQUE 17 Les graines de soja contiennent de nombreux composés bénéfiques pour la santé humaine, notamment les isoflavones qui constituent l’objet de notre étude. Leur teneur et leur composition sont très différentes entre les germes et les cotylédons. On assiste en effet à une répartition des isoflavones dans la graine soit dans le compartiment cotylédons, soit dans le compartiment germe. Nous verrons que plusieurs facteurs génétiques et environnementaux en sont responsables. Dans un premier temps, nous présenterons la plante et la graine puis les isoflavones en précisant leurs rôles, les modalités de leur accumulation dans les compartiments de la graine et les facteurs qui contrôlent leur accumulation au niveau phénotypique. Nous décrirons ensuite leur voie de biosynthèse ainsi que leur mécanisme de transport au sein de la cellule végétale. Nous présenterons ensuite les différentes familles d’enzymes structurales de cette voie et nous préciserons l’organisation subcellulaire de ces dernières. Enfin, les différentes régulations de cette synthèse seront abordées. 1 LE SOJA ET SA GRAINE 1.1 Le soja 1.1.1 Description générale de la plante Le soja [Glycine max (L.) Merrill] est une plante appartenant à la famille des Fabacées, sous-famille des Faboideae, tribu des Phaseoleae, genre Glycine, qui est largement cultivée pour ses graines. Le soja est cultivé dans 47 pays à travers le monde mais la majorité des cultures intensives reste localisée aux Etats-Unis, au Brésil, en Argentine et en Chine (Labalette et al., 2010). Le terme soja sous-entend la plante mais également ses graines oléagineuses qui fournissent la deuxième huile alimentaire la plus consommée dans le monde, après l’huile de palme. Celles-ci constituent aussi l’un des aliments naturels les plus riches, notamment en protéines. En effet, il est aujourd’hui reconnu qu’elles renferment de nombreux composés bénéfiques pour la santé humaine (Kim et al., 2006c). Le génome de Glycine max est à ce jour entièrement séquencé. Ce travail s’est terminé au début de l’année 2010 (Schmutz et al., 2010). Ce génome est déposé sur la base de données « Phytozome » http://www.phytozome.net/soybean.php (Goodstein et al., 2012). Le soja possède un génome 18 allotétraploïde d’environ 975 Mb (taille totale deux fois plus importante que celui de la légumineuse modèle Medicago truncatula) réparties sur 20 chromosomes, avec 66153 loci codant pour des protéines. Environ 40 à 60% du génome est répétitif (Stacey et al., 2004). Le soja est une plante herbacée annuelle connue seulement à l’état cultivé. Elle est entièrement (feuilles, tiges, gousses) revêtue de poils gris ou bruns. Les tiges dressées ont une longueur de 30 à 130 cm. Les feuilles sont de type trifoliolé, chaque foliole mesurant entre 6 et 15 cm de long et 2 à 7 cm de large. Celles-ci tombent avant que les gousses ne soient arrivées à maturité. Les fleurs sont blanches ou mauves, de petite taille, et apparaissent à l’aisselle des feuilles. Elles sont hermaphrodites et autogames, mais la pollinisation croisée est parfaitement possible. Les gousses sont velues, de 3 à 8 cm, de couleur foncée à maturité, et contiennent généralement 2 à 4 graines. Les graines sont de forme sphérique ou elliptique et ont un diamètre variant généralement de 5 à 11 mm. Les feuilles représentent avec les racines des organes clés dans la nutrition azotée de la plante. L’azote est le quatrième constituant des plantes qui est utilisé dans l’élaboration de molécules importantes comme les protéines, les acides nucléiques et la chlorophylle. Lorsque le grain grossit, chaque feuille à travers la photosynthèse (de Veau et al., 1992) alimente préférentiellement les gousses situées au même étage. Une défoliation va pouvoir provoquer ainsi une diminution de 50% de la production pour certaines variétés (Li et al., 2005). En effet, la disponibilité en azote, notamment chez le soja, est un facteur déterminant pour la production de graine (Kinugasa et al., 2011). Les racines de soja jouent également un rôle important pour l’absorption de l’azote par la plante. La spécificité du soja et des légumineuses en général est son aptitude à fixer l’azote en symbiose avec les microorganismes du sol. Les racines assurent donc les deux voies de la nutrition azotée : l’absorption des nitrates du sol et la fixation de l’azote atmosphérique par les bactéries. En effet, la symbiose du soja avec la bactérie Bradyrhizobium japonicum permet à la culture de couvrir les trois quarts de ses besoins en azote (Broughton et al., 2003). La présence des isoflavones dans la racine favorise l’activité symbiotique entre le soja et les bactéries (Rolfe, 1988 ; Sugiyama et al., 2007 ; Lang et al., 2008). La symbiose a lieu à l’intérieur d’excroissances, encore appelées nodosités. En effet, la plante offre un micro habitat favorable à la bactérie, tout en lui procurant des substrats carbonés provenant de la photosynthèse et la bactérie quant à elle, fixe l’azote de l’air et du sol en le rendant disponible pour le soja. Le processus de fixation consiste en la réduction de l’azote atmosphérique N2 par le complexe enzymatique nitrogénase d’origine bactérienne (Milić et al., 1996 ; SameshimaSaito et al., 2006), sous forme ammoniacale. Ainsi, l’azote symbiotique est orienté vers les graines : 80 à 90% de cet azote se retrouve dans les graines à maturité tandis que l’azote 19 minéral se localise davantage dans les feuilles et les tiges (Sattin et al., 1987). De plus ce système racinaire très lignifié permet à la plante de puiser l’eau en profondeur et de bien fissurer le sol pour favoriser sa croissance. 1.1.2 Croissance et développement de la plante Tout au long de leur vie, les plantes montrent des changements progressifs et importants de taille et d’aspect dont le rythme et l’amplitude sont très variables selon les espèces, les variétés et les individus. La croissance de la plante correspond à l’ensemble des changements quantitatifs irréversibles (taille, masse, volume) qui se produisent au cours du temps. Chez le soja, la croissance peut être de type déterminé, indéterminé ou semi-déterminé selon la forme de l’extrémité de la tige principale (Hartung et al., 1981). Ce caractère aurait un déterminisme génétique fondé sur deux gènes majeurs épistatiques interagissant avec des gènes modificateurs à effet quantitatifs (Bernard, 1972 ; Daydé, 1989). Le développement de la plante est un processus cyclique qui commence de la germination de la graine jusqu’à la floraison et la sénescence en passant par la croissance végétative et la maturation. Il est décrit en séparant deux cycles : le cycle végétatif (Figure 1) et le cycle reproductif (Figure 2) (Fehr et al., 1971 ; Fehr et Caviness, 1977). Figure 1 : Principaux stades physiologiques du cycle végétatif du soja d’après le CETIOM – http://www.cetiom.fr 20 Le cycle végétatif (Figure 1) débute à la phase d’émergence jusqu’à la terminaison du développement des feuilles trifoliolées au nième nœud au-dessus du nœud cotylédonaire (stade notés Vn). Le cycle reproductif (Figure 2) commence à partir de la floraison (stade R1) jusqu’à la maturation des graines (stade R8). Chacun de ces cycles comprend donc plusieurs stades. Un stade est atteint lorsque 50% des plantes sont à ce stade. La durée de la période végétative dépend des caractéristiques de chaque variété en termes de précocité, de sensibilité à la photopériode, de disponibilité thermique et hydrique. Pour les sojas de type indéterminés, un chevauchement du cycle végétatif et reproductif est observé, et ceci, à l’échelle de la planète entière. Figure 2 : Principaux stades physiologiques du cycle reproductif du soja d’après le CETIOM –http://www.cetiom.fr Chez le soja la précocité correspond à la durée relative du cycle de développement de la plante si l’on compare différentes variétés semées à la même date, dans un même lieu. La durée du cycle de développement peut être exprimée en nombre de jours ou encore en unité de chaleur (Ecochard et al., 1978). Les variétés sont classées dans des groupes de précocité allant de 000, très précoces, dont les besoins photo et thermo-périodiques sont peu importants, à des groupes de type X, très tardifs (zones subtropicales ou équatoriales). En France, on cultive les variétés des groupes 00 à II. 21 1.2 La graine de soja Les graines sont des moyens efficaces pour la plante de survivre à des périodes défavorables à la croissance. Elles servent de réservoir de plantes potentielles capables de reconstituer la population suite à une ou plusieurs catastrophes (maladies, infestation d’insectes, incendie…). Pour de nombreuses espèces annuelles, la graine est l’unique vecteur de propagation. 1.2.1 La physiologie de la graine 1.2.1.1 Structure et développement La graine de soja (Figure 3) est divisée en trois fractions principales : Les cotylédons qui deviendront les premières structures photosynthétiques de la jeune plantule. Ce sont les principaux organes de réserve en protéines et en lipides. Ils représentent 90% de la masse de la graine. Les téguments (externe et interne) correspondent à l’enveloppe qui protège l’embryon. Ils représentent 8% de la graine. Leur couleur noire, brune, jaune ou verte est variable selon les variétés. Le germe (axe embryonnaire), composé de l’épicotyle, de l’hypocotyle et de la radicule. L’épicotyle donnera naissance aux futures feuilles et la radicule à la future racine. Il représente seulement 2% de la matière sèche de la graine, mais il contient, en proportions beaucoup plus grandes que les cotylédons, certains composés mineurs, notamment les isoflavones. Figure 3 : Structure de la graine de soja 22 Le développement de la graine se déroule en deux phases: La première (I) est appelée « lag-phase » (Egli, 1989). C’est pendant celle-ci que les divisions cellulaires ont lieu. Cette phase coïncide avec l’allongement de la gousse. La deuxième phase (II) consiste en l’accumulation de la matière sèche de la graine. La distinction de ces deux phases est basée sur la teneur en eau de la graine (Ney et al., 1993). Des travaux ont montré que le début de la diminution de la teneur en eau coïncide avec la phase de remplissage de la graine et se poursuit jusqu’à sa maturité physiologique (Le Deunff et Rachidian, 1988). La graine entrée en maturation subira ensuite la phase de quiescence. La croissance de l’embryon reprendra au moment de la germination. 1.2.1.2 Fécondation et morphogénèse La graine est un ensemble complexe de tissus d’origines différentes. L’embryon et l’albumen sont issus de la fécondation. Les téguments sont d’origine maternelle. L’albumen qui entoure le zygote, commence à se développer en premier. Les noyaux se divisent rapidement en l’absence de cytokinèse ce qui conduit à la formation d’un syncytium. L’albumen prolifère formant une masse « gélatineuse » qui occupe la majeure partie du sac embryonnaire et qui accumule transitoirement des substances nutritives pour l’embryon. Les divisions successives à partir de l’oosphère fécondée sont à la base de la morphogénèse. Le zygote (Figure 4) subit une division asymétrique qui donnera une grosse cellule basale à l’origine du suspenseur, tandis que la petite cellule terminale donnera la plantule proprement dite. Une seule cellule du suspenseur sera incluse dans l’embryon pour donner l’hypophyse, à la pointe de la future radicelle, qui évoluera ensuite en méristème racinaire. Figure 4 : Premiers stades de développement de l’embryon des angiospermes d’après Goldberg et al. (1994) 23 L’embryon subit plusieurs cycles de divisions en conservant une forme globulaire, puis la différenciation des cotylédons produit une déformation caractéristique en forme de cœur (Figure 5). Figure 5 : Représentation schématique du stade de développement « globulaire » et du stade de développement « cœur » de l’embryon de soja (Goldberg et Harada, 2009) Dès le début de la maturation, les différentes parties de l’embryon sont parfaitement reconnaissables (Figure 6). Celui-ci comprend : un axe embryonnaire, avec à sa base, le méristème racinaire, et à son apex, le méristème apical qui développera les tissus aériens de la plante ; deux cotylédons, sortes de feuilles primitives, qui se développent en stockant des quantités importantes de carbone sous forme de glucides, de lipides et de protéines, ainsi que des nutriments minéraux et des hormones qui permettent la croissance et le développement des plantules, jusqu’à ce qu’elles acquièrent la capacité d’avoir une photosynthèse active. Une étude réalisée in vitro indique que le développement de l’albumen est indépendant de celui de l’embryon (Kranz et al., 1998) mais il n’y a pas de réciprocité. L’embryon principal est dépendant de l’albumen pour son apport en acides aminés (Hirner et al., 1998) et pour le contrôle de son développement (Hong et al., 1996 ; Opsahl-Ferstad et al., 1997). 24 Figure 6 : Schéma du début de la maturation de l’embryon de soja (Goldberg et Harada, 2009) Chez la plupart des dicotylédones, l’albumen utilisé pour le développement de l’embryon, occupe quasiment tout le volume de la graine puis, il peut régresser jusqu’à disparaitre complètement à maturité. On parle alors de graine exalbuminée. C’est le cas des légumineuses, plus précisément du soja, où l’albumen n’a qu’un rôle transitoire dans le stockage des réserves de la graine. Celui-ci est absorbé par l’embryon au cours de son développement. En effet, une fois la maturation terminée, l’albumen étant absent, les cotylédons remplissent complètement l’intérieur de la graine (Goldberg et al., 1994). Il ne reste donc plus que deux types de tissus : les téguments, enveloppes protectrices plus ou moins résistantes qui dérivent des tissus de l’ovule, d’origine maternelle, et l’embryon (cotylédons surmontant le germe) issu de la fécondation. 1.2.2 Composition de la graine de soja 1.2.2.1 Les composés majeurs de la graine de soja La graine de soja est particulièrement riche en protéines (en moyenne 40%), en sucres (35%) et en lipides (20%) avec également 5% de fibres : en % de matière sèche (Snyder et Kwon, 1987). Ces composés présentent un grand intérêt pour les industries agroalimentaires. 25 Les protéines : un élément-clé pour les utilisateurs de l’agroalimentaire Les protéines de soja sont solubles dans l’eau et donc constituées surtout de globulines (80 à 90%), en moindre part d’albumines (10 à 20%) et d’une fraction de glutélines (Hymowitz et Collins, 1974). La qualité des protéines présentes dans la graine de soja est très satisfaisante en terme de profil d’acides aminés. Ces protéines contiennent les huit acides aminés essentiels et sont particulièrement riches en lysine. En revanche, les acides aminés soufrés (méthionine et cystéine) sont limitants (Tableau 1). Tableau 1 : Composition en acides aminés essentiels de la graine de soja (CETIOM, 2005) Ce profil particulier met donc en évidence la remarquable complémentarité du soja avec les céréales qui sont déficitaires en lysine mais riches en acides aminés soufrés. En plus de leur valeur nutritionnelle, les protéines de soja ont également démontré plusieurs effets bénéfiques sur la santé au point qu’en octobre 1999, la Food and Drug Administration (FDA) aux États-Unis a autorisé l’industrie alimentaire à utiliser une allégation santé relative au soja (FDA, 1999). Les lipides : On définit la teneur en huile par le pourcentage de lipides contenus dans la graine, généralement déterminé après extraction à l’hexane sous reflux. La teneur en huile de la graine de soja est relativement faible (20,5%) par rapport à d’autres oléagineux, bien que l’huile de soja soit la deuxième la plus produite au monde (Daydé et al., 2002) après l’huile de palme. Le profil lipidique de la graine de soja est particulièrement intéressant puisqu’elle présente peu d’acides gras saturés (15% des acides gras totaux) et une proportion élevée d’acides gras polyinsaturés (63%), riches en acides linoléique et linolénique (Favier et al., 26 1995). Cette variabilité de teneur est également dépendante de la fraction de la graine (Yoshida et al., 2003 ; Hubert, 2006) (Tableau 2). Tableau 2 : Profil des acides gras contenus dans les fractions de la graine de soja (en % des acides gras totaux) Les glucides : Les glucides sont des polysaccharides qui peuvent être classés en deux catégories : les sucres solubles et les sucres insolubles. La graine de soja contient entre 30 et 35% de sucres. Les sucres solubles représentent 10% de la matière sèche de la graine avec 5% de saccharose, 1% de raffinose et 4% de stachyose (Snyder and Kwon, 1987). Le contenu de ces deux derniers dans la graine de soja est génotype dépendant (Kumar et al., 2010). Le stachyose et le raffinose peuvent provoquer chez l’homme des problèmes physiologiques tels que la flatulence (Suarez et al., 1999). Les sucres insolubles (cellulose, hémicellulose, pectine, amidon) représentent la majorité des sucres (20 à 25% de la matière sèche de la graine). Ces sucres jouent un rôle de structure mais également un rôle de réserve dans la graine (Andriotis et al., 2010 ; Zeeman et al., 2010). En effet, les celluloses, les hémicelluloses et les pectines sont des constituants de la paroi végétale alors que l’amidon est stocké dans les chloroplastes. 1.2.2.2 Les composés mineurs La graine de soja contient également d’autres composés dits composés mineurs qui pour certains peuvent avoir un effet bénéfique pour la santé. En revanche d’autres sont considérés comme indésirables car ils altèrent la qualité nutritionnelle des dérivés de la graine utilisés par les transformateurs (Mohamed et al., 1991). Parmi ces composés mineurs on retrouve : Des minéraux : la graine de soja contient environ 5% de minéraux dont les principaux éléments sont le potassium, le phosphore, le magnésium et le calcium. 27 Les quantités de chacun d’eux dépendent des conditions de culture et du sol (Jurgonski et al., 1997). Des vitamines : les vitamines liposolubles A (β-carotène), E (α-tocophérol) sont de puissants antioxydants grâce à leur capacité de capture des radicaux libres. On trouve aussi les vitamines liposolubles D et K et des vitamines hydrosolubles, essentiellement du groupe B avec notamment une forte quantité d’acide folique (B9). Les concentrations de certaines d’entre elles, comme par exemple les tocophérols, ont été montrées comme étant dépendantes de la gestion des cultures (date des semis, espacements des rangs, lignée utilisée, fertilisation au phosphore et au potassium), (Seguin et al., 2010). Dans des conditions de température chaude ou de sécheresse pendant la phase de maturation de la graine de soja, la teneur en αtocophérol augmente de façon significative (Britz et Kremer, 2002). De l’acide phytique, qui représente la principale réserve de phosphore des graines de soja. Celui-ci se retrouve immergé sous forme de globoïdes cristallins dans le réseau des protéines (Hamada, 1996). De l’azote non protéique comprenant des acides aminés libres, des peptides, des polyamines. Des saponines, dont la structure se caractérise par la présence d’un noyau aglycone nommé sapogénine et d’une ou plusieurs chaines latérales de glucides. Elles sont divisées en deux groupes majeurs selon leur structure chimique : le groupe A et B. Les saponines A ont la particularité d’être exclusivement présentes dans le germe, alors que les saponines B sont présentes à la fois dans le germe et les cotylédons (Rupasinghe et al., 2003 ; Berhow et al., 2006). Des composés phénoliques, plus particulièrement les isoflavones, objet de notre étude, qui jouent un rôle majeur tant dans la physiologie de la plante (mise en place de la symbiose, défense contre certains pathogènes du sol) que dans le secteur de l’alimentation-santé (effets œstrogéniques et antioxydants). 28 2 LES ISOFLAVONES 2.1 Structure, caractéristiques et effets santé Les isoflavones font partie d’un groupe de composés phénoliques appelés flavonoïdes. Ces composés sont caractérisés par la présence d’un squelette de base C6-C3-C6 comportant deux noyaux aromatiques (A et B) et un noyau hétérocyclique (C) (Halbwirth, 2010). Les premiers éléments formés dans cette catégorie sont les chalcones chez lesquelles le cycle C n’est pas fermé (Figure 7-a). Les flavanones et flavones (Figure 7-b) ont un groupement cétone en C4, les isoflavonoïdes sont caractérisés par le positionnement en C3 du groupement aryl (cycle B). La plupart des flavonoïdes et isoflavonoïdes sont hydroxylés en 7 et 4’ (ce qui correspond à la conservation des groupements hydroxyles 4’ et 4 des chalcones dont ils sont issus. Les isoflavones caractéristiques des légumineuses, sont utilisées pour la biosynthèse des phytoalexines (squelette ptérocarpane, Figure 7-c) Figure 7 : Structure type et numérotation des cycles des chalconoïdes (a) des flavanoïdes (b) et des pterocarpanes (c). La chalcone la plus souvent rencontrée est la 2',4, 4',6'tétrahydroxychalcone, ou naringénine chalcone. Les flavanones et flavones ont un groupement cétone en C4 ; les isoflavonoïdes sont caractérisés par la position en C3 du groupement aryl (cycle B). Les ptérocarpanes sont formées à partir des isoflavones (après hydroxylation en 6’). Les isoflavones sont les principaux composés phénoliques de la graine de soja. L’isoflavone la plus simple est la daidzéine alors que la génistéine et la glycitéine présentent des radicaux spécifiques sur les carbones 5 et 6 (Figure 8). On retrouve les isoflavonoïdes dans un grand nombre de familles de végétaux (Mackova et al., 2006). Cependant les légumineuses sont les producteurs les plus caractéristiques (Botta et al., 2009 ; Veitch, 2009). 29 Figure 8 : Structure des isoflavones de soja Dans la graine de soja, les isoflavones se divisent en 12 structures chimiques, réparties en 3 familles dérivées des structures aglycones : daidzéine, génistéine et glycitéine dites « formes simples ». Les formes β-glucosides (daidzine, génistine, glycitine), acétylglucosides et malonylglucosides sont des formes conjuguées libérant après hydrolyse leur structure aglycone correspondante (Gu et Gu, 2001 ; Hsieh et Graham, 2001) (Figure 9). Les formes acétyles sont considérées comme des artéfacts, issus de la transformation spontanée des malonyles après traitement thermique (Grün et al., 2001 ; Xu et al., 2002 ; Yin et al., 2005, Yerramsetty et al., 2011). Figure 9 : Structure et conjugaison des 3 familles d’isoflavones de soja Les effets santé des isoflavones sont attribués à leurs propriétés phytoestrogéniques (Vicas et Socaciu, 2003 ; Dixon, 2004). En effet, les isoflavones, en particulier la génistéine, ont une structure très proche de celle de l’œstradiol, naturellement sécrété chez la femme au niveau des ovaires jusqu’à la ménopause (Figure 10). On parle donc de phytoestrogènes non stéroïdiens. Les isoflavones se fixent aux récepteurs œstrogéniques avec une affinité particulière pour les récepteurs ER-β, majoritaires dans certains tissus, entrant ainsi dans le circuit des agents potentiellement actifs pour une thérapie œstrogénique chez la femme post-ménopausée (Carusi, 2000 ; Cederroth et Nef, 2009). Cependant, la liaison des isoflavones aux récepteurs de l’œstradiol s’établit avec une affinité relativement faible par rapport à l’œstradiol humain. 30 Il s’en suit des effets compétitifs avec l’œstradiol selon la cellule cible considérée (Kuiper et al. ; 1998, Choi et al., 2008). Figure 10: Comparaison structurale des isoflavones et du 17-β-estradiol De par leurs propriétés phytoestrogéniques, les isoflavones ont suscité beaucoup d’intérêt pour le soulagement des symptômes ménopausaux. Les résultats concernant l’action précise des isoflavones vis-à-vis de ces symptômes sont encore très contrastés. Plusieurs études montrent qu’une consommation d’isoflavones de soja régulière inhiberait les troubles de la ménopause (Cheng et al., 2007 ; Ferrari, 2009 ; Chedraui et al., 2011 ; Hachul et al., 2011). Cependant, certains travaux soulignent au contraire que la consommation d’isoflavones n’entraînerait aucun changement significatif des symptômes climactériques des femmes post-ménopausées (Kok et al., 2005). Les effets concernant l’action des isoflavones sur l’ostéoporose sont également très discutés. En effet, si l’expérimentation animale, majoritairement conduite chez la rate ovariectomisée, a fourni les preuves d’une certaine efficacité pour la prévention de la perte osseuse liée à la suppression de la synthèse des œstrogènes (Winzer et al., 2010), les investigations chez l’homme sont moins consensuelles (Wong et al., 2009 ; Castelo-Branco et Cancelo Hidalgo, 2011 ; Kuhnle et al., 2011). Les isoflavones ont également une action antioxydante (Devi et al., 2009 ; Han et al., 2009 ; Yue et al., 2010). Des différences de capacités antioxydantes sont observées entre des extraits de germes et de cotylédons. En effet, les extraits de germes montrent une activité antioxydante plus élevée que celle des extraits de cotylédons (Monje et al., 2006). Leur pouvoir antioxydant leur permettrait d’agir directement contre l’hypertension et les phénomènes de coagulation sanguine (Martin et al., 2008 ; Kelly et al., 2010). Du fait de leur propriétés phytoestrogéniques et antioxydantes, les isoflavones sont aussi au centre des intérêts pour la prévention de certains cancers hormonaux-dépendants, tels que le cancer du sein, de la prostate, des ovaires et de l’endomètre. Bien que parfois les effets soient controversés, les travaux les plus récents semblent s’accorder sur un effet protecteur 31 (Lof et Weiderpass, 2006 ; Messina et Hilakivi-Clarke, 2009). Le rôle préventif des isoflavones vis-à-vis des cancers serait lié à leur pouvoir œstrogénique (Pfeiffer et al., 2006 ; Taylor et al., 2009 ; Sakamoto et al., 2010) mais aussi à leur capacité d’inhibition de l’activité d’enzymes spécifiques impliquées dans la prolifération cellulaire. C’est le cas de la génistéine et de la daidzéine qui inhibent à la façon d’un puissant antioxydant la prolifération des cellules cancéreuses via l’inhibition des tyrosine kinases (Yan et al., 2010 ; Yu et al., 2012). Celles-ci inhiberaient également la production de peroxyde d’hydrogène et la propagation des radicaux libres ou d’espèces oxygénées hautement réactives impliquées dans l’altération de l’ADN (Tikkanen et al., 1998 ; Takahashi et al., 2005). La glycitéine aurait quant à elle un effet inhibiteur sur la prolifération et l’invasion des cellules cancéreuses de la prostate et du sein (Kim et al., 2002 ; Magee et al., 2004 ; Clubbs et Bomser, 2009). De récentes études mettent également en évidence le potentiel thérapeutique des isoflavones vis-à-vis d’autres types de cancers. La génistéine et de la daidzéine auraient un effet protecteur vis-à-vis du cancer du côlon (Wang et Chen, 2010 ; Lee et al., 2011) et la glycitéine vis-à-vis de la tumeur au cerveau (Lee et al., 2010a). Des études réalisées chez l’homme et les rongeurs montrent également des effets négatifs de la part des isoflavones. Celles-ci auraient des effets antithyroïdiens (Sathyapalan et al., 2011). Elles provoqueraient également une augmentation de la pression sanguine et des lésions au niveau de l’ADN (Ullah et al., 2009 ; Dong et Qin, 2011 ; Liu et al., 2012). Les isoflavones peuvent également devenir indésirables dans certains produits à base de soja couramment utilisés en alimentation, tels que les préparations infantiles de substitution que l’on utilise dans les cas d’intolérance au lactose, ou pour l’alimentation des femmes enceintes (Barrett, 2002 ; Chen et Rogan, 2004 ; Turck, 2007 ; Badger et al., 2009 ; Doerge, 2011 ; Vanhees et al., 2011). Ces risques potentiels ont donc conduit les autorités de plusieurs pays à définir des doses maximales quotidiennes. En 2005 en France, l’Agence Française de Sécurité Sanitaire des aliments (AFSSA et AFSSAPS, 2005) a émis une recommandation de dose maximale chez l’adulte à 1mg d’isoflavones aglycones par kilogramme et par jour, et a préconisé de ne pas donner de soja aux enfants de moins de 3 ans. 32 2.2 Composition et teneur en isoflavones de la graine de soja et ses compartiments Les différentes fractions de la graine de soja possèdent des teneurs et des profils d’isoflavones caractéristiques. On observe une compartimentation des isoflavones au sein de la graine de soja. Plusieurs études montrent que les concentrations les plus faibles en isoflavones dans la graine entière sont retrouvées pour les stades R4 et R5 au début du développement de la graine (Kim et al., 2006b ; Chen et al., 2011) et qu’à l’inverse les stades les plus tardifs présentent des concentrations élevées (Dhaubhadel et al., 2003). Les teneurs dans la graine augmentent en effet au cours du développement de la graine (Berger et al., 2008). Les différences de concentrations en isoflavones dans les fractions distinctes de la graine (germe et cotylédons) sont très significatives. En effet, le germe de soja possède la plus importante teneur en isoflavones, elles comptent généralement pour plus de 1,5 % de la masse du germe. Bien que le germe ne représente que 2% du poids de la graine de soja entière, il contient 4 à 10 fois plus d’isoflavones que les cotylédons, devenant ainsi un sous-produit hautement valorisable pour le marché des suppléments santé (Tsukamoto et al., 1995 ; Schryver, 2002 ; Hubert, 2006 ; Monje et al., 2006). Les fractions germes et cotylédons présentent également des profils caractéristiques en isoflavones. Dans le germe, les conjugués de la daidzéine et de la glycitéine représentent respectivement 40-60 % et 25-40 % des isoflavones totales (Daydé et al., 2004). La daidzéine et la glycitéine sont donc les deux formes majoritaires du germe. La glycitéine quant à elle se trouve exclusivement dans le germe. Elle représente 5 à 10 % des isoflavones de la graine, mais peut constituer plus de 50% des isoflavones totales du germe (Tsukamoto et al., 1995). Dans les cotylédons, la génistéine largement majoritaire, représente 50-70 % des isoflavones totales (Eldridge et Kwolek, 1983). 2.3 La cinétique d’accumulation des isoflavones dans la graine et ses compartiments Le développement de la graine depuis la fécondation jusqu’à la maturité se divise en trois étapes : tout d’abord l’embryogénèse proprement dite, caractérisées par une division cellulaire très active, suivie d’une phase d’expansion cellulaire qui correspond à la croissance 33 de l’embryon, accompagnée d’une intense activité de synthèse et d’accumulation des réserves protéiques, lipidiques et glucidiques, puis enfin la phase de préparation à la dormance qui est associée à la déshydratation de la graine (Figure 11). Pendant la phase d’accumulation des réserves, l’embryon grandit en taille avec peu de divisions cellulaires. La synthèse et l’accumulation des lipides et des protéines commencent très tôt, et constituent la principale contribution à l’augmentation de la matière sèche. Ces ressources seront utilisées par l’embryon pendant la germination avant la mise en place d’un appareil photosynthétique fonctionnel. La dernière étape de développement correspond à l’étape de dessiccation et d’entrée en dormance, pendant laquelle la graine peut perdre selon les espèces de 40 à 90% d’eau. Le développement de la graine s’arrête, la paroi de l’ovule se durcit et se différencie en téguments protecteurs, plus ou moins imperméables à l’eau et à l’air. Accumulation des isoflavones dans les cotylédons Accumulation des isoflavones dans le germe Figure 11 : Succession des stades physiologiques intervenant durant le développement de la graine de soja – en pointillés rouge : variation de la matière sèche d’après Goldberg, (2007) – http://estdb.biology.ucla.edu/seed/project#seed Alors que les composés majeurs (protéines, lipides, sucres) s’accumulent progressivement au cours du cycle de la plante, les composés mineurs (Acide phytique, minéraux, saponines, isoflavones) présentent une grande diversité de cinétiques, particulièrement l’accumulation des isoflavones dans la graine. Celle-ci semble en effet 34 différente selon le type d’isoflavone (Kudou et al., 1991). La génistéine et sa forme malonyle s’accumulent un peu plus tard que la daidzéine et sa forme malonyle correspondante pendant la période de développement de la graine, soit entre 35 JAF et 60 JAF. D’autres travaux ont également montré que les glucosides, les malonyl-glucosides, la génistéine totale (la forme aglycone et les formes conjuguées) et la daidzéine totale, sont hautement corrélées avec les concentrations en isoflavones totales de la graine et constituent la majorité des isoflavones totales du stade R5 jusqu’à maturité complète. Il y a ainsi généralement, une corrélation positive entre la concentration en isoflavones totales et les stades de développement (Kim et Chung, 2007 ; Kumar et al., 2009). En effet, pour l’accumulation des isoflavones totales dans la graine, la période de croissance entre les stades R5 et R6 est la période la plus active avec une augmentation de 117 % alors que la période entre le stade R7 et la maturité physiologique complète est la plus léthargique avec seulement 40 % d’augmentation. Imari (●) et Queen (○) sont représentés par un trait plein ; NSK(▼) par un trait en pointillé et NT (Δ) par un trait en tiret Figure 12 : Accumulation des isoflavones dans les cotylédons (A, B, C) et les germes (D, E, F) chez 4 variétés de soja sous 3 conditions de cultures : en serre en 2003 (A,D), 2004 (B,E) et au champ en 2005 (C,F) d’après Berger et al. (2008) L’accumulation des isoflavones dans la graine est également très différente selon le compartiment. Une grande différence de teneur et de composition est effectivement observée 35 entre les germes et les cotylédons. Les isoflavones s’accumulent d’abord dans le germe, et ceci dès le stade R5 (20 JAF), c'est-à-dire au tout début du grossissement de la graine. L’accumulation y est alors très rapide, pour atteindre la teneur finale en une dizaine de jours, c'est-à-dire au stade R6. C’est à ce moment-là seulement que commence l’accumulation dans les cotylédons (Berger et al., 2008). Ce phénomène a été observé chez les quatre génotypes étudiés, et dans les trois conditions de cultures comparées. Lorsque les conditions sont favorables à une forte accumulation des isoflavones dans les cotylédons, celle-ci se produit de manière continue jusqu’à maturité physiologique complète. Dans tous les cas, la teneur finale des cotylédons est bien inférieure à celle des germes. Ainsi, un net décalage de l’accumulation des isoflavones dans les germes et les cotylédons est souligné, l’accumulation dans les cotylédons est très tardive et ne commence que quand celle dans les germes a déjà atteint un plateau (Figure 12). 2.4 Facteurs influençant la teneur et la composition en isoflavones dans la graine de soja De nombreux facteurs susceptibles de faire varier la teneur en isoflavones dans la graine de soja ont été étudiés. En effet, l’environnement, les génotypes et leur interaction sont largement reconnus pour leur influence sur le contenu en isoflavones de la graine (Lee et al., 2003 ; Primomo et al., 2005 ; Rasolohery et al., 2008). Les concentrations en isoflavones totales d’un cultivar donné peuvent varier pour plus de 325 % selon les environnements (Seguin et al., 2004). De telles variations sont problématiques pour le développement d’aliments fonctionnels, les concentrations étant grandement imprévisibles. 2.4.1 Facteurs environnementaux L’impact de l’environnement sur les teneurs et les profils en isoflavones dans la graine entière de soja a été largement étudié (Sun et Ding, 1998 ; Lee et al., 2003 ; Al-Tawaha et Seguin, 2006 ; Carrera et al., 2011 ; Chennupati et al., 2011 ; Kim et al., 2011). Cependant, les germe et cotylédons ne sont pas soumis de la même manière à l’influence des facteurs environnementaux pendant la maturation de la graine (Rasolohery et al., 2008). 2.4.1.1 Effet du lieu Les travaux pionniers dans ce domaine ont très vite établi de fortes variations des variétés testées : de 460 à 1950 µg/g pour les mêmes variétés plantées dans quatre lieux 36 différents (Eldridge et Kwolek, 1983) ; de 1149 à 1176 µg/g pour une même variété dans différents lieux de culture (Wang et Murphy, 1994b). L’effet lieu modifie également les profils d’isoflavones dans la graine (Riedel et al., 2007). Une étude multilocale menée sur deux variétés et 9 lieux a montré un écart du simple au double. Par contre, les pourcentages des isoflavones sont restés remarquablement stables (Berger et al., 2002 ; Daydé et al., 2002). 2.4.1.2 Effet de la température et de l’irrigation L’effet de la température lors du remplissage de la graine semble de loin le facteur environnemental le plus influent sur la teneur en isoflavones totales. Les lieux de culture dont la moyenne de température est plus élevée sont aussi ceux où l’on relève les plus faibles teneurs en isoflavones. Cet effet est parfaitement documenté et démontré en conditions contrôlées (Tsukamoto et al., 1995 ; Caldwell et al., 2005 ; Lozovaya et al., 2005). En effet, ces travaux montrent pour la plupart qu’une augmentation de 5°C de la température de l’air pendant le développement de la graine résulte en une réduction de 3 à 6 fois de la concentration en isoflavones totales des graines matures. On constate également que les températures anormalement fraîches en fin de remplissage induisent une très forte accumulation des isoflavones dans la graine. De plus, un stress périodique forte température (33°C jour / 25°C nuit) appliqué à des stades antérieurs à la formation de la graine pendant le développement de la plante (comme par exemple pendant les stades de pré-levée, les stades végétatifs ou encore les stades reproductifs précoces (R1-R4)), peut aussi affecter les concentrations finales en isoflavones dans la graine mature (Chennupati et al., 2011). En effet, un tel stress imposé du stade R1 à R4 réduit les concentrations finales en isoflavones individuelles et totales, bien que l’ampleur de la réponse dépende de la variété. Ce stress pendant les stades végétatifs réduit la concentration de toutes les isoflavones chez certaines variétés alors qu’il ne réduit seulement que celle de la génistéine chez d’autres (Chennupati et al., 2011). Néanmoins, ce stress appliqué pendant la pré-levée peut aussi provoquer l’effet inverse, en augmentant la concentration finale en isoflavones. Ces résultats démontrent ainsi que les variations des concentrations en isoflavones dans la graine ne sont pas restreintes aux évènements ayant lieu pendant le développement de la graine mais sont également dépendantes des évènements en amont. Les effets de la température sur les concentrations en isoflavones se sont révélés différents dans les cotylédons et les germes. De faibles températures engendrent une augmentation considérable (de 3 à 6 fois) des contenus en daidzéine et génistéine dans les 37 cotylédons en fonction des traitements alors que dans les germes, le facteur multiplicatif est inférieur à 2 dans les mêmes situations (Rasolohery et al., 2008). L’autre facteur qui est généralement très différent d’un lieu à l’autre est la disponibilité en eau. Une irrigation tardive augmente fortement la teneur en isoflavones (Boscredon, 2001). En conditions contrôlées, un stress hydrique après le stade de développement R6 de la graine diminue significativement la teneur en isoflavones (Lozovaya et al., 2005). Le stress hydrique induit la diminution du rendement et plus particulièrement celle du poids de mille grains (PMG) (Masoumi et al., 2010). La concentration en isoflavones dans les cotylédons augmente dans le cas d’une irrigation tardive en champ, mais n’a pas d’effet significatif en serre. Une irrigation réduite en serre n’a pas d’effet significatif sur les caractéristiques du germe. En revanche, une irrigation tardive au champ induit une augmentation de 20% du contenu en isoflavones (13,91 vs 11,58 g.kg-1 pour irrigué vs non irrigué) avec une augmentation significative du contenu en glycitéine pour certaines variétés et en daidzéine pour d’autres (Rasolohery et al., 2008). 2.4.2 Facteurs génétiques L’effet génotype est prépondérant sur la composition en isoflavones, en effet les profils sont toujours bien conservés (Whent et al., 2009). La teneur en isoflavones dans la graine peut varier du simple au double entre deux variétés extrêmes dans un lieu donné. Il y a ainsi une grande variabilité génotypique des teneurs dans l’espèce soja (Eldridge et Kwolek, 1983 ; Tepavcević et al., 2010). Cependant, cet écart est généralement conservé d’un lieu à l’autre, d’une année à l’autre (Daydé et al., 2002 ; Al-Tawaha et al., 2007). Cette variabilité génotypique combinée à une bonne stabilité des variétés, se traduit par des estimations élevées de l’héritabilité (>0,70) pour le contenu en isoflavones totales ou individuelles (Meksem et al., 2001 ; Daydé et al., 2004 ; Kassem et al., 2004 ; Chiari et al., 2006 ; Rasolohery et al., 2008). Plusieurs QTLs (Quantative Trait Loci) permettant de mettre en évidence des régions chromosomiques associées avec les concentrations en isoflavones totales ou individuelles dans les graines de soja ont récemment été identifiés (Kassem et al., 2004 ; Primomo et al., 2005 ; Gutierrez-Gonzalez et al., 2009 ; Zeng et al., 2009 ; Gutierrez-Gonzalez et al., 2011). Toutes ces études ont en effet identifié plus de 50 QTLs avec de petits effets additifs, souvent dépendants de l’environnement, avec une épistasie AA, démontrant ainsi un réseau très 38 complexe pour le contrôle des quantités d’isoflavones totales ou individuelles dans les graines. Ces QTLs sont généralement dépendants des lignées parentales utilisées. Cependant, un locus majeur a été identifié dans différents croisements et environnements (GutierrezGonzalez et al., 2011). Il compte à lui seul pour plus de 10% de la variance phénotypique pour la glycitéine, et de 35 à 37% pour la génistéine, la daidzéine et la somme des trois isoflavones. Ce QTL est constamment associé à une augmentation de la concentration en isoflavones à travers différents lieux, différentes années et différents croisements. Il s’agit du plus important locus identifié et associé à une nette augmentation des quantités de toutes les formes d’isoflavones dans la graine, suggérant ainsi que ce locus est un excellent candidat à cibler pour la sélection assistée par marqueurs (Gutierrez-Gonzalez et al., 2011). Des gènes codant pour des enzymes structurales de cette voie de biosynthèse des isoflavones ont également été suggérés comme gènes candidats. C’est notamment le cas par exemple des gènes IFS2 (isoflavone synthase) et CHI3 (chalcone isomérase) colocalisés avec un QTL pour le contenu en génistéine sur le chromosome 13, ou encore des homologues des chalcone synthases (CHS4, CHS3, CHS1, CHS9 et CHS5) qui sont colocalisés avec les QTLs qDAI8 (teneur en daidzéine) et qTOT8 (teneur totale en isoflavones) sur le chromosome 8 (Gutierrez-Gonzalez et al., 2010b). D’un autre côté, une étude de polymorphisme des gènes des isoflavones synthases (IFS1 et IFS2) à partir de différentes variétés chinoises a permis d’identifier 5 SNPs (Single Nucleotide Polymorphism) comme étant associés avec les concentrations en isoflavones dans les graines (Cheng et al., 2008). En effet, 3 SNPs ont été identifiés sur le gène IFS1, deux d’entre eux étant sur la région promotrice et le troisième sur le premier exon. Pour le gène IFS2, 2 SNPs ont été identifiés, chacun étant situé sur l’un des deux exons du gène. Cependant, aucun de ces SNPs n’est retrouvé sur une zone promotrice conservée (Subramanian et al., 2004). L’identification de SNPs reliés au contenu en isoflavones dans ces deux séquences IFS1 et IFS2, tout comme les multiples QTLs dépendants des variétés et des effets épistatiques AA trouvés dans ces différentes études soulignent ici la complexité de régulation de cette voie, qui peut, de plus, varier avec les génotypes. 39 2.5 Rôles physiologiques des isoflavones dans la plante Les isoflavones jouent différents rôles importants dans la plante. Elles interviennent notamment dans la mise en place de la symbiose, et plus généralement au niveau des relations plantes-microorganismes. Elles interviennent également dans la réponse aux stress abiotiques. 2.5.1 Isoflavones et symbiose La plante sécrète des composés qui vont lui permettre d’interagir avec la microflore du sol. Ce sont certains exsudats produits par les légumineuses qui sont spécifiquement reconnus par les rhizobiums et qui induisent un changement de comportement chez ceux-ci. Cette reconnaissance est effectuée par l’intermédiaire de signaux chimiques. Divers composés déterminant une chimiotaxie positive sont émis par les racines des légumineuses-hôtes (Pankhurst et Biggs, 1980 ; Paiva, 2000). Parmi ces composés, les flavonoïdes sont les plus grands inducteurs de l’expression de gènes bactériens nécessaires pour la nodulation (Broughton et al., 2000 ; Antunes et al., 2006 ; Subramanian et al., 2007 ; Zhang et al., 2009). Chez le soja, la daidzéine et la génistéine sont les principaux constituants des exsudats racinaires. Chacun de ces composés a été montré comme étant inducteur primaire de l’expression des gènes de la nodulation de Bradyrhizobium japonicum, appelés « gènes nod » (Kosslak et al., 1987 ; Rolfe, 1988 ; Smit et al., 1992 ; Napoles et al., 2009). Ces gènes sont responsables de la synthèse des enzymes nécessaires à la production de « facteurs Nod » (lipo-oligosaccharides complexes). Leur expression est contrôlée par des gènes régulateurs de la famille NodD (Lerouge et al., 1990 ; Bec-Ferté et al., 1994 ; D'Haeze et Holsters, 2002). Ces lipochito-oligomères sont sécrétés par les bactéries dans le milieu externe et vont déclencher une série de modifications chez la plante (Dénarié et al., 1996 ; Duzan et al., 2004). En effet, ils sont à l’origine de la différenciation et de la division cellulaire conduisant, au niveau des racines des légumineuses hôtes, à l’organogénèse nodulaire (Cooper, 2007 ; Oldroyd et Downie, 2008 ; Buer et al., 2010) (Figure 13). 40 Figure 13 : Processus global d’infection jusqu’à la formation du nodule fonctionnel chez les légumineuses. Les isoflavones, en tant qu’inducteurs des gènes nod, sont donc essentielles pour la nodulation (Subramanian et al., 2006). La génistéine semble plus efficace à cette induction que la daidzéine (Sutherland et al., 1990 ; Lang et al., 2008). La production endogène de génistéine est suffisante pour soutenir la nodulation (Ip et al., 2001 ; Subramanian et al., 2006) : Elle induit la nodulation de Bradyrhizobium japonicum en se liant aux protéines NodD1 et NodV (Long, 1996) ou encore aux trois protéines : NopB, NopH et NopT (Hempel et al., 2009). Elle est également capable d’accélérer le développement des nodules et d’augmenter le taux de fixation de l’azote atmosphérique (Zhang et Smith, 1995). 2.5.2 Isoflavones et défense contre les microorganismes Les isoflavones jouent aussi un rôle dans les défenses de la plante en cas d’attaques par des agents pathogènes (virus, bactéries, champignons) ou par des ravageurs tels que les nématodes et les insectes (Bednarek et Osbourn, 2009 ; Feng et al., 2010). Les isoflavones, sont en effet des phytoalexines, qui contribuent à limiter l’extension des infections causées dans les plantes (Bent, 2011). Les phytoalexines sont généralement présentes en très faible concentration ou absentes mais sont rapidement synthétisées lors d’un envahissement par des pathogènes viraux, bactériens et fongiques ou par des ravageurs (Veech, 1982 ; Dixon et al., 1995 ; Modolo et al., 2002 ; Lozovaya et al., 2004 ; Naoumkina et al., 2007). Dans ce cas de réponse inductible de défense de la plante, on parle de défense active. La génistéine ainsi qu’une molécule dérivée de la daidzéine, la glycéolline, interviennent dans la lutte contre les infections (Boué et al., 2000 ; Dixon et Ferreira, 2002 ; Lee et al., 2010b ; Lygin et al., 2010). 41 2.5.3 Isoflavones et stress environnementaux Les isoflavones jouent aussi un rôle très important dans la défense contre les stress abiotiques, tels que l’exposition aux UV (Graham et Graham, 1991 ; Graham et Graham, 1996). Dans les plantes exposées aux radiations UV, la teneur en flavonoïdes augmente, suggérant qu’ils offrent une protection contre les radiations nocives de l’UV-B (propriétés antiradicalaires et inhibition d’enzymes) (Wei et al., 1996 ; Caldwell et al., 2005 ; Jenkins, 2009). 3 BIOSYNTHESE DES ISOFLAVONES DE SOJA 3.1 Description générale de la voie de biosynthèse des isoflavones L’intervention successive de deux voies distinctes est nécessaire pour mener à la synthèse des isoflavones : la voie des phénylpropanoïdes et la voie des flavonoïdes. 3.1.1 Synthèse des composés phénoliques simples : voie des phénylpropanoïdes Ces premières étapes sont communes à tous les composés phénoliques. Cette synthèse commence par la désamination de la phénylalanine (acide aminé aromatique issu de la voie des shikimates) en acide cinnamique, précurseur de nombreux phénylpropanoïdes (Figure 14). L’enzyme responsable de cette réaction est la phénylalanine ammonia lyase (PAL), qui contrôle ainsi l’orientation du carbone vers la production de composés phénoliques plutôt que vers la production de métabolites primaires comme les protéines. La cinnamate 4-hydroxylase (C4H) convertit ensuite l’acide cinnamique en acide p-coumarique, puis ce dernier est finalement activé en p-coumaroyl-CoA par la 4-Coumarate CoA-ligase (C4L). Figure 14 : Etapes initiales de la biosynthèse des composés secondaires phénoliques d’après Winkel-Shirley, (2001) 42 3.1.2 La voie des flavonoïdes La chalcone synthase (CHS) a un rôle clef dans cette voie puisqu’elle catalyse la première étape vers la voie de biosynthèse des flavonoïdes en provoquant la condensation séquentielle d’une molécule de p-coumaroyl-CoA et de trois molécules de malonyl-CoA (Figure 15), formant ainsi la naringénine chalcone (voir aussi Figure 7 page 29), premier intermédiaire réactionnel des 3 types d’isoflavones présentes chez le soja. À partir de ce premier intermédiaire chalcone, la voie de biosynthèse des isoflavones du soja se scinde en deux branches : l’une menant à la synthèse de la génistéine et l’autre menant à la synthèse de la daidzéine et de la glycitéine selon que ce précurseur soit réduit ou non par la chalcone réductase (CHR). La fermeture du cycle C (Figure 7, page 29) par la chalcone isomérase (CHI) produit la naringénine, intermédiaire de la génistéine. La chalcone réductase (CHR) forme la 6’-deoxychalcone ou isoliquiritigénine (Welle et Grisebach, 1988), qui est transformée en liquiritigénine, précurseur de la daidzéine et de la glycitéine, par la CHI. La naringénine est aussi le point d'entrée dans la voie des anthocyanes. Ainsi, la F3H (Flavanone 3-hydroxylase) peut être en compétition avec la synthèse de la génistéine (Yu et al., 2003). PAL : Phénylalanine Ammonia Lyase – CHS : Chalcone Synthase – CHR : Chalcone Réductase – CHI : Chalcone Isomérase – F6H : Flavonoïde 6-Hydroxylase – 4’-IOMT : 4’-Isoflavanone-O-Méthyltransférase – 6-IOMT : 6-Isoflavanone-OMéthyltransférase – IFS : Isoflavone Synthase – HID : Hydroxyisoflavanone Déshydratase – F3H : Flavanone 3Hydroxylase. Figure 15 : Voie de biosynthèse des isoflavones de soja d’après Yu et al. (2003) ; Du et al. (2010) ; Wang, (2011) 43 À partir de la liquiritigénine, la voie se scinde à nouveau en deux branches distinctes : celle menant à la daidzéine et celle menant à la glycitéine. La synthèse de cette dernière n’est pas encore totalement élucidée. Il est admis que son intermédiaire flavanone (6,7,4’trihydroxyflavanone) est produit à partir de la liquiritigénine par une F6H ou flavonoïde 6hydroxylase (Latunde-Dada et al., 2001). L’entrée dans la voie de synthèse des isoflavonoïdes proprement dits est marquée par la migration du groupement aryl de C2 à C3. Cette étape clef est catalysée par une 2hydroxyisoflavanone synthase, plus communément appelée isoflavone synthase (IFS). Les 3 intermédiaires isoflavanones sont produits à partir de leurs précurseurs respectifs. Une déshydratation de ces isoflavanones peut ensuite survenir spontanément ou plus probablement à travers la catalyse réalisée par la 2- hydroxyisoflavanone déshydratase (HID) (Akashi et al., 2005 ; Shimamura et al., 2007) qui génère les isoflavones correspondantes. Elle est aussi capable de convertir des substrats méthylés (Du et al., 2010). Selon les intermédiaires réactionnels observés chez le soja et chez Medicago truncatula, la synthèse de la glycitéine pourrait faire intervenir une 6-isoflavanone-O-méthyltransférase (6-IOMT) pour former l’intermédiaire méthylé de la glycitéine (Klus et Barz, 1995 ; Hirota et al., 2004), mais les travaux récents sur cultures cellulaires de Medicago truncatula indiquent que la méthylation en C6 pourrait avoir lieu plus tardivement sur l’isoflavone (Farag et al., 2008). Outre le rôle clef de la CHS dans la production des isoflavones, on peut également noter (Figure 15) que la CHR, tout comme la F3H peuvent jouer un rôle crucial dans la balance entre la daidzéine et la génistéine ; tandis que le rapport glycitéine vs. daidzéine est probablement déterminé par l’hydroxylation de la liquiritigénine, probablement par une F6H. 3.1.3 Variations du schéma de base chez les légumineuses Chez certaines espèces de légumineuses, comme Medicago truncatula, ou le trèfle rouge (Trifolium pratense L.), on observe d’autres formes d’isoflavones, les plus fréquentes étant la biochanine A et la formononétine qui sont respectivement les formes méthylées en 4’ de la génistéine et de la daidzéine. Ces isoflavones sont généralement observées dans les feuilles, et d’ailleurs, elles sont aussi produites dans les feuilles du soja (Akashi et al., 2000 ; Akashi et al., 2003 ; Tsao et al., 2006 ; Farag et al., 2008). Récemment, il a été montré que l’afrormosine (7-hydroxy-6,4’-diméthoxyisoflavone) était une des isoflavones majoritaire secrétée par des cellules élicitées de Medicago truncatula (Farag et al., 2008). Celle-ci correspond au dérivé méthylé en 4’de la glycitéine. 44 Figure 16 : Les isoflavones aglycones et leurs dérivés méthylés identifiés chez Trifolium pratense et Medicago truncatula Cette méthylation était supposée avoir lieu après la synthèse de l’isoflavone, mais la 4’IOMT n’accepte que les isoflavanones comme substrats. Elle agirait donc ainsi avant la HID. De ce fait, on retrouve ainsi les équivalents méthylés (biochanine A, formononétine et afrormosine) dont l’identification souligne ici la flexibilité métabolique dans cette voie de biosynthèse des isoflavonoïdes (Figure 16). 3.1.4 Les formes conjuguées des isoflavones Chez les légumineuses, notamment chez le soja, plusieurs enzymes assurent la conjugaison des formes aglycones vers des structures de plus en plus complexes (glucosides, acétyles et malonyles). Cette conversion à lieu au niveau du cytoplasme (Kudou et al., 1991 ; Dixon et Paiva, 1995 ; Baggett et al., 2002). Le phénomène de glucosylation est une modification clef des métabolites secondaires des plantes avec différents sucres, améliorant leur solubilité et leur stabilité et facilitant aussi leur accumulation et leur stockage dans les cellules végétales (Jones et Vogt, 2001). Ces glucosylations représentent la première étape de conjugaison des isoflavones et sont catalysées par des Uridine diphosphate Glucosyltransférases (UGTs, GT) (Dixon et Sumner, 2003 ; Noguchi et al., 2007 ; Dhaubhadel et al., 2008). Les isoflavones glucosylées sont ensuite converties en leurs dérivés malonyles respectifs par des malonyltransférases (MT). La malonylation des isoflavones prévient la dégradation enzymatique des formes glucoconjuguées, change leur lipophilicité et agit comme 45 un signal de répartition des formes conjuguées dans des compartiments cellulaires spécifiques. Les formes malonylées et acétylées sont généralement considérées comme des formes de stockage s’accumulant dans la vacuole ou d’autres compartiments spécifiques servant de réservoir à précurseurs de biosynthèse ou à formes inactives de phytoalexines (Dixon et Steele, 1999 ; Suzuki et al., 2007 ; Dhaubhadel et al., 2008). Les enzymes représentées sont : IFS : 2-hydroxyisoflavanone synthase ; IF7GT : isoflavone 7-Oglucosyltransférase ; IF7MaT : isoflavone 7-O-malonyltransférase ; et le dimère GmICHG (en rouge) : βglucosidase hydrolysant les formes conjuguées d’isoflavones Figure 17 : Régulation enzymatique des formes conjuguées d’isoflavones chez le soja (Suzuki et al., 2006). Les pointillés indiquent les possibles voies de translocation des isoflavones depuis le cytoplasme, via la vacuole, jusqu’à l’apoplaste. Ces formes conjuguées sont ensuite excrétées de la cellule. On les retrouve au niveau des parois racinaires et des espaces intercellulaires où elles sont réactivées par des enzymes de type β-glucosidases (ICHG : Isoflavone Conjugate-Hydrolyzing β-glucosidase) (Suzuki et al., 2006). Cependant, les mécanismes de transport des formes conjuguées (mentionnés en pointillés sur la Figure 17) n’ont pas encore été complètement élucidés. 3.2 Etat des connaissances sur les mécanismes de transport des isoflavones Les isoflavonoïdes sont transportés et accumulés dans la vacuole pour atteindre des concentrations suffisantes afin d’assurer des avantages écologiques et physiologiques tout en évitant des effets toxiques pour la cellule. Le mécanisme de transport des isoflavonoïdes peut être comparé aux mécanismes de transport de xénobiotiques dont l’objectif est de détoxifier la cellule. 46 3.2.1 Les principales étapes du transport des isoflavones dans la cellule Les isoflavones aglycones sont synthétisées à la surface du réticulum endoplasmique (RE), par un complexe multienzymatique (Figure 18), via une série de réactions d’hydrolyses et d'oxydations. Elles sont alors désactivées par des glucosyltransférases (UGT) cytosoliques (par exemple UGTT73F2 chez le soja), qui forment les glucosides correspondantes (daidzine, génistine et glycitine). Elles subissent ensuite une malonylation en position 6’’ catalysée par des malonyltransférases (MT) cytosoliques (par exemple GmMT7 chez le soja), menant aux malonyl-glucosides correspondantes : 6’’-O-malonyl- daidzine, génistine, et glycitine. Vacuole Cytoplasme UGT MT lumen du Réticulum endoplasmique (1) Substrats isoflavones aglycones, (2) isoflavones glucosides, (3) isoflavones malonyl-glucosides Figure 18 : Principales étapes du transport des isoflavones chez le soja (Dhaubhadel et al., 2008) 3.2.2 Mise en évidence de leur transport vers la vacuole Les premiers travaux portant sur le transport de flavonoïdes vers la vacuole chez les légumineuses, ont suggéré l’implication de transporteurs secondaires appartenant à une famille de transporteurs tonoplastiques, the Multidrug et Toxin extrusion family (MATE). Une décoration glucosyl- de ces flavonoïdes s’est avérée nécessaire pour ce type de transporteur. Des MATEs potentiellement impliqués dans le transport d’anthocyanes et de proanthocyanidines ont en effet été identifiés chez Medicago truncatula (Peel et al., 2009 ; Zhao et Dixon, 2009). Plus récemment, un transporteur de type MATE, nommé MATE2 a été caractérisé (Zhao et al., 2011). Ce transporteur est exprimé dans différents tissus, notamment la graine en développement. Celui-ci présente un large spectre de substrats flavonoïdes, comme les anthocyanidines ou encore les isoflavones 7-O-glucosides ou les 7-O-malonyl47 glucosides. Cependant, MATE2 présente une plus grande affinité pour les substrats malonylglucosides (Farag et al., 2008). Ceci montre ainsi que la malonylation et la glucosylation des flavonoïdes ou isoflavonoïdes, facilite leur transport vers la vacuole, les formes aglycones n’étant pas prises en charge. Le transporteur MATE2 semble donc lié aux modifications cytosoliques des flavonoïdes (glucosylations et malonylations) pour le transport et le stockage des métabolites correspondants dans la vacuole. En revanche, le transport des formes conjuguées vers l’apoplaste reste encore à élucider. 3.3 Les principales familles d’enzymes intervenant dans la voie de biosynthèse des isoflavones Les différentes enzymes structurales de cette voie ont été largement étudiées avec différentes approches biochimiques et génétiques, à l’exception de quelques-unes intervenant dans la voie de biosynthèse de la glycitéine. Ces travaux ont ainsi permis une meilleure compréhension de la voie des isoflavones et des mécanismes catalytiques des enzymes individuelles, ouvrant aussi la voie à des applications en ingénierie métabolique. 3.3.1 La famille des lyases La première enzyme intervenant dans la voie de biosynthèse des phénylpropanoïdes, est la Phénylalanine Ammonia Lyase (PAL) qui appartient à la grande famille multigénique des enzymes de type lyases. On regroupe sous le nom de lyases les enzymes qui cassent des liaisons covalentes sans réaction oxydative ni hydrolyse. La PAL catalyse la désamination de la L-Phénylalanine en acide cinnamique, premier précurseur des phénylpropanoïdes, marquant ainsi le point de sortie du métabolisme primaire. C’est une enzyme soluble localisée dans le cytoplasme, qui peut être présente sous forme de complexe-multienzymatique avec d’autres enzymes de la voie des phénylpropanoïdes (Deshpande et al., 1993). À ce jour, deux gènes : PAL1 (Frank et Vodkin, 1991) et PAL2 (Wang et al., 2009) ont été isolés chez le soja. Le gène PAL1 s’exprime dans les différents tissus de la plante et son expression dans les racines augmente significativement après inoculation avec Bradyrhizobium japonicum (Pregelj et al., 2011). 48 3.3.2 Les polykétides synthases (PKS) Les polyketides synthases catalysent une addition répétitive de malonyl-CoA sur un accepteur CoA plus ou moins complexe (acetyl-CoA, feruloyl-CoA, caffeoyl-CoA, pcoumaroyl-CoA….). Cette réaction de condensation implique une série d’activités complémentaires : ketoacyl synthase (KS), acyl transférase (AT), ketoacyl réductase (KR), hydroxyacyl déshydratase (DH). Ce type de métabolisme est très proche de la réaction d’initiation et d’élongation des acides gras. En fait, les PKS ont probablement évolué à partir des FAS (fatty acid synthases). La différence essentielle étant qu’à la suite de chaque étape d’élongation, les FAS réduisent et déshydratent les cétones (kéto-carbones) alors que cette réaction n’est pas systématique chez les PKS. Ainsi, il reste des multiples possibilités de cyclisations qui permettent de générer une grande variété de composés. Les FAS sont divisées en différents types selon que les domaines d’activités (KS, AT, KR…) sont portés par plusieurs chaines intimement associées (Type I) ou une même chaine polypeptidique (Type II). Les PKS sont ainsi classées en 3 grands types : Les PKS de type I sont proches des FAS de type I, et les PKS de type II ont plus une structure multienzymatique qui indiquerait une évolution depuis les FAS de type II. Les PKS de type III sont plus simples : ce sont des homodimères de protéines multifonctionnelles présentant deux sites actifs indépendants. Leur structure plus simple les fait ressembler à la ketoacyl synthase III (KAS) responsable de la première condensation de la synthèse des acides gras (production de l’intermédiaire C4). La chalcone synthase est une PKS de type III (Austin et Noel, 2003 ; Flores-Sanchez et Verpoorte, 2009). La chalcone synthase (CHS) réalise la condensation séquentielle de trois molécules de malonyl-CoA et d’une molécule de p-coumaroyl-CoA pour former la naringénine chalcone (Yu et Jez, 2008), étape clef dans la voie de biosynthèse des flavonoïdes et des isoflavones (Figure 19). Ces enzymes sont des homodimères avec deux polypeptides de 42 KDa, contenant ainsi deux sites actifs indépendants (Ferrer et al., 1999). 49 Figure 19 : Réactions catalysées par la chalcone synthase (Halbwirth, 2010). La réduction par une chalcone réductase est spécifique des légumineuses et nécessite un type dédié de chalcone isomérase (CHI) capable d’accepter l’isoliquiritigénine. * Toutes les CHIs connues catalysent cette réaction, ** seulement des CHIs spécifiques catalysent cette réaction. La chalcone synthase est l’archétype des PKS de type III. Elle présente la structure caractéristique des PKS de type III (Figure 20). 50 Figure 20 : Structure tridimensionnelle de la Chalcone synthase – (a) et (b) Construction de l’homodimère et positionnment des sites actifs. Les deux sous-unités sont colorées respectivement en jaune et en bleu - (c) comparaison avec la KAS III : La structure typique αβαβα est mise en évidence avec les hélices α en jaune et les feuillets β en mauve. L’étoile marque la position de la cystéine impliquée dans le site actif (Austin et Noel, 2003) Depuis la première caractérisation de la CHS chez le persil en 1983, le nombre de séquences CHS-like a explosé. On en comptait déjà 620 en 2002 (Austin et Noel, 2003). Chez de nombreuses espèces où elles ont été étudiées, elles sont codées par une famille multigénique. Seize copies de gènes codant pour des CHS ont été identifiées chez Glycine max (Naoumkina et al., 2010). Cependant à l’heure actuelle seuls 9 homologues (CHS1 à CHS9) ont été clonés et séquencés (Clough et al., 2004 ; Matsumura et al., 2005 ; Tuteja et Vodkin, 2008 ; Tuteja et al., 2009). Cette famille de gènes présente une grande similarité de séquences nucléotidiques dans les régions codantes, variant de 80 à 99% et joue un rôle important pendant le développement de la plante ou en réponse à des stimuli environnementaux (Shimizu et al., 1999 ; Zabala et al., 2006 ; Chen et al., 2009b ; Chen et al., 2011). Les différents homologues codant pour les CHS sont exprimés dans tous les tissus de la plante de soja mais à des niveaux différents selon les tissus considérés et les conditions 51 environnementales (Dhaubhadel et al., 2007 ; Gutierrez-Gonzalez et al., 2010a ; Chen et al., 2011). 3.3.3 Les cytochromes P450 Les cytochromes P450 (P450) sont une superfamille multigénique d’hémoprotéines présentant des activités enzymatiques très variées. Le nom de P450 découle de la capacité de ces hémoprotéines à absorber à 450nm (Omura et Sato, 1964). On trouve les cytochromes P450 chez la plupart des êtres vivants : archaebactéries, eubactéries, champignons filamenteux, animaux et plantes (Nelson, 1999). Les P450 ont des activités enzymatiques très variées telles que par exemple les oxygénations, N-oxydations, réductions, alkylations, déalkylations, désaminations oxydatives. 3.3.3.1 Structure, Fonction et Classification Ces enzymes P450 représentent l’élément majeur d’un système multienzymatique, dénommé « monooxygénase P450-dépendante ». Quel que soit le type de P450 eucaryote, l’architecture globale des enzymes est conservée (Werck-Reichhart et Feyereisen, 2000). Ces protéines sont composées d’une majorité d’hélices α (annotées de A à L) et de quelques feuillets β s’associant en deux domaines globulaires α et β. L'ancre membranaire présente sur les P450 eucaryotes est une hélice hydrophobe composée d’une vingtaine de résidus à l’extrémité N-terminale suivis de quelques résidus basiques qui la délimitent. Ils ont également une séquence consensus riche en proline (P-P-G-P-X-P-X-P) qui permet aux P450 de s’accoler à la membrane (Kemper, 2004). L’hème est situé au cœur de l’enzyme dans un environnement hydrophobe entre les hélices L et I (Hasemann et al., 1995). L’atome de fer forme une liaison thio-ester avec une cystéine de la séquence consensus F-XX-G-X-R-X-CX-G en amont de l’hélice L. L’hélice I, qui compose une partie du site actif, contient une autre séquence consensus (A/G-G-X-D/E-T-T/S) impliquée dans l’activation de l’oxygène. Les régions SRS (Substrate Recognition Site) permettent l’entrée et le positionnement du substrat à proximité de l’hème (Figure 21). 52 La protopophyrine IX (hème) est en orange, les sites de reconnaissance du substrat (SRS1–SRS6) sont en rouge et les hélices I et L coordonnées à l'hème sont en vert Figure 21 : Modèle d’une structure tertiaire de P450 monooxygénase d’après Urlacher et Eiben (2006) Les P450 catalysent l’incorporation directe d’un atome d’oxygène sur le substrat. L’autre atome de la molécule d’oxygène est réduit en H2O grâce à l’oxydation d’une molécule de NADPH [R-H + H+ + NADPH + O2 R-OH + H2O + NADP+]. L’ensemble de ce processus catalytique se déroule selon une cascade d’évènements conduisant simultanément à la libération du produit et à la régénération de l’enzyme. Un même P450 peut donc enchainer plusieurs réactions enzymatiques sans interruption. La nomenclature des P450 est basée sur la comparaison de séquences peptidiques. Les P450 sont nommés à partir de la racine CYP (pour CYtochrome P450) suivi d’un chiffre pour la famille, une lettre désignant la sous famille, et un nombre désignant l’ordre chronologique de la découverte des gènes. Lorsque deux P450 présentent au moins 40% d’homologie de séquence, ils appartiennent à la même famille. Au-delà de 55% d’homologie, ils appartiennent à la même sous famille. Les séquences identiques à plus de 97 % sont considérées comme variants alléliques. Une base de données regroupant la majorité des P450 est désormais adoptée par la communauté scientifique. Elle permet un accès rapide aux données de tous les P450 clonés et/ou caractérisés (Nelson et al., 1996 ; Nelson, 1999 ; Nelson, 2009). 53 clan 71 Figure 22 : Arbre phylogénétique représentant chacune des 127 familles de P450 identifiées chez les plantes d’après Nelson et Werck-Reichhart (2011) Chez les plantes, les P450 sont regroupés en 127 familles elles-mêmes regroupées en 11 clans : 85,74, 710, 51, 727, 72, 746, 86, 97, 711, et 71 (Figure 22). Le clan est désigné par le plus petit numéro de la famille représentée (Nelson, 2011). Parmi ces 11 clans, le clan 71 est de loin le plus important. Les P450 se répartissent en 4 classes en fonction du mode de transfert des électrons (Werck-Reichhart et Feyereisen, 2000). C’est dans la classe II que l’on retrouve la majorité des P450 eucaryotes impliqués dans les réactions de biosynthèse des métabolites secondaires. C’est notamment le cas pour les trois enzymes : C4H, F6H et IFS intervenant dans la voie menant à la synthèse des isoflavones chez le soja. Ces P450 de classe II sont caractérisés par la présence de motifs caractéristiques des P450 transmembranaires : le domaine 54 transmembranaire lui-même, la charnière permettant d’articuler la partie cytosolique à son ancre et les trois sous-motifs caractéristiques du domaine globulaire (Steele et al., 1999). 3.3.3.2 Les P450 intervenant dans la synthèse des isoflavones La C4H : cinnamate 4-hydroxylase La cinnamate 4-hydroxylase est le P450 végétal le plus étudié à ce jour. L’activité C4H a été décrite à la fin des années 60, dans des pousses de Pisum sativum (Russell et Conn, 1967). Cette enzyme catalyse la conversion du cinnamate en p-coumarate, première réaction oxydative de la voie de biosynthèse des phénylpropanoïdes. Bien qu’elle ait une affinité nettement supérieure pour le cinnamate (Pierrel et al., 1994), la C4H peut accepter d’autres substrats, tels que des molécules planes, aromatiques, de petite taille possédant un site anionique à l’opposé du site d’hydroxylation, et pouvant présenter des groupements en ortho et meta (Chen et al., 2007). L’activité C4H a été détectée dans de très nombreuses plantes supérieures et toutes ces enzymes appartiennent à la famille des CYP73 contenue dans le clan 71 (Nelson et Werck-Reichhart, 2011). Les FH : flavonoïde – hydroxylases Les flavonoïdes hydroxylases exercent toutes des fonctions similaires en introduisant un hydroxyle à différentes positions sur les cycles A, B ou C des molécules flavonoïdes (Figure 7 page 29). Cependant, elles peuvent être soit des 2-oxoglutarate- dioxygénases - Fe(II) et ascorbate- dépendantes, soit des cytochromes P450 monooxygénases dépendantes (Halbwirth, 2010). Ainsi, la flavanone 3-hydroxylase (F3H ou FHT) qui dirige la voie vers la synthèse anthocyanes (Figure 15) est une 2-oxoglutarate- dioxygénase tandis que la flavanone 6hydroxylase (F6H) catalysant une hydroxylation en position 6 sur le cycle A est un cytochrome P450 (Latunde-Dada et al., 2001). La fonction F6H a été mise en évidence par l’expression hétérologue d’un cDNA (Genbank Y10490.1) isolé à partir de cellules élicitées de soja (Schopfer et Ebel, 1998). L’étude de la séquence a montré qu’il s’agissait d’un cytochrome P450 (Latunde-Dada et al., 2001). Cette enzyme a été classée dans le clan 71 sous la référence CYP71D9 (Nelson, 2009 ; Nelson et Werck-Reichhart, 2011). En catalysant l’hydroxylation en position 6 du cycle A de la liquiritigénine, la F6H permet la synthèse de l’intermédiaire flavanone de la glycitéine (6,7,4’-trihydroxyflavanone) (Latunde-Dada et al., 2001). La F6H est capable d’accepter plusieurs substrats flavanones. Cependant, l’enzyme étudiée par Latunde-Dada et al. (2001) présente une affinité plus élevée 55 pour la liquiritigénine que pour la naringénine dans la voie de biosynthèse des isoflavones chez le soja. L’IFS : isoflavone synthase L’isoflavone synthase (IFS) est en fait une 2-hydroxyisoflavanone synthase (2-HIS). Elle redirige les intermédiaires flavonoïdes vers la voie des isoflavonoïdes. De nombreux travaux ont permis d’identifier et de caractériser les gènes codant pour ces IFS. Ces gènes sont présents en faible nombre de copies dans les génomes des légumineuses (Sawada et al., 2002). L’IFS convertit les flavanones en isoflavanones par l’intermédiaire d’une migration aryl inhabituelle (Hashim et al., 1990). Ce mécanisme (Figure 23) implique l’abstraction d’un hydrogène en C3 suivi par la migration 1,2-aryl de C2 à C3, et la reliaison du radical hydroxy en C2 (Mizutani et Sato, 2011). Cette enzyme appartient à la sous-famille des CYP93C regroupées elles aussi dans le clan 71 (Nelson et Werck-Reichhart, 2011). Figure 23 : Mécanisme proposé pour la migration aryl catalysée par le CYP93C (IFS) : la migration aryl de la (2S)-flavanone pour former le produit 2-hydroxyisoflavanone d’après Mizutani et Sato (2011) Le premier gène codant pour une IFS a été caractérisé chez Glycine max, celui-ci pouvant convertir la naringénine (5,7,4’-trihydroxyflavanone) et la liquiritigénine (7,4’dihydroxyflavanone) en génistéine et daidzéine respectivement (Steele et al., 1999). Chez le soja, deux gènes : IFS1 et IFS2 ont été identifiées. Chacun contient un seul intron localisé à la même position à l’intérieur de la région codante, la jonction d’épissage se trouvant dans le codon 300. L’intron du gène IFS1 a une longueur de 218 pb et celui du gène IFS2 mesure 135 pb, ceux-ci ayant 46% de similarité de séquence (Jung et al., 2000). Les 2 gènes montrent de nombreuses régions homologues, 92,5% au niveau nucléotidique et 96,7% au niveau acides aminés. Les deux protéines IFS1 et IFS2 correspondantes ne diffèrent en effet l’une de l’autre que par 14 acides aminés (Dhaubhadel et al., 2003). 56 Chacun de ces gènes peut convertir les substrats flavanones en isoflavanones avec différentes efficacités. Des tests enzymatiques réalisés dans des microsomes de levure ont montré la capacité de ces deux gènes IFS1 et IFS2 à convertir la liquiritigénine et la naringénine en daidzéine et génistéine respectivement, et ce de façon NADPH-dépendante. Cependant, l’un comme l’autre sont plus efficaces dans la transformation de la liquiritigénine (Jung et al., 2000). L’intermédiaire putatif de la glycitéine serait quant à lui métabolisé en son isoflavanone correspondante par l’IFS2 (Latunde-Dada et al., 2001). Ajoutons cependant que cette équipe n’a pas testé la réaction avec l’IFS1. L’expression des gènes IFS1 et IFS2 chez le soja a été largement étudiée. Ceux-ci sont exprimés dans tous les tissus de la plante : les racines, les graines, les téguments, les germes, les fleurs, ou encore les feuilles (Subramanian et al., 2004 ; Kim et al., 2005b). Cependant, les quantités des transcrits IFS1 et IFS2 diffèrent selon les tissus mais aussi selon les conditions environnementales (Gutierrez-Gonzalez et al., 2010b). 3.3.4 Autres enzymes intervenant dans cette voie de biosynthèse 3.3.4.1 Les aldo-kéto- réductases (AKR) La chalcone réductase (CHR) appartient à la super famille des aldo-kéto-réductases (AKR) (Bomati et al., 2005 ; Wang, 2011). Ce type d’enzymes a seulement été identifié chez les légumineuses. Elles catalysent la réduction NAD(P) H-dépendante d’une grande variété de composés carbonyles. Au sein de la voie des flavonoïdes, la CHR catalyse la synthèse de l’isoliquiritigénine précurseur chalcone de la daidzéine et de la glycitéine. Elle constitue ainsi une étape cruciale dans la détermination du ratio génistéine vs daidzéine dans cette voie (Yu et al., 2000 ; Liu, 2009). Plusieurs travaux ont mis en évidence le rôle important des CHR dans les mécanismes de défense de la plante (Graham, 2005 ; Alkharouf et al., 2006). Lorsque le gène codant pour cette enzyme est éteint dans les racines de soja, de faibles quantités de daidzéine sont détectées alors que les quantités de génistéine sont augmentées. Ceci confirmant ainsi son rôle essentiel dans la détermination du ratio génistéine vs daidzéine (Graham et al., 2007). Ces enzymes CHR sont codées par une famille multigénique (Dixon et al., 2002). Sept copies de gènes codant pour des CHR ont été identifiées chez Medicago truncatula et 11 chez Glycine max (Naoumkina et al., 2010). Cependant, à l’heure actuelle, seuls deux d’entre eux ont été clonés et entièrement séquencés chez le soja (Welle et Grisebach, 1989 ; Liu, 2009). L’expression de ces gènes n’est pas trop variable selon les différents tissus de la plante. Ceux57 ci sont modérément voire faiblement exprimés dans tous les tissus, notamment la graine à différents stades de développement (Liu, 2009 ; Chen et al., 2011). 3.3.4.2 Les chalcone isomérases (CHI) Les chalcone isomérases sont des enzymes stables, stéréospécifiques, qui accélèrent considérablement la cyclisation des chalcones. Dans la voie de biosynthèse des flavonoïdes elles catalysent la cyclisation intramoléculaire des chalcones bicycliques : naringénine chalcone et isoliquiritigénine, en leur 2S-flavanones tricycliques : naringénine et liquiritigénine respectivement (Jez et Noel, 2002). L’analyse structurale de ces enzymes a permis de mettre en évidence une liaison hydrogène entre le site actif et son substrat qui s’avère être cruciale pour leur activité catalytique (Jez et al., 2002 ; Hur et al., 2004). Ces enzymes ont été regroupées en classe I et classe II en fonction de leur spécificité de substrat. Les gènes codant pour ces enzymes ont été clonés et isolés chez différentes espèces dont le soja (Ralston et al., 2005). Les gènes codant pour les CHI de classe II sont probablement ceux impliqués dans la voie de biosynthèse des isoflavones. Les CHI de classe I peuvent seulement isomériser la naringénine chalcone en naringénine alors que les CHI de classe II acceptent à la fois la naringénine chalcone et l’isoliquiritigénine pour les convertir en naringénine et liquiritigénine respectivement (Kimura et al., 2001 ; Ralston et al., 2005). Chez les légumineuses, la séquence en acides aminés d’un même type de CHI montre une similarité de séquence supérieure à 70%, alors que le pourcentage de similarité entre le type I et le type II n’est que de 50% (Shimada et al., 2003 ; Ralston et al., 2005). Figure 24 : Classification des chalcones isomérases – les Gma (Glycine max) sont les enzymes du soja correspondant aux CHI1A, CHI1B1, CHI1B2, CHI2, CHI3, CHI4A et CHI4B (Ralston et al., 2005) 58 Chez le soja, six gènes codant pour des CHI ont été isolés : CHI1A, CHI1B1, CHI1B2, appartenant à la classe II ainsi que CHI2 qui appartient à la classe I. Les gènes CHI3 et CHI4 ont été classés à part et ne semblent pas directement impliqués dans la conversion des chalcones (Figure 24). Tous ces gènes sont exprimés dans les différents tissus de la plante : feuilles, tiges, racines, fleurs, gousses et graines. Cependant, leurs profils d’expression sont très différents à travers les tissus et les variétés étudiés (Dhaubhadel et al., 2003 ; Ralston et al., 2005 ; Chen et al., 2011). 3.3.4.3 Les carboxylestérases L’enzyme qui réalise l’étape finale dans la biosynthèse des isoflavones est une 2hydroxyisoflavanone déshydratase (HID) appartenant à la grande famille des carboxylestérases. Elle catalyse la déshydratation de la 2-hydroxyisoflavanone en isoflavone. Cependant, l’instabilité de son substrat, rend sa purification et sa caractérisation difficile. L’analyse de l’activité de l’enzyme correspondante a montré que celle-ci pouvait à la fois convertir efficacement la 2,5,7,4’-tetrahydroxyisoflavanone et la 2,7,4’-trihydroxyisoflavanone pour donner de la génistéine et de la daidzéine respectivement. La production d’isoflavones par déshydratation spontanée des 2-hydroxyisoflavanones s’est avérée négligeable comparée à la réaction catalysée par la HID, montrant ainsi que la déshydratation menant à la formation des isoflavones est essentiellement enzyme dépendante (Akashi et al., 2005). Cette enzyme se montre également efficace dans la prise en charge des substrats méthoxy (Du et al., 2010). 3.3.5 Les enzymes de décoration des isoflavonoïdes 3.3.5.1 Les isoflavanone / isoflavone O-Methyltransférase (OMT) Les O-méthyltransférases (OMT) jouent un rôle important dans le métabolisme secondaire des plantes et constituent une large famille d’enzymes qui catalysent le transfert du groupement méthyle à un groupement hydroxyle spécifique (Ibrahim et al., 1998). Différentes OMT ont été clonées et caractérisées chez diverses plantes (Lam et al., 2007 ; Kim et al., 2008 ; Zhou et al., 2009) notamment chez le soja (Kim et al., 2005a ; Kim et al., 2006a ; Kim et al., 2009). Les OMT les plus étudiées sont celles qui utilisent les composés phénoliques comme substrats. Les O-méthylations qui ont lieu dans les voies de biosynthèses des flavonoïdes et des isoflavonoïdes ont un effet sur la solubilité et donc par conséquent sur l’activité antimicrobienne de ces composés. Elles engendrent la diminution de la réactivité 59 chimique de leur groupement hydroxyle phénolique et l’augmentation de leur activité microbienne. Dans la voie de biosynthèse des isoflavonoïdes, les isoflavanones-O-méthyltransférases (IOMT) identifiées chez différentes légumineuses sont abondantes. En effet, 17 gènes codant pour des IOMT ont été identifiés dans le génome de Glycine max et 11 gènes dans celui de Medicago truncatula (He et al., 1998 ; Deavours et al., 2006). Ces enzymes sont des méthyltransférases S-adénosyl-L-méthionine (SAM)-dépendantes. Deux types d’IOMTs sont à ce jour isolées (Zubieta et al., 2001 ; Liu et al., 2006). La première, isolée chez Medicago truncatula, est la 4’-hydroxyisoflavanone O-methyltransférase (4’HI-OMT). In vitro, elle est capable de méthyler en position 4’ ou en position 3, ce qui rappelle sa proximité avec la 3 I-OMT (PsHMM) identifiée chez le pois, responsable de la dernière étape de la biosynthèse de la pisatine (Deavours et al., 2006). La méthylation du groupement hydroxyle en C4’ de la naringénine ou de la liquiritigénine donne une 2-hydroxy-4’-méthoxyisoflavanone qui suivie d’une déshydratation donnera de la formononétine, intermédiaire essentiel à la synthèse de la médicarpine chez certaines légumineuses (Figure 25) (Akashi et al., 1999 ; Akashi et al., 2000 ; Akashi et al., 2003 ; Akashi et al., 2005). La co-localisation de cette 4’HI-OMT avec l’IFS associée au réticulum endoplasmique permet la méthylation très rapide de la 2,4’,7trihydroxyisoflavanone, intermédiaire réactionnel très instable produit par l’IFS. L’autre type d’IOMT connue est une 7-isoflavone O-methyltransférase (7 IOMT) isolée chez Medicago truncatula. Celle-ci est responsable de la 7-O-méthylation des isoflavones vers la formation de l’isoformononétine (7-O-méthyldaidzéine) dans la feuille de soja (Figure 25). Elle a également été identifiée chez Pisum sativum (pois chiche) où elle méthyle la génistéine en position 7 pour former de la prunetine (Edwards et Dixon, 1991 ; He et al., 1998). L’induction des transcrits codants pour la 7 I-OMT et l’activité enzymatique détectée après élicitation ou infection fongique chez Medicago sativa (luzerne) a permis de mettre en évidence son rôle dans la biosynthèse des phytoalexines (Edwards et Dixon, 1991 ; Akashi et al., 2000). 60 Figure 25 : Les IOMT intervenant dans la voie de biosynthèse des isoflavonoïdes chez les légumineuses Selon le schéma de substitution 6,7,4’- trihydroxylé trouvé dans la molécule de glycitéine chez le soja (Klus et Barz, 1995 ; Hirota et al., 2004) et dans la molécule d’afrormosine chez Medicago truncatula (Farag et al., 2008), une isoflavanone 6-Ométhyltransférase (6-IOMT) putative devrait intervenir après l’isoflavone synthase (IFS) (Figure 25) pour former l’intermédiaire méthylé de la glycitéine, dont la synthèse n’est pas encore totalement élucidée. Cependant, aucune fonction 6-IOMT n’a été caractérisée à ce jour chez les légumineuses. 3.3.5.2 Les glucosyltransférases et les malonyltransférases : menant aux formes conjuguées d’isoflavones Comme nous l’avons précédemment souligné, la conjugaison (glucosylation, malonylation) des formes aglycones d’isoflavones, nécessaire pour leur stockage et leur transport dans les cellules végétales, est réalisée par deux types d’enzymes (GT et MT). La conjugaison est également très importante pour le contrôle des interactions des légumineuses 61 avec leurs microorganismes symbiotiques et pathogènes, tout comme les effets diététiques des isoflavones sur la santé humaine. Les glucosyltransférases (GT) Les glucosylations sont catalysées par des Uridine diphosphate Glucosyltransférases (UGT) qui utilisent les sucres uridine diphosphates comme donneurs, catalysant le transfert du groupement glucosyle à des molécules acceptrices. Les GT jouent un rôle central dans la détermination de la diversité de structures des isoflavonoïdes et dans la régulation de leurs fonctions et de leurs activités. Les isoflavones sont toujours glucosylées en position 7, et plus occasionnellement en position 4’ pour les composés n’ayant pas de groupement 7-hydroxyle libre (Dixon et Sumner, 2003). Chez les légumineuses cette 7-O-glucosylation est la première étape de conjugaison des isoflavones qui est spécifiquement catalysée par une isoflavone 7-Oglucosyltransférase. Par exemple, les isoflavones prédominantes chez le soja sont la génistéine 7-Oglucoside, la daidzéine 7-O-glucoside et des formes malonyles conjuguées (Wang et Murphy, 1994a ; Fiechter et al., 2010). Les activités enzymatiques des isoflavones 7-Oglucosyltransférases (IF7GT) sont identifiées depuis une vingtaine d’années (Köster et Barz, 1981). Chez le soja, le premier ADNc codant pour une IF7GT (GmIF7GT) a été isolé à partir de racines (Noguchi et al., 2007). Plus récemment, le gène UGT73F2 codant pour une IF7GT a été isolé à partir de graines de soja par une approche de génomique fonctionnelle basée sur l’analyse d’ESTs (Expressed Sequence Tag) (Dhaubhadel et al., 2008) (Figure 26). Figure 26 : Les deux dernières étapes dans la biosynthèse des isoflavones conjuguées chez le soja d’après Dhaubhadel et al. (2008) Cette enzyme UGT73F2 est capable de glucosyler les formes aglycones, montrant une plus grande activité envers la génistéine et la glycitéine. Une analyse de localisation subcellulaire a également permis de montrer sa présence dans le cytoplasme. Cinq gènes codant pour des UGTs ont également été isolés chez Medicago truncatula et ont montré leur 62 capacité à convertir les isoflavones en leur forme 7-O-glucoside correspondante (Li et al., 2007 ; Modolo et al., 2007). Les malonyltransférases (MT) Chez les légumineuses, les isoflavones accumulées sont stockées sous forme de conjugués glucosides, ou malonyles (Kudou et al., 1991 ; Baggett et al., 2002). Faisant suite à la glucosylation dans la voie de biosynthèse, les isoflavones sont converties en leurs dérivés malonyles respectifs par des malonyltransférases (MT). La malonylation des isoflavones prévient la dégradation enzymatique des formes glucoconjuguées et permet leur stockage vacuolaire (Dixon et Steele, 1999). L’étape de malonylation des conjugués glucosides nécessite des acyltransférases acylCoA-dépendantes. L’implication des malonyl-CoA isoflavone 7-O-glucosides-6’’-Omalonyltransférases (IF7MaT) dans la voie de biosynthèse des isoflavones a été caractérisée pour la première fois chez le pois-chiche. La caractérisation moléculaire du gène codant pour une isoflavone 7-O-malonyltransférase et de l’enzyme correspondante chez le soja a été réalisée à travers l’isolement du cDNA complet : GmIF7MaT (AB291058) à partir de racines (Suzuki et al., 2007) et GmMT7 (EU192928) à partir de graines (Dhaubhadel et al., 2008), (Figure 26). Ce gène montre une grande activité de malonylation envers les isoflavones glucosides présentes chez le soja. Au total, deux gènes sont présents sur le génome du soja et sont situés sur les chromosomes 13 et 19. L’accumulation du transcrit GmMT7 est plus prononcée dans les embryons pendant leur développement que dans les autres tissus (Dhaubhadel et al., 2008). Les travaux de Dhaubhadel et al. (2008) réalisés à partir de graines de soja, permettent ainsi de mettre en évidence l’action combinée de ces deux types d’enzymes : glucosyltransférase (UGT) et malonyltransférase (MT), permettant la synthèse des formes conjuguées d’isoflavones à partir des formes aglycones chez le soja (Figure 26). Les deux transcrits correspondants UGT73F2 et GmMT7 sont très abondants dans les graines en développement ce qui corrobore parfaitement l’accumulation des isoflavones de soja, qui a été montrée comme étant la plus élevée dans des embryons matures en comparaison avec d’autres tissus (Dhaubhadel et al., 2003 ; Dhaubhadel et al., 2007). 63 3.4 Localisation et organisation subcellulaire des enzymes intervenant dans la voie de biosynthèse des isoflavones Des travaux de localisation subcellulaire des différentes enzymes clefs de la voie de biosynthèse des isoflavones ont permis la compréhension de l’organisation spatiale de la voie de biosynthèse des isoflavones. En effet, les différentes enzymes de la voie des phénylpropanoïdes (PAL, 4CL) ainsi que celles de la voie des flavonoïdes (CHS, CHR, CHI) impliquées dans la synthèse des isoflavones chez le soja sont co-localisées avec les cytochromes P450 : C4H et IFS ancrés dans la membrane du RE, pour former une structure multienzymatique fonctionnelle (Winkel-Shirley, 1999) (Figure 27). Les enzymes représentées en rouge et bleu participent à différentes branches métaboliques alors que ceux représentés en violet sont spécifiques de la voie des isoflavones. PAL : Phénylalanine Ammonia Lyase – C4H : Cinnamate 4- Hydroxylase – 4CL : 4-Coumarate CoA-Ligase – CHS : Chalcone Synthase – CHI : Chalcone Isomérase – IFS : Isoflavone Synthase – HID : Hydroxyisoflavanone Déshydratase – IOMT : Isoflavone-O-Méthyltransférase. Figure 27 : Complexe multienzymatique et channeling dans la voie de biosynthèse des isoflavones d’après Winkel-Shirley (1999) Dans ces complexes, les différents intermédiaires métaboliques sont canalisés de manière privilégiée d’une enzyme à l’autre. Par conséquent, les sites actifs étant tous à proximité les uns des autres, une coopération enzymatique s’établit, permettant de réduire le temps de transport des intermédiaires et d’éviter leur dispersion dans le milieu cellulaire (Winkel-Shirley, 1999 ; Winkel-Shirley, 2001). On parle ainsi de phénomène de canalisation métabolique encore appelée : « channeling » permettant de concentrer les substrats sur les sites actifs. Par exemple chez le soja, la co-localisation de la 4’HI-OMT avec l’isoflavone synthase, de type CYP450, associée à la membrane du réticulum endoplasmique assure la méthylation rapide de la 2,4’,7-trihydroxyisoflavanone instable produite par l’IFS à partir de la liquiritigénine. Dans la voie des flavonoïdes, le « channeling », au point d’entrée dans la 64 voie de biosynthèse des isoflavonoïdes protège les intermédiaires instables d’une conversion métabolique non productive (Liu et Dixon, 2001). 4 LA REGULATION DE LA SYNTHESE DES ISOFLAVONES L’accumulation des isoflavones dans les différents tissus de la plante de soja ne coïncide pas toujours avec les taux de transcrits des gènes codant pour les différentes enzymes structurales de cette voie de biosynthèse. Ceci reflète donc les différents mécanismes de régulation probables intervenant dans cette voie. Cette régulation peut avoir lieu à différents niveaux : soit au niveau de l’expression de ces gènes (transcription), soit au niveau des différentes enzymes structurales, soit au niveau des interactions entre les protéines via la formation des complexes enzymatiques, ou encore au niveau de certains rétrocontrôles dus à un fort taux d’accumulation de métabolites. À ce jour, la régulation de la transcription est la plus étudiée. 4.1 La régulation de la transcription Chez les eucaryotes, l’expression d’un gène peut être constitutive ou au contraire régulée par différents facteurs intrinsèques et environnementaux. Chez les plantes, ces facteurs peuvent inclure le stade de développement ou un organe en particulier, les stress abiotiques ou encore les agents infectieux. Le contrôle transcriptionnel coordonné des gènes de biosynthèse émerge comme un mécanisme majeur dictant les quantités finales de métabolites secondaires dans les cellules végétales. En effet, la modification de l’expression d’un gène résulte d’une interaction entre le complexe de transcription basal comprenant l’ARN polymérase II, et différentes protéines « trans-régulatrices » appelées facteurs de transcription (FTs) codés par des gènes régulateurs. Les plantes dévouent environ 7% de la séquence codante de leur génome aux facteurs de transcription (FTs), ce qui atteste ainsi de l’importance et de la complexité de la régulation transcriptionnelle de ces organismes (Riechmann et Ratcliffe, 2000). La plante modèle Arabidopsis thaliana possède environ 1800 gènes codant pour des FTs, (Riechmann et al., 2000 ; Guo et al., 2005) mais à l’heure actuelle seulement 1/10ème de ceux-ci sont caractérisés génétiquement (Qu et Zhu, 2006). Le rôle des FTs dans les autres espèces de plantes, notamment les légumineuses, est moins connu. Le séquençage complet des génomes de Medicago truncatula ou de Glycine max ont permis une avancée considérable dans 65 l’identification des gènes codant pour ces FTs (environ 2000). Cependant, 1% seulement ont été caractérisés. Les familles de FTs sont généralement définies par leur type de domaine de liaison à l’ADN. Les gènes putatifs codant pour ces FTs ont été identifiés principalement sur la base de leur séquence d’ADN, contenant les motifs caractéristiques de ces domaines de liaison à l’ADN (Riechmann et al., 2000 ; Guo et al., 2005). Tableau 3 : Nombre de gènes codant pour des FTs impliqués dans la régulation de la synthèse des (iso)flavonoïdes chez Medicago truncatula, Lotus japonicus et Glycine max d’après Libault et al. (2009) Famille de FTs M. truncaluta L. japonicus G. max AP2-EREBP 109 159 381 bHLH 71 84 393 b-ZIP 44 38 176 C2C2(Zn)CO-like 15 21 72 C2H2(Zn) 52 56 395 HD-ZIP 2 1 7 HSF 16 18 11 MYB 171 191 791 NAC 64 101 208 WRKY 59 68 197 ZF-HD 13 18 54 ZIM 11 6 24 Le nombre de gènes codant pour chaque famille de FTs varie au sein d’une même espèce de légumineuses, mais également d’une espèce de légumineuse à l’autre (Tableau 3). Selon leur mode de régulation, ces FTs peuvent être classés en activateurs (Hermann et al., 2001 ; Qian et al., 2007) ou en inhibiteurs (répresseurs) de la transcription (Roberts, 2000 ; Paolocci et al., 2011). Les facteurs de transcriptions MYB et bHLH constituent respectivement la première et la deuxième famille les plus importantes chez les plantes. La particularité des protéines MYB est la présence d’un domaine « MYB » conservé en N-terminal qui va permettre la fixation à l’ADN. Celui-ci se caractérise par deux (R2R3), trois (R1R2R3), ou plus rarement une seule (R1) répétition(s) imparfaite(s) d’environ 50 à 53 66 acides aminés (Du et al., 2009). Selon leurs propriétés de liaison à l’ADN (MBS, MYB Binding Site), les facteurs de transcription MYB de plantes sont subdivisés en 3 groupes A, B et C. Le groupe C se lie préférentiellement à la séquence consensus MBSIIG : T/CACCA/TAC/AC et regroupe la majorité des protéines MYB de plantes. Cette classification n’est pas absolue, car certaines protéines MYB présentent une grande flexibilité dans la reconnaissance d’éléments cis-régulateurs cibles (Romero et al., 1998 ; Jin et Martin, 1999). Cependant, les FTs MYB appartenant à différentes espèces et régulant la même voie comme par exemple celle des flavonoïdes, semblent lier le même motif (Akagi et al., 2009). Pour leur fixation à l’ADN, les protéines bHLH, encore connues sous le nom de MYC, contiennent quant à elles le domaine bHLH qui est typiquement formé d’une soixantaine d’acides aminés. Les bHLH se fixent en majorité sur une séquence consensus hexanucléotidique de type 5’-CANNTG-3’ appelée E box. La séquence palindromique dérivée, G box 5’-CACGTG-3’ est l’élément cis- régulateur le plus fréquemment reconnu par les protéines bHLH (Li et al., 2006 ; Hichri et al., 2011) Le mécanisme de régulation transcriptionnelle de la voie de biosynthèse des flavonoïdes, plus particulièrement des anthocyanes, est largement étudié chez Arabidopsis thaliana (Dubos et al., 2008). Un certain nombre de gènes de régulation de cette voie, spécialement ceux codant pour des facteurs de transcription de type MYB et bHLH ont ainsi été mis en évidence chez les légumineuses (Tableau 4). La plupart des facteurs MYB caractérisés sont des régulateurs positifs de la transcription. Les données de caractérisation des FTs bHLH restent cependant très minimes chez ces dernières. En revanche, la régulation transcriptionnelle de la voie de biosynthèse des isoflavonoïdes est encore très peu comprise. Les FTs endogènes aux légumineuses réalisant spécifiquement le contrôle de la synthèse des isoflavones dans la graine, ne sont effectivement que très peu connus, un seul : GmMYB176 ayant été identifié à ce jour chez Glycine max (Yi et al., 2010b). 67 Tableau 4: Les facteurs de tanscription MYB et bHLH impliqués dans la régulation des (iso)flavonoïdes chez les légumineuses Nom du FT Famille du FT Rôle proposé Espèce Référence G.max Yang et al. (2009) G.max Shimizu et al. (2000) L.japonicus Miyake et al. (2003) G.max Miyake et al. (2003) ACTIVATEURS TRANSCRIPTIONNELS GmMYBJ6 R2R3-MYB GmMYB29A1 R2R3-MYB LjMYB101 R2R3-MYB GmMYB101 R2R3-MYB synthèse phénylpropanoïdes et flavonoïdes synthèse flavonoïdes (induction UV) synthèse (iso)flavonoïdes en réponse à un stress abiotique synthèse (iso)flavonoïdes en réponse à un stress abiotique MtMYB634 MtMYB636 R2R3-MYB synthèse métabolites secondaires de défense, stress abiotique M.truncatula Gruber et al. (2009) ; Sanchez et al. (2008) MtLAP1 R2R3-MYB synthèse anthocyanes, (iso)flavonoïdes, glycosylation M.truncatula Peel et al. (2009) GmMYB176 R1-MYB synthèse isoflavones G.max Yi et al. (2010) PsGBF bHLH synthèse flavonoïdes, défense pathogène P.sativum Qian et al. (2007) bHLH bHLH stress abiotique G.soja Ge et al. (2011) MtbHLH bHLH élicitation M. truncatula Naoumkina et al. (2008) synthèse flavonoïdes G.max Du et al. (2009) MtMYB119 MtMYB1070 REPRESSEURS TRANSCRIPTIONNELS GmMYBZ2 R2R3-MYB Cependant, des études moléculaires et transcriptomiques ou encore des expressions ectopiques de certains gènes régulateurs identifiés intervenant dans des branches parallèles de cette voie, permettent d’émettre des hypothèses quant aux rôles potentiels de certains facteurs de transcription sur la synthèse de ces composés. 4.1.1 Régulation de l’expression dans les différents tissus et selon les stades de développement de la plante Le gène PAL1 qui ouvre la voie des phénylpropanoïdes s’exprime dans les racines, les feuilles, les nodules, les germes ainsi que dans les graines en développement (Pregelj et al., 2011). Le gène CHS1 est fortement exprimé dans les feuilles et les racines. C’est aussi le cas pour CHS7 et CHS8, en revanche ceux-ci sont également fortement exprimés dans la graine. L’expression des gènes CHS3 et CHS6 est faible à modérée dans les racines, les feuilles, les téguments et les cotylédons alors que l’expression de CHS4 est très faible dans tous les tissus 68 (Tuteja et al., 2004 ; Chen et al., 2011). Récemment, l’expression des gènes CHS7 et CHS8 a été reliée à l’accumulation des isoflavones dans la graine de soja (Gutierrez-Gonzalez et al., 2010a ; Yi et al., 2010a). La quantité d’isoflavones dans la graine pourrait donc être la résultante d’une expression différentielle de CHS7 et CHS8 pendant les stades tardifs de développement de la graine (Dhaubhadel et al., 2007). Généralement, l’expression relative des six gènes CHI est la plus élevée dans les feuilles (Dhaubhadel et al., 2003 ; Ralston et al., 2005 ; Chen et al., 2011). Cependant, les résultats obtenus pour les profils d’expression de ces gènes dans les autres tissus de la plante de soja sont quelque peu divergents. En effet, les deux gènes CHI1A et CHI1B2 sont plus fortement exprimés dans les racines et les graines que dans les tissus floraux. Les profils d’expression de ces deux gènes codant pour des CHI de classe II permettent de mettre en évidence que leur expression est en adéquation avec l’accumulation des isoflavones dans la graine (Ralston et al., 2005). Chen et al. (2011) soulignent également que le gène CHI3 présente la plus forte expression relative dans la graine au stade de développement R5 en comparaison avec les autres tissus de la plante, son expression étant cependant la plus faible de tous les gènes CHI étudiés (vs CHI1A, CHI1B1/B2, CHI2, et CHI4). Les gènes CHI1B1/B2 sont quant à eux fortement exprimés dans les racines alors que leur expression n’est qu’à peine au-dessus de la limite de détection dans la graine (Chen et al., 2011). Les gènes IFS1 et IFS2 sont faiblement exprimés dans les fleurs et les feuilles, alors qu’ils le sont fortement dans les racines et les graines (Gutierrez-Gonzalez et al., 2010a ; Pregelj et al., 2011). Néanmoins, leur expression dans les graines est dix fois moindre que celle détectée dans les racines (Subramanian et al., 2004). On note un maximum d’expression pour IFS1 dans les racines, alors qu’IFS2 est plus exprimé dans la graine (Dhaubhadel et al., 2003). L’expression de ces différents gènes se montre également très contrastée en fonction du stade de développement de la graine. Le stade ayant le maximum d’expression observée dépend du gène étudié (Gutierrez-Gonzalez et al., 2010a). C’est notamment le cas des deux gènes IFS1 et IFS2 qui sont tous deux plus exprimés dans les stades tardifs (R7-R8), excepté les stades très tardifs (R8) où la graine est dure et où leur taux diminue (Gutierrez-Gonzalez et al., 2010a). Une étude souligne aussi que l’expression de ces différents gènes varie entre les différents tissus de la plante pour un même stade de développement R5. En effet, les taux relatifs de transcrits sont en moyenne 8,6 fois plus élevés dans feuilles que dans les graines au stade de remplissage R5 (Chen et al., 2011). 69 Quelques facteurs de transcription MYB régulant spatio-temporellement certains gènes codant pour les enzymes structurales de la voie de biosynthèse des (iso)flavonoïdes chez les légumineuses ont été mis en évidence. La plupart d’entre eux sont des régulateurs positifs de ces différents gènes. Chez le soja, le FT GmMYBJ6, contrôle la voie de biosynthèse des phénylpropanoïdes et des flavonoïdes, en activant positivement l’expression des gènes PAL, C4H, 4CL, CHS et CHI. La surexpression de GmMYBJ6 (DQ902863) chez le tabac, résulte en effet en une augmentation des quantités totales de flavonoïdes (Yang et al., 2009). Chez Medicago truncatula, l’expression du gène MtLAP1 (FJ199998), codant pour un FT R2R3 MYB, nommé LAP1, induit la production constitutive de certains flavonoïdes tels que les anthocyanes. C’est également le cas lorsque celui-ci est exprimé chez Medicago sativa ou Trifolium repens (Peel et al., 2009). Sous l’effet de LAP1 de nombreux gènes codant notamment pour les enzymes PAL, C4H, 4CL, CHS, CHI et UGT, sont induits. L’expression du gène UGT78G1 (TC105632) codant pour une UGT chez M. truncatula est augmentée quant à elle d’environ 140 fois. Ceci laisse donc à penser que LAP1 pourrait être un activateur potentiel de l’UGT intervenant dans la biosynthèse des isoflavones chez le soja. Une étude, réalisée chez le soja permet de mettre en évidence le premier FT de type R1MYB : GmMYB176, directement impliqué dans la régulation positive de la voie de biosynthèse des isoflavones (Yi et al., 2010b). En effet, le domaine R1 présent sur GmMYB176 montre une forte homologie avec les domaines R1 de FTs MYB de plusieurs espèces de plantes et inclue un motif SHAQKYF dans la troisième hélice α. Dans cette étude, la présence de 12 motifs avec la séquence cœur TAGT (T/A) (A/T), parmi les 1662 pb du promoteur CHS8, est soulignée. Des analyses de délétions du promoteur et de co-transfection, démontrent cependant la nécessité d’un seul motif (23pb), localisé entre les bases -795 et 818, pour l’activité du gène CHS8, les délétions des autres motifs présents n’ayant pas d’effet sur l’activité de ce dernier. Cette interaction de R1MYB avec l’élément cis spécifique présent dans le promoteur de CHS8, permet en effet d’établir la base fonctionnelle dans l’activation transcriptionnelle de CHS8. L’analyse quantitative de GmMYB176 dans les différents tissus indique qu’il est ubiquitairement exprimé dans tous les tissus accumulant des isoflavones mais que les niveaux et les temps d’expression varient pendant le développement. Tenant compte de l’hypothèse que l’expression d’un régulateur précède l’expression de son gène cible, le profil d’expression de GmMYB176 corrobore bien l’accumulation des transcrits CHS8 dans la graine de soja. 70 Ainsi, comme l’accumulation des isoflavones dans la graine de soja résulte de la synthèse, ceci permet d’émettre l’hypothèse que le taux de transcrits des gènes de biosynthèse des isoflavones et de leurs régulateurs pourrait refléter la capacité de synthèse des métabolites plutôt que les quantités de leur accumulation dans les différents tissus (Yi et al., 2010b). Même si la plupart des MYB identifiés sont des activateurs de la transcription des gènes cibles, tous ne fonctionnent pas ainsi, puisque certains répresseurs de la transcription ont été caractérisés. Chez le soja, un seul a été isolé et identifié (Du et al., 2009). Il s’agit du gène GmMYBZ2 (DQ902861). Des mutants KO pour ce gène ont permis de mettre en évidence son rôle dans la régulation. Celui-ci réprime en effet l’expression de certains gènes de la voie des flavonoïdes. 4.1.2 Effet des facteurs abiotiques et biotiques L’expression des gènes codant pour les enzymes centrales de cette voie de biosynthèse des isoflavones peut se trouver considérablement affectée par les facteurs environnementaux (Gutierrez-Gonzalez et al., 2010a), par le statut azoté et/ou le statut de nodulation de la plante (Ralston et al., 2005) mais aussi par des stress biotiques. 4.1.2.1 La lumière et la température Le métabolisme des isoflavonoïdes est particulièrement sensible à l’action des facteurs externes comme la lumière et la température. Concernant le facteur lumière, deux paramètres interviennent : d’une part l’intensité du flux lumineux et d’autre part la nature des radiations constitutives. La lumière agit directement par l’intermédiaire des radiations rouges, bleues et UV qui sont perçues par différents photorécepteurs dont le phytochrome et différents récepteurs aux UVA et aux UVB (Schäfer et al., 1997). L’action de la lumière porte sur l’induction de la synthèse de plusieurs enzymes du métabolisme des isoflavonoïdes et tout particulièrement de la PAL et de la C4H, qui ont été très étudiées à ce point de vue (Dixon et Paiva, 1995). Dans ce cas, l’effet de la lumière est d’activer par exemple les gènes PAL, ce qui conduit à la transcription des ARNm puis à la formation de la protéine enzymatique (Figure 28) (Hahlbrock, 1981). Un effet similaire mais légèrement décalé dans le temps est obtenu avec la CHS et les autres enzymes du métabolisme des flavonoïdes, conduisant alors à l’accumulation de ces composés. L’état d’oxydoréduction de la cellule et en particulier sa teneur en glutathion joue un rôle important dans la mise en place de la voie de transduction intracellulaire depuis la perception du signal lumineux jusqu’à l’expression du gène CHS (Loyall et al., 2000). 71 Un FT GmMYB29A1 régulant positivement la synthèse des flavonoïdes, principalement en contrôlant l’expression des gènes codant pour les CHS a été mis en évidence en réponse à une exposition UV chez le soja (Shimizu et al., 2000). Figure 28 : Influence de la lumière sur les ARNm de la PAL (mPAL), sur les activités des enzymes PAL et CHS et sur la teneur en flavonoïdes de suspensions cellulaires de persil d’après Hahlbrock (1981) Le GMP cyclique (GMPc : guanosine monophosphate cyclique intracellulaire) est une importante molécule de signalisation agissant comme un second messager chez tous les eucaryotes (Newton et Smith, 2004). Son implication fonctionnelle dans de nombreux processus physiologiques chez les végétaux supérieurs comme par exemple la transduction du signal lumineux a été étudiée (Neuhaus et al., 1997). Une récente étude permet de mettre en évidence l’implication de ce dernier dans le contrôle du métabolisme des isoflavonoïdes à travers la régulation des différentes enzymes centrales constituant cette voie de biosynthèse (PAL, C4H, 4CL, CHS, CHR, CHI, IFS,GT) chez le soja (Suita et al., 2009). L’expression de tous les gènes étudiés est en effet fortement stimulée dans les cellules de soja traitées avec le GMPc. La température est également un facteur de régulation du métabolisme des isoflavonoïdes. La régulation intervient au niveau de la PAL et de la CHS. Les activités enzymatiques de ces deux enzymes augmentent quand la température diminue, et inversement (Campos-Vargas et al., 2005 ; Posmyk et al., 2005). 72 4.1.2.2 Disponibilité en eau – stress hydrique L’effet d’un déficit hydrique sur la régulation transcriptionnelle du métabolisme des isoflavonoïdes vient d’être étudié à partir de graines de soja à différents stades de développement (Gutierrez-Gonzalez et al., 2010a). Ce stress hydrique imposé tend en effet à sous-réguler l’expression des gènes impliqués dans la biosynthèse des isoflavones. Parmi les transcrits suivis codant pour les enzymes centrales de cette voie (PAL, CHS, CHR, CHI, IFS), seule l’accumulation des transcrits codant pour la première enzyme PAL de cette voie augmente immédiatement après un stress hydrique sévère, supportant ainsi l’hypothèse que les graines nécessitent une plus longue période pour ajuster leur contenu en isoflavones en cas de stress. En revanche, l’accumulation des autres transcrits diminue lors de ce stress hydrique. L’accumulation des transcrits CHR est diminuée par trois en comparaison avec celle obtenue en cas de bonne condition d’irrigation, ceci suggérant aussi qu’en condition de stress le flux est dirigé du côté de la naringénine. L’expression du gène IFS2 dans les graines est fortement diminuée en condition de stress hydrique alors qu’au contraire l’expression d’IFS1 reste constante. Cependant, l’expression de ce gène IFS2 se montre parfaitement corrélée à la teneur en isoflavones dans les graines au cours de leur développement et ce, quelles que soient les conditions d’irrigation. Ceci suggère ainsi qu’IFS2 serait l’un des principaux gènes responsables de la différence d’accumulation des quantités d’isoflavones dans la graine quelles que soient les conditions d’irrigation (GutierrezGonzalez et al., 2010a). 4.1.2.3 Les interactions plantes-microorganismes L’expression des gènes codant pour les enzymes centrales de cette voie de biosynthèse des isoflavones peut se trouver considérablement affectée par le statut azoté et/ou le statut de nodulation de la plante (Ralston et al., 2005), mais également lors d’une infection par un pathogène. La plante sécrète via ses racines des composés qui vont lui permettre d’interagir avec la microflore du sol. Parmi ces composés il y a les flavonoïdes qui sont les plus grands inducteurs de l’expression des gènes bactériens nécessaires pour la nodulation (Broughton et al., 2000 ; Zhang et al., 2009). Les isoflavones jouent aussi un rôle dans les défenses de la plante en condition de stress biotique (Bednarek et Osbourn, 2009 ; Feng et al., 2010). Les isoflavones, sont en effet des phytoalexines qui sont rapidement synthétisées lors d’un envahissement par des pathogènes viraux, bactériens et fongiques ou par des ravageurs 73 (Dixon et al., 1995 ; Naoumkina et al., 2007) et qui contribuent à limiter l’extension des infections causées dans les plantes (Bent, 2011). L’apport d’un microorganisme pathogène ou de l’éliciteur qu’il produit peut être utilisé pour stimuler la production d’isoflavonoïdes par la plante. D’une manière générale, l’infection par un microorganisme ou l’apport d’un éliciteur d’origine biologique dans des suspensions cellulaires végétales est très efficace pour déclencher la synthèse des enzymes du métabolisme des flavonoïdes, comme par exemple la PAL, la C4H, la CHS (Ryder et al., 1987 ; Liang et al., 1989 ; Dalkin et al., 1990 ; Ni et al., 1996). L’accumulation des ARNms C4H dans des cellules soumises à un stress biotique (Mizutani et al., 1997) montre que la régulation de cette activité est essentiellement de nature transcriptionnelle (Weisshaar et Jenkins, 1998). L’expression du gène PAL1 augmente significativement après inoculation avec B. japonicum. Elle est, en effet, significativement 8 fois plus importante dans les racines de plantes inoculées que dans celles de plantes non-inoculées. En revanche aucune différence significative n’est constatée dans les germes (Pregelj et al., 2011). Les gènes codant pour les CHI sont différemment régulés après un traitement éliciteur (Shimada et al., 2003). Les CHI de classe I sont régulées de façon coordonnée avec les autres enzymes de la voie de biosynthèse des flavonoïdes, comme par exemple F3H, et sont surtout exprimées dans les tissus floraux qui ne répondent pas à l’inoculation par Bradyrhizobium. Au contraire, les CHI de classe II sont régulées de façon coordonnée avec les autres enzymes de la voie de biosynthèse des isoflavonoïdes chez le soja, comme par exemple les IFS, pendant le développement de la plante et les interactions plantes-microorganismes (Ralston et al., 2005 ; Chen et al., 2009a). L’expression des deux gènes CHI1A et CHI1B2 est fortement induite par les signaux de la nodulation dans les racines (Ralston et al., 2005). Chez Lotus japonicus, trois gènes codant pour des FTs R2R3 MYB: LjMYB101, LjMYB102, LjMYB103 ainsi que le candidat orthologue à LjMYB101 chez le soja, nommé GmMYB101, ont été isolés en réponse à une carence en nutriments azotés. Lors d’une telle carence, les profils d’expressions des deux gènes LjMYB101 et GmMYB101 sont similaires à celui de CHS au niveau des racines. Ils sont en effet, tous régulés à la hausse et ce, de manière dose-dépendante. Ceci suggère donc le rôle potentiel des FTs MYB101 dans la régulation de la synthèse des isoflavonoïdes en réponse à un stress abiotique (Miyake et al., 2003). Une étude réalisée chez le pois en condition d’élicitation a permis d’élucider le mécanisme de régulation de la box G au niveau du promoteur du gène PsCHS1 et de caractériser son facteur de transcription (Qian et al., 2007). Cette box G est également 74 retrouvée dans les promoteurs de la PAL et d’autres gènes induits de défense (Arias et al., 1993 ; Hatton et al., 1995). L’ADNc complet PsGBF (Pisum sativum G-box Binding Factor) obtenu présente une forte homologie de séquence avec la protéine de liaison à la box G (PG1) de la phaséoline. Il appartient ainsi à la famille des FTs bHLH. Des essais d’expression transitoire dans des feuilles de tabac indiquent que l’activation du gène PsCHS1 se fait via la liaison avec l’élément cis régulatoire de la box G. La combinaison des éléments cis de la box I (TCTACCTACCC) et de la box G (CACGTG) pour l’interaction avec PsGBF et la stimulation du promoteur PsCHS1 est également mise en évidence. Cependant seule l’interaction directe entre PsGBF et la box G a lieu. On parle ainsi de coordination box spécifique (Qian et al., 2007). L’accumulation des transcrits PsGBF précède dans le temps celle de PsCHS1, ce qui souligne ainsi le mécanisme de régulation transcriptionnelle du gène CHS1 chez le pois: PsGBF interagit d’abord avec le promoteur PsCHS1 et active en suivant l’expression du gène PsCHS1 en condition d’élicitation. Le facteur de transcription PsGBF participe donc à la régulation des flavonoïdes chez les légumineuses et joue un rôle important dans les interactions plantes-pathogènes (Qian et al., 2007). 4.2 La régulation post-transcriptionnelle Certains gènes codant pour des enzymes structurales de cette voie de biosynthèse sont sujets à des contrôles post-transcriptionnels, mais cela n’a été étudié que pour très peu de gènes. L’expression spatiale des gènes UGT73F2 et GmMT7, codant respectivement pour deux transférases impliquées dans la glucosylation et malonylation des isoflavones de soja et des protéines correspondantes a été étudiée (Dhaubhadel et al., 2008). L’expression des transcrits ne corrèle pas toujours avec l’accumulation des protéines. En effet, les transcrits UGT73F2 sont exprimés dans les gousses, l’embryon en développement et les fleurs. Cependant, la protéine correspondante qui s’accumule également dans les gousses et l’embryon ne s’accumule pas dans les fleurs. Les transcrits GmMT7, quant à eux, sont exprimés dans la plupart des tissus mais leur expression est plus forte dans les embryons en développement et les fleurs. En revanche, la protéine correspondante GmMT7 ne s’accumule pas dans les fleurs (Dhaubhadel et al., 2008). Ces résultats suggèrent donc l’intervention d’une régulation posttranscriptionnelle tissu-spécifique de ces deux enzymes. 75 La régulation post-traductionnelle implique l’activation et l’inactivation des enzymes (en général par phosphorylation) et semble être présente dans cette voie de biosynthèse, bien que son importance générale ne soit pas encore bien comprise. Un tel mécanisme a été montré pour la PAL qui peut être régulée à travers une phosphorylation par une protéine kinase calcium dépendante (CDKP). Sur culture de cellules de Phaseolus vulgaris (haricot) élicitées, la stimulation des protéines kinases peut mener à une phosphorylation accrue et à un turnover de la PAL (Allwood et al., 1999). Très peu de données sur la régulation traductionnelle des différentes enzymes structurales de la voie de biosynthèse des isoflavones sont ainsi disponibles. Un point ultime de la régulation de la synthèse des isoflavones pourrait avoir lieu au niveau du contrôle et de la formation des complexes multienzymatiques (métabolon). Ces complexes sont encore peu connus et d’autant plus difficiles à étudier qu’ils sont instables, voire transitoires. Leur étude implique une méthodologie assez lourde. L’existence d’un complexe spécifique de la synthèse de flavonoïdes a ainsi récemment été démontrée in vivo chez Arabidopsis (Crosby et al., 2011) grâce à la microscopie FRET (Fluorescence Resonance Energy Transfert) qui permet de détecter les variations de fluorescence induites par des interactions entre protéines. L’organisation en « métabolons » permettrait d’optimiser et de contrôler les concentrations des enzymes et de leurs substrats dans des voies de biosynthèse où on trouve de nombreux points de compétition pour des métabolites clefs (par exemple pour la naringénine). Le positionnement des enzymes dans les complexes contrôlerait l’orientation préférentielle des flux (Winkel, 2004). La plupart de ces enzymes peuvent accepter une gamme assez large de substrats. Ainsi, une simple modification de positionnement de l’enzyme dans le complexe peut avoir de grandes conséquences dans la voie (Jorgensen et al., 2005). Il a ainsi été montré chez Nicotiana tabacum (tabac) que deux isoformes de la PAL (PAL1 et PAL2) pouvaient interagir différemment avec la C4H, ce qui impliquerait un rôle spécifique des isoformes dans la construction du complexe, et donc dans son efficience ou dans les produits formés (Winkel, 2004). De même, la réduction de la naringénine chalcone en isoliquiritigénine par la CHR nécessite une association intime entre les deux enzymes car elle a probablement lieu avant la fermeture du cycle A. Le site actif de la CHS étant caché, les intermédiaires CoA doivent diffuser entre les deux enzymes et selon leur positionnement, la proportion de composés réduits ou non pourrait varier (Austin et Noël, 2003). La fonction 76 CHR est en fait à rapprocher de la fonction kétoacyl réductase trouvée lors de la synthèse des acides gras. Les complexes FAS (Fatty Acid Synthase) de type I, réunissant de façon très structurée un ensemble d’enzymes complémentaires peuvent être considérés comme une forme particulièrement aboutie des complexes multienzymatiques (Winkel, 2004). Les FAS sont d’ailleurs probablement les ancêtres des CHS. De même, la polyvalence de certaines enzymes observées in vitro ne reflète pas toujours leur rôle plus spécifique in vivo. Ainsi, la 4’IOMT, responsable de la méthylation des isoflavanones en 4’ peut aussi méthyler efficacement les isoflavones en position 7. La spécificité de la 4’IOMT n’est donc assurée que grâce à son intégration dans un complexe enzymatique (Liu et al, 2006). a b c Figure 29 : Modèles d’organisation de différentes voies de biosynthèse de métabolites secondaires utilisant les phénylpropanoïdes (les enzymes communes sont en gris foncé pour les phénylpropanoïdes et en gris clair pour les flavonoïdes). Les cytochromes P450 permettent l’ancrage membranaire. a) synthèse de la lignine b) synthèse des flavonols c) synthèse des anthocyanes (Winkel, 2004) Les premières étapes de la biosynthèse des isoflavones sont communes à d’autres voies qui s’expriment plus ou moins selon les tissus (Figure 29), mais qui peuvent aussi coexister. Dans ces complexes, les P450 jouent un rôle peut être plus important qu’on ne le pensait initialement, en structurant et fixant les ensembles sur la membrane du réticulum endoplasmique. 77 Les différents exemples de régulations de cette voie de biosynthèses des isoflavonoïdes présentés ici, laissent donc entrevoir la complexité de sa régulation, suggérant la mise en place de rétrocontrôles positifs et négatifs soit au niveau transcriptionnel, soit au niveau posttranscriptionnel et traductionnel. 5 OBJECTIFS DE LA THESE Les isoflavones sont fortement concentrées dans la graine de soja, plus particulièrement dans le germe qui contient 4 à 10 fois plus d’isoflavones que les cotylédons devenant ainsi un sous-produit hautement valorisable pour le marché des suppléments santé. De plus, la composition en isoflavones est caractéristique du compartiment de la graine : la glycitéine et la daidzéine sont les deux isoflavones les plus importantes du germe alors que dans les cotylédons la génistéine et la daidzéine sont prédominantes. La glycitéine est exclusivement présente en grande quantité dans les germes. Ces composés jouent un rôle majeur dans la physiologie de la plante, notamment lors de la mise en place de la symbiose, mais également dans le secteur de l’alimentaire-santé, du fait de leurs propriétés œstrogéniques et antioxydantes. Cependant, les trois isoflavones (génistéine, daidzéine et glycitéine) peuvent avoir des effets différents sur la santé. Elles peuvent également devenir indésirables dans certains produits à base de soja qui sont couramment utilisés dans les préparations infantiles de substitution en cas d’intolérance au lactose. Dans un tel contexte de controverse sur les effets potentiellement délétères des phytoestrogènes, notamment chez l’enfant (AFSSA), on assiste à deux types de demandes industrielles pour la matière première en fonction des types de consommateurs auxquels les produits dérivés de la graine sont destinés: une demande de variétés riches en isoflavones, donc de germes à forte concentration en isoflavones pour le marché des nutraceutiques, et au contraire une demande de variétés appauvries, donc de cotylédons à faible concentration pour le marché des « soyfoods ». Ceci ayant conduit à considérer de manière distincte les deux compartiments (germes et cotylédons) de la graine afin de permettre in fine une meilleure maîtrise des teneurs et des compositions de cette famille de molécules dans les deux compartiments de la graine. Ce travail de thèse s’inscrit dans la continuité d’une précédente approche physiologique menée au laboratoire, visant à préciser les voies de synthèse des isoflavones dans les 78 cotylédons et le germe, en considérant les facteurs de variations génotypiques et environnementaux potentiellement impliqués mais également l’accumulation des isoflavones dans les graines depuis le début de leur formation jusqu’à leur maturation. Cette approche a en effet tout d’abord permis de mettre en évidence l’influence de l’environnement et du génotype sur le contenu en isoflavones de la graine de soja. Cependant, les différences entre variétés sont généralement conservées, et la composition en isoflavones est caractéristique de la fraction de la graine considérée. Un net décalage de l’accumulation des isoflavones entre les germes et les cotylédons a également été souligné. L’accumulation dans les cotylédons ne commence que quand celle-ci a déjà atteint un plateau dans les germes, soulignant ainsi les deux voies distinctes de régulation de la teneur en isoflavones et de leur composition dans les cotylédons et les germes. La variabilité génotypique rencontrée pour le contenu en isoflavones chez le soja, combinée à une bonne stabilité des variétés se traduit par des estimations élevées de l’héritabilité pour le contenu en isoflavones totales ou individuelles. Plusieurs QTLs démontrant un réseau très complexe pour le contrôle des quantités d’isoflavones totales ou individuelles dans les graines ont été identifiés et une étude de polymorphisme des gènes IFS1 et IFS2 à partir de différentes variétés chinoises a permis l’identification de SNPs associés avec les quantités d’isoflavones dans les graines. De par le rôle majeur de ces composés dans la physiologie de la plante et la santé humaine, la voie de biosynthèse des isoflavones a été largement étudiée et la quasi-totalité des enzymes a été isolée et fonctionnellement caractérisée, à l’exception de quelques unes intervenant dans la voie de biosynthèse de la glycitéine. La démarche entreprise vise donc à faire se rencontrer, d’une part les résultats de la précédente approche physiologique réalisée au laboratoire et, d’autre part le déterminisme génétique pouvant être à l’origine de ces différences de teneurs et de compositions en isoflavones observées dans les deux compartiments distincts de la graine (germes et cotylédons) mais aussi du net décalage de leur accumulation observé au cours du temps entre ces deux compartiments. Le déterminisme génétique constitue l’objectif du présent travail de thèse qui inclut deux parties. Tout d’abord, une recherche sur le polymorphisme de séquence de certains gènes codant pour des enzymes structurales de la voie de biosynthèse des isoflavones, notamment la potentielle variabilité de séquences des isoflavones synthases (IFS) 79 mais également sur l’étude des cinétiques d’expression de certains gènes cibles de cette voie, plus particulièrement l’éventuelle expression différentielle de ces gènes selon les différents tissus de la graine (germes /cotylédons), le stade de développement et la variété étudiée. Enfin, la deuxième partie de cette thèse s’intéresse à la compréhension du processus menant à la synthèse de la glycitéine qui n’est pas complètement établi à ce jour, grâce à la mise en œuvre de l’isolement d’un gène candidat potentiel codant pour une flavonoïde 6-hydroxylase (F6H) qui participerait à sa synthèse dans la graine. 80 CHAPITRE II : MATERIEL ET METHODES 81 1 MATERIEL VEGETAL UTILISE 1.1 Choix des variétés Les variétés de soja (Glycine max) utilisées ont été choisies en raison de leurs teneurs ou profils particuliers en isoflavones. Imari et Queen, ont déjà fait l’objet de nombreuses études au laboratoire (Berger et al., 2002 ; Daydé et al., 2002 ; Berger et al., 2008 ; Rasolohery et al., 2008). Elles présentent des teneurs et des profils d’isoflavones extrêmement contrastés quelles que soient les conditions environnementales (Figure 30). Figure 30 : Concentrations en isoflavones totales (µmol.g-1 MS) dans des graines de soja à différents stades de développements (JAF : Jours Après floraison) en serre et en champ d’après Rasolohery et al. (2008) Ces variétés sont bien adaptées aux conditions pédo-climatiques du Sud-Ouest de la France. Elles ont d’ailleurs été parmi les plus cultivées dans cette région durant la seconde moitié des années 1990 et longtemps été les témoins de référence de leur catégorie. 82 Imari (obtention Asgrow distribuée par Monsanto, inscrite en 1992), est une variété à croissance semi-déterminée, à fleurs violettes, pilosité grise et gros grains beiges à hile brun clair, riche en protéines. Queen (obtention Dekalb distribuée par la RAGT inscrite en 1992), est à croissance indéterminée, fleurs violettes, pilosité fauve, à petits grains parfois tachetés de noir, au hile noir, de bonne teneur en protéines, cependant inférieure à Imari. Les teneurs en isoflavones de ces deux variétés représentent grosso modo les extrêmes de ce que l’on peut trouver dans des comparaisons variétales : Queen présente systématiquement environ le double de la teneur d’Imari. Ces phénotypes sont en réalité dus aux teneurs dans les cotylédons. Dans les germes, ces variétés ont des teneurs moyennes, Imari étant légèrement inférieure à Queen. Ces variétés sont aussi remarquables pour leur composition en isoflavones : au niveau des cotylédons, Imari est une des plus riches en génistéine (dépassant régulièrement les 60%) tandis que Queen est une des plus riches en daidzéine (environ 50% en moyenne). Au niveau des germes, Imari contient majoritairement de la daidzéine (55% daidzéine et 35% glycitéine) tandis que Queen a le profil inverse (35% daidzéine et 55% glycitéine) ; les deux variétés ont environ 10% de génistéine. Ces profils correspondent en fait à deux types (Gly+ et Gly –) entre lesquels ségrégent la majorité des variétés de soja, les phénotypes intermédiaires étant des hétérozygotes (Daydé et al., 2004). D’autres variétés aux teneurs et aux compositions en isoflavones très caractéristiques, notamment dans les germes, ont été utilisées : NS Kasha « NSK », de type déterminé, à petits grains, est un extrême du type Gly+ (plus de 70% de glycitéine dans les germes), tout en ayant une teneur comparable à Imari et Queen. Noir de Toulouse « NT », semi-déterminée, à gros grains noirs, un peu plus précoce qu’Imari et Queen (groupe I), présente une très forte teneur en isoflavone dans les germes. Dwight, variété américaine, a montré une ségrégation pour les types Gly+ et Gly –. Les deux isolats ont été alors nommés Dwight+ et Dwight – Les lignées mutantes, accessions PI567580A ou « PIA » et PI567417C ou « PIC », d’origine chinoise (Qi si mi pour « PIA » et Bai gun dou pour « PIC ») proviennent 83 de la collection de l’USDA (Urbana, Illinois). Le mutant PI567417C présente une très faible teneur en isoflavones dans les graines comme dans les germes et PI567580A est un mutant qui ne présente pas de glycitéine dans le germe (mutant Gly0). 1.2 Les conditions de culture 1.2.1 Culture en serre Pour les analyses de séquences des isoflavones synthases, les dosages des isoflavones et le suivi de l’expression des différents gènes cibles de leur voie de biosynthèse, six variétés : Imari, Queen, Noir de Toulouse, NS Kasha, PI567580A et PI567417C, ont été cultivées en serre. Les graines ont été inoculées par Bradyrhizobium japonicum (souche G49, 109 bactéries.g-1) et semées dans des pots de 30 cm de diamètre (5L) dans un mélange à part égales de terre, sable et tourbe. Après germination, seulement deux plantes par pot ont été conservées. Au final, 12 plantes de chaque variété (6 pots par lignées) ont été utilisées. Les conditions d’irrigation ont été bien contrôlées, et deux fois par semaine les plantes ont été fertilisées avec 200 ml d’une solution de Hoagland modifiée à faible teneur en azote et d’oligo éléments (Burias, 1991). 1.2.2 Culture en phytotron Pour les tests d’expression des F6Hs, six variétés de soja : Imari, Queen, NS Kasha, Dwight+, Dwight– et PI567580A ont été cultivées en phytotron. Deux séries de cultures conduites à l’identique ont été réalisées : la série (1) en novembre 2010 et la série (2) en juillet 2011. Pour chaque série, 4 plantes de chaque variété ont été cultivées. Des graines de chaque variété ont été inoculées par Bradyrhizobium japonicum et semées dans des pots de 20 cm de diamètre (3L) dans du terreau universel. Après germination, seulement une plante par pot a été conservée. Les plantes ont été cultivées en jours longs (16/8 h J/N), à température optimale (23/18 °C J/N) sous un éclairement de 700 µmol.m–2.s–1 (PAR) à 50 cm des lampes (HMI OSRAM), avec une hygrométrie élevée (65/85% J/N), irriguées de manière non limitante, et fertilisées deux fois par semaine avec 200 ml de solution de Hoagland modifiée à faible teneur en azote et d’oligo éléments. 84 2 METHODES GENERIQUES 2.1 Les techniques de biologie moléculaire 2.1.1 Extraction des ADN génomiques Les ADN génomiques ont été extraits à partir de jeunes feuilles prélevées le jour même sur les plants de soja et stockées à -80°C. Environ 100 mg de matériel végétal ont été broyés à l’azote liquide dans un mortier à l’aide d’un pilon. L’extraction d’ADN a ensuite été réalisée sur ce broyat (poudre très fine) en utilisant le Kit « DNeasy Plant Mini Kit » (Qiagen, Courtaboeuf, France) et en suivant le protocole recommandé par le fournisseur. La concentration finale des échantillons a été déterminée à 260nm à l’aide d’un spectrophotomètre Nanodrop™ ND-1000 (Thermo Fisher Scientific, Wilmington, USA). 2.1.2 Extraction des ARNs totaux Différents protocoles d’extraction des ARNs (acides ribonucléiques) ont été utilisés en fonction des différents tissus étudiés. Les ARNs totaux de cotylédons et de germes de différents stades de développement ont été extraits à partir de 50 mg de matériel végétal (regroupement de plusieurs graines de même stade). Ce matériel végétal a été broyé dans des matrices de lyse contenant des billes de céramique de 1,4 mm de diamètre « Lysing matrix D » (MP Biomedicals, France) avec 1 mL de réactif Qiazol® (Qiagen, Courtaboeuf, France) à l’aide d’un broyeur-homogénéisateur « FastPrep®-24 » (MP Biomedicals, France) sur 2 cycles de 20 s à 6 m.s-1. Le Qiazol® est un mélange de phénol et d’isothiocyanate de guanidine exploitant la méthode de Chomczynski et Sacchi qui permet de solubiliser les composants cellulaires tout en préservant l’intégrité des ARNs (Chomczynski et Sacchi, 1987). Les ARNs ont ensuite été séparés de l’ADN et des protéines par l’addition de 200 µL de chloroforme. La solution a été alors homogénéisée 15 s par inversion manuelle puis décantée 10 min à température ambiante. Après centrifugation à 4°C pendant 15 min à 14000 rpm, la phase aqueuse (surnageant) a été récupérée et complétée par 500 µL d’isopropanol de façon à précipiter les ARNs durant 5 min à température ambiante. Après une nouvelle centrifugation à 4°C pendant 5 min, le culot d’ARNs est rincé dans 1mL d’éthanol 70%. Après une dernière centrifugation plus lente à 7000 rpm pendant 5 min à 4°C, les ARNs sont resuspendus dans 200 µL d’eau RNase-free. 85 Les ARNs totaux de feuilles élicitées et de cotylédons (issus d’une seule graine) ont été extraits à l’aide du kit « RNeasy Plant Mini Kit » (Qiagen, Courtaboeuf, France). Après lyse des cellules, les ARNs purifiés sur une membrane de silice grâce à une série de lavages, sont élués dans de l’eau RNase free. Les rendements d’ARNs extraits sont maxima pour des échantillons d’environ 50 mg. L’extraction d’ARN sur germe isolé a été faite à l’aide du kit « NucleoSpin®RNA XS » (Macherey-Nagel, Düren, Allemagne) en suivant les instructions du fournisseur. Ce kit est destiné aux échantillons de tissus de 0,1 à 5 mg, ce qui correspond au poids d’un germe de la graine de soja pour les stades de développement 25 JAF à 40 JAF. Dans ce kit, une étape de traitement à la DNase est incluse, cependant celle-ci ne s’est pas avérée suffisante. Une étape de traitement à la DNase a donc été ajoutée afin d’éviter toute contamination éventuelle par des restes d’ADN génomique. Tous les échantillons d’ARNs extraits ont été conservés à -80°C après mesure de leur concentration et vérification de leur intégrité. 2.1.3 Quantification et vérification de la pureté des ARNs La détermination de la concentration des différents ARNs extraits a été réalisée par mesure de l’absorbance à 260 nm (1 unité d’absorbance = 40 µg d’ARN/ml), avec un Nanodrop™ ND-1000 (Thermo Fisher Scientific, Wilmington, USA). Des mesures d’absorbance à 230nm et 280nm sont également effectuées afin d’évaluer la pureté des échantillons d’ARNs. Le ratio A260nm/A280nm évalue la contamination protéique et doit être proche de 2 pour que les ARNs soient considérés comme purs. Le ratio A260nm/A230nm est un indice de la présence de sucres et doit être compris entre 1,8 et 2. 2.1.4 Elimination de l’ADN génomique des extraits d’ARNs totaux Les différents échantillons d’ARNs totaux extraits de cotylédons, de germes et de feuilles élicitées ont tous été traités à la DNase afin d’éliminer l’ADN génomique. Pour ce faire, deux kits ont été utilisés : Pour les échantillons destinés aux mesures en PCR quantitative, un kit « RNase-Free DNase Set» (Qiagen, Courtaboeuf, France) a été utilisé. Chaque échantillon d’ARN (10 µL d’ARN à 200 ng/µL soit 2 µg d’ARN) a été traité par un mélange de 2 µL de tampon RDD (pour RNase-free DNA Digest buffer : contenant du Tris-Cl 500 mM pH 8.0, du MgCl2 50 mM, et du DTT 10 mM), 0,2µL de DNase I, et 7,8 µL d’H2O (Vqsp = 20 µL) puis a été incubé 30 min à 37°C. Après ajout de 2 µL d’EDTA 1 mM, 86 l’échantillon a été remis à incuber 5 min à 65°C afin d’inactiver l’enzyme DNase I. Ainsi un volume final de 22 µL d’ARNs traités a été obtenu pour chaque échantillon. Pour les échantillons d’ARNs destinés aux RT-PCR semi-quantitative, un kit « DNase I » (1 U/µL) (Fermentas, France) a été utilisé. Le volume maximum d’ARN pouvant être traité avec ce kit est de 8 µL. Ainsi, afin d’obtenir des solutions de concentrations équivalentes, 8 µL d’échantillon le moins concentré sont utilisés et le volume des autres échantillons est ajusté avec de l’eau. Ensuite, à ces 8 µL (1,6 µg d’ARNs) sont ajoutés 1 µL de Tampon 10X contenant le MgCl2 ainsi que 1 µL de DNase I (1U). Le mix est incubé 30 min à 37°C, puis 1 µL d’EDTA 50 mM est ajouté avant d’être remis à incuber 10 min à 65°C pour inactiver l’enzyme. Un volume final de 11 µL de chaque échantillon d’ARN traité à la DNase I est obtenu. 2.1.5 Transcription inverse (la reverse transcription RT) : Cette méthode permet d’obtenir des ADN complémentaires (ADNc) à partir d’une préparation d’ARNs totaux. Cette réaction est réalisée par une enzyme rétrovirale appelée Reverse transcriptase. Celle-ci est spécifique de la matrice ARN pour fonctionner et synthétiser un ADN complémentaire au brin d’ARN. Elle a besoin d’amorces oligonucléotidiques (amorces aléatoires ou hexamères) pour initier la synthèse du brin d’ADN et utilise les dNTPs comme substrat. Pour réaliser cette technique, deux kits de Reverse Transcription ont été utilisés pour obtenir les échantillons d’ADNc (RT+) : Le kit « Maxima™ First Strand cDNA Synthesis » (Fermentas, France) qui a servi à la rétro-transcription des ARNs traités destinés aux PCR semi-quantitatives. Celui-ci contient le mix de réaction 5X contenant : le tampon de réaction, les dNTPs, les oligo (dT)18 et les amorces hexamères aléatoires, ainsi que le mix Maxima® enzyme contenant : l’enzyme reverse transcriptase ainsi qu’un inhibiteur RNase qui va protéger les ARNs de dégradations par les RNases A, B, et C à des températures supérieures à 55°C. Proportionnellement, la réaction de RT est constituée de 4 µL de Mix 5X, 2 µL de mix Maxima et de 1,6 µg d’ARN pour un volume final de 20 µL. L’ADNc obtenu est dilué au 1/5 ème. Le kit « High Capacity cDNA Archive » (Applied Biosystems, Forster City, USA) qui a quant à lui servi à la rétro-transcription des échantillons d’ARNs traités destinés aux PCR quantitatives. La RT se fait dans un ratio maximum de 2 μg d’ARN pour un volume réactionnel final de 20 μL. Un mix 2X est réalisé et mélangé à l’ARN en volume équivalent puis incubé 10 min à 25°C, 2 h à 37°C et 5 87 min à 85°C pour synthétiser les ADNc. Le mix 2X est composé de tampon RT 2X, de dNTP 8mM chacun, d’amorces aléatoires RT 2X et de MultiScribe Reverse Transcriptase 50U. L’ADNc obtenu est dilué au 1/5 ème. Pour toutes les réactions de RT des témoins de contrôle de la réaction ont été réalisés : Des témoins négatifs (RT-) : cette réaction contrôle RT- contient chacun des réactifs de la réaction de RT excepté la Reverse Transcriptase et permet ainsi de s’assurer que l’ARN ne soit pas contaminé par de l’ADN génomique, autrement dit que le traitement préliminaire à la DNase ait bien fonctionné. Des témoins négatifs (NTC pour No Template Control) : cette réaction contient tous les réactifs excepté l’ARN et permet ainsi de vérifier que les réactifs utilisés ne sont pas contaminés. 2.1.6 Amplification de l’ADN : Polymérase Chain Reaction (PCR) Les séquences des amorces spécifiques des gènes IFS1, IFS2, F6H1, F6H2 et F6H3 utilisées pour les différentes amplifications sont présentées dans chaque partie des expérimentations. Les séquences de certaines amorces utilisées ont été extraites de la littérature. Les différentes amorces ont été dessinées à l’aide du logiciel Primer3 http://frodo.wi.mit.edu/primer3/ (Rozen et Skaletsky, 2000). Toutes les amorces, sans exception, ont été sélectionnées après détermination de la température de fusion et après confrontation avec les bases de données GenBank et Phytozome, de telle sorte qu’elles n’aient aucune homologie significative non spécifique prévisible. Les caractéristiques des amorces (température de fusion Tm, % de GC) ont été calculées par le logiciel Primer 3. Ces amorces ont été synthétisées par la société Invitrogen. Toutes les réactions PCR requises pour ce travail ont été réalisées à l’aide d’un thermocycleur GenAmp 9700 (Applied Biosystems, Forster City,USA). De façon générale, le mélange réactionnel des PCR effectuées comprenait: 150 ng d’ADN, 1,25 µl d’une solution de MgCl2 50 mM, 5 µL de tampon 10X, 1,5 µL de chaque amorce (diluée à 0,1µg/µL), 4 µL de dNTPs 2,5 mM (Invitrogen, Carlsbad, USA), 2,5U de Taq polymérase (Invitrogen, Carlsbad, USA) et de l’H2O (Vqsp = 50 µL). Certaines PCR ont également été réalisées à l’aide du PCR Master mix 2X (Promega, France). Ce pré-mix PCR est prêt à l’emploi et contient la Taq polymérase (50Units/ml), 400 µM de chaque dNTP, 3 mM de MgCl2, et le tampon de réaction en concentration optimale pour l’amplification de l’ADN cible par PCR. Les quantités de chaque constituant utilisées pour un volume réactionnel de 25 µL sont : 1 µL d’ADN, 12,5 µL de master mix, 1 µL de chaque amorce (diluée à 10 µmol/L) et 9,5 µL 88 d’H2O (Vqsp = 25 µL). Ces deux Taq polymérases utilisées possèdent toutes deux une activité Adénine terminal Transférase (présence d’une queue poly A sur l’amplicon). Les conditions de PCR n’ont pas été identiques selon les fragments à amplifier. Le nombre de cycles réactionnels effectués dépend de la matrice de départ. Si les PCR sont réalisés à partir d’ADN génomique le nombre est fixé à 30 cycles et 40 cycles pour l’ADN complémentaire. La durée de l’étape d’élongation a été modifiée selon la taille du fragment à amplifier (1min par Kb). De même, la température d’hybridation varie en fonction de la température de fusion (Tm) des amorces. Aussi, les conditions spécifiques de chaque PCR seront rapportées dans les différentes parties d’expérimentations qui suivront (section 3). 2.1.7 Étude de l’expression par PCR quantitative en temps réel Cette technique consiste à mesurer la quantité d’ADN polymérisé à chaque cycle grâce à un marqueur fluorescent. La méthode choisie ici est celle du SYBR Green. Cet agent intercalant, une fois lié à l'ADN double brin, émet une fluorescence qui est directement mesurée dans le tube PCR à l'aide d'un fluorimètre couplé au thermocycleur. La fluorescence augmente donc avec la quantité d’ADN double brin présente dans le tube. 2.1.7.1 Principe Les données de fluorescence sont collectées à chaque cycle de la PCR et représentent la quantité de produits amplifiés à cet instant. Plus l’échantillon est concentré en molécules cibles à l’origine, moins il faudra de cycles pour atteindre un point pour lequel le signal fluorescent est significativement supérieur au bruit de fond. Ce point est défini comme le Ct pour « Threshold Cycle » ou « cycle seuil» et apparaît en début de phase exponentielle (Figure 31). Figure 31 : Détermination du cycle seuil Cette quantification n’étudie donc pas la fin de la PCR et n’est donc pas affectée par les éléments limitants identifiés lors de la phase du plateau. Ce concept de Ct est à la base de la 89 précision et de la reproductibilité de la technique. Si l’on suit la fluorescence au cours du temps d’une PCR en temps réel, on observe une augmentation de cette fluorescence et donc du nombre de fragments PCR dont l’allure est sigmoïde. Celle-ci se scinde en 3 phases distinctes (Figure 32): 1. La phase de bruit de fond : la quantité de fragment amplifié est insuffisante pour générer un signal fluorescent supérieur au bruit de fond. 2. La phase exponentielle : la quantité de fragment amplifié génère un signal fluorescent supérieur au seuil de détection de l’appareil. La quantité obtenue de produit PCR est directement proportionnelle au nombre de copies initiales du fragment d’ADN amplifié. Pendant cette phase, la quantité d’ADN (N) dépend de la concentration initiale en ADN (N0), du nombre de cycle et de l’efficacité (E) : Nc = N0 x Ec 3. la phase de plateau (ou de saturation) : correspond à un ralentissement de l’amplification qui est souvent dû à l’épuisement d’un des différents réactifs de la PCR (en particulier le nombre de molécules de Taq disponible). Le système ne permet donc plus une amplification exponentielle. Figure 32 : exemple de courbes représentant l’augmentation de la fluorescence au cours du temps obtenues lors des analyses 2.1.7.2 Protocole et réactifs utilisés La matrice correspond à l’ADNc préalablement synthétisé selon la technique détaillée dans la section 2.1.5 des méthodes génériques. Le choix des gènes cibles, le design des amorces spécifiques utilisées et la vérification de la spécificité de chaque couple seront détaillés dans la partie expérimentation de la section 3.2.2. 90 L’appareil utilisé nécéssite l’emploi d’un kit spécifique appelé « IQ SYBR Green Supermix » (Bio-Rad, Hercules, CA, USA) contenant un tampon de réaction (KCl 100 mM, Tris-HCl 40 mM, pH=8,4), des désoxyribonucléotides : dATP, dTTP, dCTP, et dGTP (400 μM de chaque), une iTaq DNA polymerase, du MgCl2 (6 mM), du SYBR Green I et de la fluorescéine (20 nM). Les réactions sont effectuées sur des plaques 96 puits, contenant chacun un volume final de 25 µL avec 12,5 μl de « IQ SYBR Green Supermix », 7,5 μl du mix de primers (900 nM final), 5 μl d’ADNc à 40 ng/µL. La plaque est centrifugée 30 s à 5000 rpm après avoir été recouverte au préalable d’un film plastique, puis placée dans l’appareil de qPCR (CFX96 Real-Time PCR Detection System, Bio-Rad, Hercules, CA, USA). Le cycle utilisé est constitué d’une dénaturation primaire à 95°C pendant 3 min, suivie de 40 cycles d’amplification comportant chacun 2 étapes : une dénaturation du double brin d’ADN à 95°C pendant 10 s et un appariement des amorces avec l’élongation des nouveaux brins d’ADN à 60°C pendant 30 s. L’acquisition de la fluorescence a lieu à la fin de chaque cycle, c'est-à-dire après chaque étape d’élongation. La réaction se termine par une courbe de fusion (courbe de dissociation) réalisée par augmentation de la température de 60°C à 95°C avec une incrémentation de 0,5°C toutes les secondes et mesure de la fluorescence à chaque palier. Cette dernière permet de confirmer la spécificité de la séquence nucléique amplifiée : l’ADN double brin est dénaturé très lentement jusqu’à ce que sa température de fusion caractéristique soit atteinte. Le SYBR Green est alors libéré dans le milieu réactionnel, ce qui se caractérise par une brusque chute de fluorescence sur le moniteur. La dérivée première de la fluorescence permet d’obtenir un pic unique, garant de la spécificité d’amplification et de l’absence de contamination. Pour toutes les réactions, autrement dit pour chaque paire d’amorces testées, des témoins négatifs (NTC pour No Template Control) ont été réalisés (Figure 33). Cette réaction NTC contient tous les réactifs, excepté la matrice d’ADNc qui est remplacée par de l’eau « nuclease-free » et permet ainsi de vérifier par l’absence d’amplification que les réactifs utilisés ne sont pas contaminés. Au final, deux réplicats biologiques ont été analysés avec pour chacun trois répétitions outils. 91 Figure 33 : Réactions contrôles NTC La quantification des niveaux d’expression est effectuée avec le logiciel LinReg PCR (v11.0, University of Amsterdam, Pays-Bas) selon les recommandations décrites par (Ruijter et al., 2009). L’expression est normalisée par le gène de référence retenu (β-tubuline) et se traduit par le ratio : N0 cible / N0 réf dans lequel : N0 est égal à la concentration initiale d’ADN par échantillon, exprimé en unités arbitraires de fluorescence. Ce qui se traduit par N0 = seuil fluo/(Efficacité de PCR)ct. Avec : Ct = nombre de cycles nécessaires pour atteindre le seuil de fluorescence Efficacité de PCR = valeur comprise entre 1 et 2, calculée par le logiciel à partir de la pente de la courbe d’amplification dans la phase exponentielle. Il est communément admis qu’elle doit être comprise entre 1,8 et 2 (une efficacité de 2 correspond à une efficacité parfaite de 100% où la quantité d’amplicon est doublée à chaque cycle). L’efficacité de PCR pouvant fortement impacter les niveaux d’expression obtenus, un nombre suffisant d’analyses doit être effectué pour assurer la validité des résultats. En général, chaque gène est analysé deux fois en triplicats. 2.1.8 Analyse des produits PCR sur gels d’agarose Les produits de PCR sont visualisés par électrophorèse sur gel d’agarose. Les gels sont préparés à partir de tampon TAE (89 mM Tris Base, 89 mM Acide Acétique, 2 mM EDTA, pH8). Selon la taille attendue du fragment amplifié, la concentration des gels a été adaptée : 2% pour les fragments inférieurs à 0,5 Kb, 1,2% pour les fragments de 0,5 à 2,5 Kb et enfin 0,8% pour les fragments de plus de 2,5 Kb. Les échantillons sont additionnés de 0,2 volumes de tampon de charge (bleu de bromophénol 0,25% (p/v), xylène de cyanol FF 0,25% (p/v), 92 glycérol 30% (p/v) avant dépôt sur le gel. Les migrations ont été réalisées en tampon TAE à 100 V pendant 15min. Le gel est ensuite coloré 10 min dans un bain de bromure d’éthidium (BET) à 0,1 µg/ml. Les fragments d’ADN sont visualisés avec un analyseur UV (300 nm) par la fluorescence du BET (agent intercalant) contenu dans l’ADN. Les tailles des fragments d’ADN séparés sur gel sont estimées grâce à un marqueur de taille migrant en parallèle des échantillons. La taille du marqueur choisi varie en fonction de la taille des échantillons à analyser : 50 pb, 100 pb, 200pb ou 1 Kb (DNA Ladder, Promega, France). 2.1.9 Purification des bandes d’ADN après électrophorèse Dans certains cas, le produit PCR amplifié a été purifié directement à partir du gel à l’aide de kits de type QIAquick gel (Qiagen, Courtaboeuf, France) en suivant les instructions du fournisseur. Le principe consiste à fixer l’ADN amplifié sur une colonne de silice grâce un tampon à forte salinité, les autres constituants du milieu n’étant pas retenus. Après lavage de la colonne, l’ADN est récupéré par centrifugation 1 min à 15 000 g dans de l’eau nucleasefree. 2.1.10 Clonage des fragments d’intérêt Le clonage des fragments amplifiés par PCR a été réalisé grâce aux Kits de clonage TOPO TA® cloning (Invitrogen, Carlsbad, USA) ou pGEM-T® (Promega, France) et ceci en mettant à profit l’activité Adénine Terminal Transférase de la Taq ADN polymérase, cette enzyme a ajouté systématiquement une déoxyadénosine à l’extrémité 3’ des produits amplifiés. Afin d’optimiser cette incorporation, les produits de PCR ont été incubés à 72°C (Température optimale de la Taq DNA polymérase) pendant 10 minutes, juste après le dernier cycle d’amplification. Les plasmides PCR2.1 TOPO® et pGEM-T® (Figure 34) sont linéaires et portent un résidu thymidine (dT) non apparié à leurs extrémités 3’. Une topoisomérase est fixée de façon covalente à ces plasmides. Celle-ci permet une ligation entre le vecteur et le produit PCR terminé en 3’ par un résidu adénine (dA). Les clonages ont été entrepris selon les recommandations du fabriquant. Les plasmides PCR2.1 TOPO® et pGEM-T® ainsi circularisés ont été ensuite introduits respectivement dans des cellules d’Escherichia coli souche Top10F’et JM109, par choc thermique. Les bactéries contenant ce plasmide portant le gène de résistance à l’ampicilline, ont été sélectionnées par étalement sur milieu sélectif Luria Bertani (LB : tryptone10 g/l, Yeast 93 Extract 5 g/l, Nacl 5 g/l, agar 15 g/l) contenant 100 µg /ml d’ampicilline. Ce plasmide possède également le gène LacZ, composant de l’opéron lactose, qui code pour la -galactosidase. Le site d’insertion du fragment se trouve dans la séquence de ce gène. Les clones ont été détectés en présence de l’inducteur IPTG (Isopropyl 1 thio -galactosidase ; 40 mg/ml de LB) et de 100 mM de réactif X-Gal (5 bromo-4-chloro-3-indolyl- -D-galactopyranoside). L’IPTG est un métabolite du lactose qui active la transcription du gène LacZ et le X-Gal est un composé incolore qui, hydrolysé par la -galactosidase, libère une indoline formant un composé bleu insoluble dans l’eau qui ne diffusera donc pas dans la gélose. Ainsi les bactéries ayant intégré le vecteur vide possèdent un LacZ actif, hydrolysent le X-Gal et apparaissent bleues sur la gélose. En revanche, le lieu d’insertion de l’amplicon étant dans le gène LacZ, les bactéries ayant intégré le vecteur avec l’amplicon restent blanches. Afin de vérifier la taille du fragment inséré, un criblage par PCR des clones positifs (colonies blanches) a été réalisé à l’aide des amorces M13F et M13R pour le vecteur PCR2.1 TOPO® ou à l’aide des amorces SP6 et T7 pour le vecteur pGEM-T®. Les clones bactériens munis d’un insert de taille attendue ont été cultivés dans 4 ml de bouillon de culture Luria Bertani supplémenté en ampicilline (100 µg/ ml de milieu). L’isolement de l’ADN plasmidique a été réalisé à l’aide du GenElute Plasmid Miniprep kit (Sigma-Aldrich) selon les recommandations du fabricant avant d’être envoyé à séquencer. Figure 34 : Composition des plasmides PCR2.1 TOPO® et PGEM-T® 94 2.1.11 Séquençage des plasmides et des produits PCR Le séquençage des plasmides et des produits PCR a été sous-traité auprès de la société GATC Biotech (Konstanz, Allemagne) (http://www.gatc-biotech.com/fr/home.html). Les séquençages ont été réalisés sur un séquenceur automatique ABI 3730 XL (Applied Biosystems, Forster City, USA) qui utilise la méthode de Sanger et permet d’obtenir des séquences propres de plus de 1000 pb. Pour chaque amplicon inséré dans un plasmide, les deux côtés du plasmide sont séquencés à l’aide des amorces universelles M13F et M13R ou SP6 et T7 en fonction du type de plasmide utilisé lors de l’étape de clonage. Ces amorces sont suffisamment éloignées du début de l’insertion pour que le séquençage soit correct dès le début de l’amplicon. Pour obtenir le séquençage plus en interne de l’amplicon inséré dans le plasmide ou le séquençage de tout autre amplicon PCR, des amorces spécifiques (utilisées lors des amplifications PCR initiales) sont utilisées. 2.2 Les techniques analytiques 2.2.1 Extraction des isoflavones Les cotylédons et les germes préalablement lyophilisés et congelés (cf. section 3.2.1) ont été finement broyés (particules de 0,1 g de Ø <0.200 mm) à l’aide d’un mortier et pilon en céramique. Les échantillons ont été extraits pendant 2 heures à température ambiante avec du méthanol 80%. Les proportions utilisées pour ces extractions sont de 50 mg de poudre de cotylédons pour 1 ml de solvant d’extraction et de 2 mg de poudre de germes pour 100 µL de solvant d’extraction. Les résidus ont ensuite été éliminés après centrifugation pendant 10 min à 12000g et décantation du surnageant. Le surnageant a ensuite été filtré à l’aide d’une seringue munie d’un filtre (0.2 μm, Acrodisc Syringe Filters, GHP membranes; St. Germainen-Laye, France) avant d’être analysé en chromatographie liquide haute performance couplée à un détecteur ultraviolet (HPLC/UV) dont la longueur d’onde est fixée à 260nm. 2.2.2 Analyses HPLC: High Performance Liquid Chromatography Le système chromatographique utilisé (Spectra Physics Analytical Inc., Fremont, CA, USA) se compose d’un système de pompage « P4000 » avec un formeur de gradient, d’un échantillonneur « AS3000 », d’une colonne, d’un injecteur et d’un détecteur U.V. à barrettes de diodes (DAD) (UVD340, Dionex, Voisins Le Bretonneux, France) permettant d’établir un spectre U.V. (200 à 600 nm, ici fixée à 260nm) pour chaque composé sorti de la colonne. Les 95 différents éléments sont reliés à un ordinateur sur lequel est installé le logiciel d’analyse « Chromeleon » (Dionex, Voisins Le Bretonneux, France). Les 12 structures d’isoflavones sont séparées sur colonne de silice (C18) greffée en phase inverse 35 × 4.6mm (1.5 μm i.d.) Turbo80-ODS (Cluzeau, Sainte Foy La Grande, France) maintenue à 30°C. La reproductibilité du volume injecté fixé à 2 μL est assurée par une boucle d’injection. Les isoflavones sont éluées par une phase mobile : mélange eau désionisée (Millipore, Saint Quentin Yvelines, France) - acide trifluoroacétique 0,05 % (Peypin, France) (solvant A) et acétonitrile (Peypin, France) (solvant B). La séparation complète des 12 isoflavones est réalisée sous un gradient d’élution de 12 min en plusieurs étapes : Le débit de la pompe a été de 1,3 ml min-1. Le solvant B augmente de 0 à 16% en 2 min, puis à 24% en 4 min, à 32% en 3 min, et enfin à 100% en 1 min. Le programme du gradient revient à son statut initial de 100% de solvant A en 2 minutes afin de rincer et rééquilibrer la colonne. Les chromatogrammes d’absorption UV sont collectés à 260 nm (Figure 35, Figure 36). D’une manière générale, l’ordre d’élution (i) daidzéine, ii) glycitéine ; iii) génistéine) est respecté, quel que soit l’état de conjugaison de ces molécules. Les formes glucosylées (daidzine, glycitine et genistine) étant les plus polaires, elles sont éluées en premier, entre la 4ème et la 5ème minute. Suivent les formes malonylées (M. Daidzine, M Glycitine et M Genistine), éluées entre la 5ème et la 7ème minute), puis acétylées (A. Daidzine, A. Glycitine et A. Genistine) entre la 5ème et la 9ème minute, et enfin, les formes aglycones (Daidzéine, Glycitéine et Génistéine) entre la 6ème et la 10ème minute. Figure 35 : Chromatogramme d’absorption UV à 260nm obtenu après séparation HPLC sur colonne RP C18 d’un extrait de cotylédons à 40 JAF 96 Figure 36 : Chromatogramme d'absorption UV à 260 nm obtenu après séparation HPLC sur colonne RP C18 d’un extrait de germes à 40JAF 2.2.3 Quantification des isoflavones La quantification des isoflavones est basée sur une calibration externe. Cependant, les formes malonyles et acétyles étant très instables en solution, seules les 6 isoflavones aglycones (daidzéine, glycitéine et génistéine) et β-glucosides (daidzine, glycitine et génistine) sont utilisées comme standards externes (Chromadex, Santa Ana, CA, USA). Environ 3 mg de standards, peu solubles dans le méthanol, sont individuellement solubilisés dans 0,5 mL de DMSO. Le volume des solutions mères est ajusté à 10 mL avec du méthanol. Chaque solution mère est ensuite diluée en une gamme de dilution croissante (8, 25, 50, 80, 110 et 150 μg.mL-1). Les solutions mères sont dupliquées pour chaque standard, et 2 solutions mères contenant un mélange de 3 standards sont préparées. À chaque solution mère correspondent 2 gammes de dilutions. L’identification des pics obtenus par une intégration numérique s’effectue en référence aux molécules purifiées des isoflavones. Les coefficients de réponse des formes malonyles et acétyles sont ensuite extrapôlés à partir de l'absorption des formes les plus stables. Les groupements malonyle et acétyle ne possèdent pas de fonction chromophore sensible à l'absorption des rayons UV. Par conséquent les propriétés d'absorption des isoflavones malonylglucosides et acétylglucosides dans des régions de faible longueur d'onde sont similaires à celles des formes β-glucosides. On a donc émis l'hypothèse qu’à λ=260 nm, l'absorption des isoflavones malonylglucosides et acétylglucosides par rapport aux formes βglucosides dépend uniquement de leur poids moléculaire (MW). Les coefficients de réponse 97 (K) des formes malonyles et acétyles des 3 familles d’isoflavones (dérivés de la daidzéine, de la génistéine et de la glycitéine) sont donc déterminés par le calcul suivant : Kacétyle=MWglucoside×Kglucoside/MWacétyle et Kmalonyle=MWglucoside×Kglucoside/MWmalonyle. Les concentrations des formes conjuguées et aglycones sont ensuite ajoutées pour chaque forme aglycone pour obtenir la quantité de génistéine totale, de daidzéine et de glycitéine. Les quantités d’isoflavones sont ainsi exprimées en µmol.g-1 de poids sec. Cette hypothèse a été vérifiée expérimentalement au laboratoire et confirmée par d’autres équipes scientifiques (Zhang et al., 2001). 2.3 Outils bioinformatiques et statistiques 2.3.1 Traitement des séquences nucléiques et protéiques Les résultats des séquençages ont été analysés et à l’aide du logiciel BioEdit (http://www.mbio.ncsu.edu/bioedit/bioedit.html) (Hall, 1999). Les fragments séquencés ont ensuite été assemblés et alignés entre eux afin de reconstruire l’intégralité des séquences consensus à l’aide du logiciel Multalin du site du laboratoire de Génétique Cellulaire de l’INRA de Toulouse (http://multalin.toulouse.inra.fr/multalin/) (Corpet, 1988). Les comparaisons de séquences avec la banque de séquences GenBank ont été réalisées avec le logiciel BLAST du site NCBI (http://www.ncbi.nlm.nih.gov/Blast.cgi). Le logiciel de Traduction Expasy (http://web.expasy.org/translate/) a permis de réaliser la traduction de nos séquences. Les dendrogrammes et les profils d’hydrophobicité ont été réalisés à l’aide des outils disponibles (Phylip 3.67 drawgram ; Toppred) sur le portail de l’institut Pasteur (http://bioweb2.pasteur.fr). 2.3.2 Traitement statistique des données Les traitements statistiques des concentrations d’isoflavones (en µmol.g-1) et de l’expression relative normalisée des différents gènes dans les deux compartiments majeurs de la graine ont été réalisés à l’aide du logiciel XLSTAT 2011 (Addinsoft, Paris, France). Les moyennes des réplicats techniques ont été calculées puis une analyse de variance multifactorielle (ANOVA) a été réalisée pour tester les effets variétés, compartiments, stades, et les interactions de second ordre. Les comparaisons des moyennes ont été faites par Test de Tukey. 98 3 LES DIFFERENTES EXPERIMENTATIONS 3.1 Isolement et caractérisation des gènes IFS1 et IFS2 3.1.1 Prélèvements et échantillonnage Pour le séquençage des IFS1 et IFS2, des jeunes feuilles ont été prélevées sur 3 plantes différentes pour chacune des six variétés : Imari, Queen, NSK, NT, PI567580A et PI567417C ayant poussé en serre dans les conditions décrites dans la section 1.2.1. Celles-ci ont ensuite été rapidement congelées à l’azote liquide avant d’être stockées et conservées à -80°C. 3.1.2 Les différentes étapes de l’expérimentation 3.1.2.1 Extraction des ADN génomiques Les ADN génomiques des 6 variétés Imari, Queen, NS Khasha, Noir de Toulouse, PI567580A et PI567417C ont été extraits à partir de jeunes feuilles selon le protocole présenté dans la section 2.1.1 et ont été utilisés pour amplifier l’intégralité des 2 séquences génomiques IFS1 et IFS2 de chacune des variétés étudiées. 3.1.2.2 Design des amorces Les amorces spécifiques ont été dessinées selon la méthodologie présentée dans la section 2.1.6. Les numéros d’accession GenBank des séquences publiées utilisées comme référence pour les alignements sont : AF195798, EU391463, EU391470 et EU391490 pour le gène IFS1 et AF195819, EU391505, EU391510, EU391513 pour le gène IFS2. La longueur des séquences sélectionnées varie entre 2588 et 2877 pb afin d’être suffisamment en amont de la partie 5’UTR (pour Untranslated Region) non traduite (environ 700 pb pour IFS1 et 1000 pb pour IFS2) et en aval de la partie 3’UTR non traduite (environ 100pb). Chacun de ces deux gènes a été amplifié en une seule fois. Ainsi 2 couples d’amorces spécifiques ont été dessinés (Tableau 5). 99 Tableau 5 : Amorces spécifiques utilisées pour amplifier l’intégralité des séquences génomiques IFS1 et IFS2 Tm moyen du couple IFS1F/R : 61°C et IFS2F/R : 62°C Amorce Forward Séquence 5’3’ Amorce Séquence 5’3’ Reverse Taille de l’amplicon IFS1-F AACACAAGCAAGGGCTTTAGG IFS1-R CATAAAAAGCAACTGCGATGG 2589 pb IFS2-F GCAAAGAGAACCAAAACAAAATTTG IFS2-R GATGAACGAGACCTTATTGAAATGATG 2877 pb 3.1.2.3 Amplifications PCR Le mélange réactionnel utilisé est décrit dans la section 2.1.6. Les amplifications PCR de ces 2 gènes ont été réalisées dans les conditions suivantes : une dénaturation initiale à 95°C pendant 5 min suivie de 30 cycles consistant en une dénaturation à 94°C pendant 45 s, une hybridation à 61°C pendant 1 min pour IFS1 ou à 62°C pendant 1 min pour IFS2 et une élongation à 72°C pendant 3 min pour IFS1 ou 4 min pour IFS2 (1min/Kb). Après les 30 cycles, la réaction de PCR se termine par une étape d’élongation à 72°C pendant 10 min. La taille des fragments attendus a été vérifiée sur gel d’agarose selon le protocole détaillé dans la section 2.1.8. 3.1.2.4 Clonage et séquençage des produits PCR Les produits PCR obtenus ont ensuite été clonés dans des vecteurs PCR2.1 TOPO® et séquencés avec les amorces universelles M13F et M13R (cf. sections 2.1.10 et 2.1.11). Etant donné la longueur des séquences clonées, des amorces spécifiques ont également été dessinées en interne (toujours à l’aide des séquences de référence publiées dans GenBank) (Tableau 6). Tableau 6 : Amorces internes utilisées pour les séquençages des gènes IFS1 et IFS2 Amorces internes Séquences 5'-->3' IFS1 vide0 GGTGATATATGGACATTTCCTGG IFS1 vide1 GTAGACCCACAACACAAACATTG Ifs1bR GACGCCTCACTTACGACAACT IFS1 vide2 GCTGAGGACGAGACCATG IFS2 seq0 GTTGGCCGAATAATCTCATAG IFS2 seq1 GGCTGGGTCACGAACGAG IFS2 seq2 CCTCGTCTTCCCTTCATAGG IFS2seq3Rc CTCCTTCACGATTGCTCTAATG 100 Trois réplicats de chaque amplicon cloné et séquencé ont été réalisés pour chacune des six variétés. Les différents fragments séquencés (6 au total pour chaque réplicat de chacun des gènes) ont ensuite été analysés et alignés afin de reconstituer l’intégralité des deux séquences génomiques consensus. Au final, pour chaque gène : 3 répétitions avec 6 fragments ont été analysées, ce qui correspond à 18 fragments pour chacun des gènes. Ainsi, pour les deux gènes IFS1 et IFS2, 36 fragments ont été analysés pour chacune des 6 variétés étudiées, soient 216 fragments au total. Les séquences génomiques IFS1 et IFS2 des six variétés ont été déposées dans GenBank. Les séquences IFS1 des lignées Queen, Imari, Noir de Toulouse, PI567580A, NS Kasha et PI567417C sont respectivement référencées sous les numéros d’accession JN133900, JN099682, JQ934954, JQ934955, JQ934956, JQ934957 et les séquences IFS2 des variétés Queen, Imari, Noir de Toulouse, PI567580A, NS Kasha et PI567417C portent les numéros d’accession respectifs JN133902, JN133901, JQ934958, JQ934959, JQ934960, JQ934961. 3.2 Etude des cinétiques d’accumulation des isoflavones et d’expression des gènes cibles dans les germes et les cotylédons Une étude spatio-temporelle a été réalisée afin de pouvoir comparer les concentrations en isoflavones et les profils d’expression des gènes cibles de leur voie de biosynthèse dans les germes et des cotylédons de la graine. 3.2.1 Prélèvements et échantillonnage Pour cette étude, les graines provenant de 6 plantes pour chacune des variétés Queen et Imari cultivées en serre (conditions décrites dans la section 1.2.1), ont été prélevées à 6 stades de développement allant de 25 JAF à 70 JAF (Jours Après Floraison (Figure 37). L’objectif étant d’avoir pour chaque variété quatre répétitions biologiques de 10 graines par date de prélèvement. Chaque jour, des séries synchrones de gousses de même stade de développement ont été marquées individuellement au moyen d’étiquettes d’horloger datées et colorées de pastilles de couleurs différentes. Le stade repère choisi était la longueur de la gousse à 1 cm, qui correspond à Floraison + 7 jours (7 JAF). 101 Figure 37 : Les 6 stades de développement des graines de soja prélevées : de 25 à 70 JAF À chaque prélèvement les graines ont été rapidement disséquées ; les germes ont été isolés et séparés des cotylédons. Pour les analyses, 4 échantillons biologiques par stade de développement ont été réalisés pour chacune des deux variétés. Chaque échantillon est constitué de 10 graines collectées au même stade sur 6 plantes de la même variété, au même moment et un duplicata (« un jumeau ») est fait avec 10 graines des mêmes gousses, et cela est répliqué sur 6 autres plantes. Ce matériel végétal prélevé a ensuite été réparti pour les deux types d’analyses. Pour chacun des stades, la moitié des échantillons, a été destinée au dosage des isoflavones alors que l’autre moitié a été destinée au dosage d’expression des gènes cibles. Deux échantillons pour le dosage des isoflavones ont été conservés à -20°C jusqu’à la lyophilisation avant les analyses. En revanche les 2 échantillons « jumeaux » pour le dosage d’expression des gènes ont été immédiatement congelés à l’azote liquide puis stockés et conservés à -80°C. 3.2.2 Les différentes étapes de l’expérimentation Le dosage HPLC des isoflavones et le dosage de l’expression des gènes cibles en PCR quantitative en temps réel ont été menées en parallèle. 3.2.2.1 Dosage HPLC des isoflavones Cette technique a été détaillée dans la section 2.2. 3.2.2.2 Dosage de l’expression des gènes cibles en RT-PCR quantitative Le principe de cette technique, les conditions d’analyses utilisées ainsi que la quantification du niveau d’expression des gènes cibles ont également été présentées dans la section 2.1.7. En revanche, les étapes critiques et nécessaires à la réalisation de cette dernière sont détaillées ci-dessous. 102 Choix des gènes cibles de la voie de biosynthèse des isoflavones Les expressions de seize gènes cibles ont été suivies en PCR quantitative en temps réel. Parmi eux, deux gènes de ménage encore appelés gènes de référence : la β-tubuline et l’actine, dont l’expression est connue pour être constitutive dans la graine (GutierrezGonzalez et al., 2010a ; Chen et al., 2011). Ceux-ci permettent ainsi de vérifier que la concentration en ADNc est constante entre les échantillons à comparer. Le logiciel BestKeeper (Pfaffl et al., 2004) (http://gene-quantification.com/bestkeeper.html) a été utilisé pour déterminer lequel de ces deux gènes de référence il était préférable d’utiliser pour la normalisation de l’expression des gènes cibles. Comparés à l’actine, les taux de transcrits obtenus pour la β-tubuline ont montré la plus faible variation, avec une variation standard (VS) <1 et un coefficient de variation de 1,79. De par cette faible variation d’expression, le gène codant la β-tubuline a été considéré stable et retenu comme gène de référence pour la normalisation de l’expression des gènes cibles. Les quatorze autres gènes dont l’expression a été suivie sont des gènes clefs de la voie de biosynthèse des isoflavones. Ce sont les 9 gènes CHS1 à CHS9 codant pour des chalcone synthases (CHS) identifiées chez le soja (Clough et al., 2004 ; Matsumura et al., 2005 ; Tuteja et Vodkin, 2008), le gène CHR isolé (Welle et Grisebach, 1988) codant pour une chalcone réductase (CHR), les 4 gènes : CHI1A, CHI2, CHI1B1 et CH1B2 codant pour des chalcone isomérases (CHI) (Ralston et al., 2005) et les deux gènes IFS1 et IFS2 codant pour des isoflavone synthases (IFS) (Jung et al., 2000). Design des primers spécifiques Chacune des 16 paires d’amorces pour chacun des gènes correspondant a été dessinée en se basant sur les séquences d’ARNm publiées dans GenBank. Pour les gènes IFS1 et IFS2, les séquences codantes obtenues à partir des variétés Queen et Imari ont été utilisées. Afin d’identifier les similarités et les variations de séquences (notamment pour les gènes d’une même famille), les séquences nucléotidiques ont été alignées et les régions 5’UTR et 3’UTR identifiées. Certains couples ont été dessinés au niveau des jonctions exon-exon afin d’exclure toute amplification d’ADNg. En revanche pour certains gènes comme les CHS, les couples ont été dessinés sur les régions 3’UTR ou 5’UTR du fait de leur trop forte homologie de séquences. Chaque couple d’amorces a été choisi à l’aide du logiciel Primer Express 2.0 (Applied Biosystems, Forster City, USA). Elles ont été définies pour amplifier des fragments compris entre 51 et 136 paires de bases, à une température d’hybridation optimale de 60°C pour 103 chacun des couples, leur taille étant comprise entre 17 et 31 bases, leur pourcentage en G/C avoisinant les 50% et le maximum de bases auto-complémentaires en 3’ étant de trois. Ces conditions sont imposées de façon à éviter la formation de dimères d’amorces qui fausseraient la quantification. Vérification de la spécificité des amorces La spécificité des amorces a été vérifiée de façon théorique en blastant chaque séquence d’amorces contre les séquences du génome du soja sur la base de données Phytozome (http://wwww.phyozome.net/). Celle-ci a également été vérifiée grâce aux températures de fusion de chaque couple lors de la RT-qPCR (Figure 38). La dérivée première de la fluorescence permet en effet d’obtenir un pic unique, garant de la spécificité d’amplification et de l’absence de contamination. Les produits amplifiés ont ensuite été déposés sur gel d’agarose 1,8 % afin de vérifier la présence d’une bande unique de taille attendue. Ces produits ont ensuite été purifiés directement à partir des gels (cf. section 2.1.6) et séquencés afin de confirmer que la réaction d’amplification n’a été spécifique que d’un seul ADNc. Pour certains gènes, plusieurs couples ont dû être testés avant d’en trouver un correspondant à ces critères. Figure 38 : Obtention d’un pic unique garant de la spécificité d’un couple d’amorces utilisé 3.3 Caractérisation des gènes F6Hs et tests d’expression 3.3.1 Prélèvements et échantillonnage Afin d’isoler et de caractériser les séquences F6Hs des variétés Queen, Imari et PI567580A, de jeunes feuilles ont été prélevées sur 2 plantes différentes pour chaque variété 104 ayant poussé en phytotron (cf. section 1.2.2) et ont été rapidement congelées à l’azote liquide avant d’être stockées à -80°C. Des élicitations sur deux feuilles d’âge différent (Feuille « 1 » plus âgée et Feuille « 2 » plus jeune) correspondant à 6 folioles ont été réalisées afin de vérifier l’induction des gènes cibles F6Hs. Donc pour chaque traitement éliciteur, il y a 6 répétitions : 2 feuilles différentes (deux réplicats biologiques) soit 6 folioles (Figure 39). Pour chacune des variétés Imari et Queen, différents échantillons ont été prélevés : des témoins négatifs (non élicités) : avant infiltration nommés « T0 » et 7h après l’élicitation nommé « T7h » (une foliole non traitée prélevée sur une feuille en face des feuilles « 1 » et « 2 ») les échantillons nommés « NT » correspondant à une zone non traitée sur les folioles élicitées les échantillons traités prélevés 7h après élicitation : « lam » pour laminarine, « chit » pour chitosan et aussi des contrôles « H2O » pour l’effet « wounding ». Figure 39 : Les feuilles d’âge différent prélevées pour chaque traitement éliciteur utilisé L’expression des gènes F6Hs dans les graines a été analysée sur des échantillons provenant de plantes cultivées en phytotron (cf. section 1.2.2). Les prélèvements ont été faits à 3 stades de développement : 25 JAF, 40 JAF et 50 JAF. Au total, 4 échantillons biologiques par stade et par variété ont été utilisés. Chacun est constitué d’une seule graine. Après chaque prélèvement, chaque graine a été disséquée, les germes ont été isolés et séparés des cotylédons. Ces échantillons ont ensuite été rapidement congelés à l’azote liquide avant d’être stockés et conservés à -80°C. 105 Deux séries d’échantillons biologiques pour chaque stade de chaque variété ont été effectuées et utilisées : la série (1) en novembre 2010 et la série (2) en juillet 2011. Ainsi les réplicats biologiques ont été réalisés à la fois au travers d’une même série (4 fractions d’un même stade issues de 4 plantes pour chaque variété) mais aussi au travers de deux séries bien distinctes d’échantillons. Au final, 8 répétitions biologiques pour chaque compartiment de chaque stade de chaque variété ont été réalisées. 3.3.2 Les différentes étapes de l’expérimentation 3.3.2.1 Choix des gènes cibles Un seul transcrit F6H référencé sous le numéro d’accession Genbank Y10490.1 a été isolé dans des cultures cellulaires de soja élicitées (Schopfer et Ebel, 1998) et participerait à la synthèse de la glycitéine (Latunde-Dada et al., 2001). En utilisant l’algorithme BLASTN sur la base de données du génome du soja Glyma 1.0 (http://www.phytozome.org/soybean.php), des séquences prédites ayant plus de 65% d’homologie avec Y10490.1 ont été recherchées chez le soja (Glycine max), le haricot (Phaseolus vulgaris) et la légumineuse modèle Medicago truncatula. Une comparaison de ces séquences codantes a été réalisée et un dendrogramme a été construit (Figure 40). F6H1 F6H2 F6H3 Figure 40 : Dendrogramme des séquences codantes prédites ayant plus de 65% d’homologie avec Y10490.1 106 Ce dendrogramme représente les distances phylogénétiques des 19 séquences les plus proches de la seule Flavonoïde 6-hydroxylase (Y10490.1) connue. La séquence Y10490.1 correspond à la séquence prédite Glyma18g08950. Les deux autres séquences prédites les plus proches : Glyma18g08930 et Glyma08g43890 ayant un pourcentage d’homologie supérieur à 78% ont été retenues pour cette étude (Figure 40). Les trois gènes ont été nommés F6H1, F6H2, et F6H3 respectivement. Dans un premier temps les 3 séquences génomiques correspondantes (F6H1, F6H2 et F6H3) ont été isolées et séquencées pour les variétés Imari, Queen et PI567580A. Puis l’analyse de l’expression de ces trois gènes a été réalisée dans différents tissus par RT-PCR semi-quantitative. Tout d’abord, dans des feuilles élicitées afin de vérifier leur induction, puis dans deux fractions bien distinctes de la graine : le germe, compartiment de prédilection pour l’étude de la glycitéine du fait de sa forte concentration en ce composé et les cotylédons qui ont une faible teneur en glycitéine, ceci afin de détecter d’éventuelles expressions différentielles de ces trois gènes F6H1, F6H2 et F6H3 dans ces deux fractions de la graine de soja. 3.3.2.2 Isolement et caractérisation des gènes F6H1, F6H2 et F6H3 Les ADN génomiques des variétés Imari, Queen et PI567580A ont été extraits à partir de jeunes feuilles (cf. section 2.1.1) et ont été utilisés pour amplifier l’intégralité des 3 séquences F6H1, F6H2 et F6H3 de chacune des variétés étudiées. Pour cela, des amorces spécifiques ont été dessinées (cf. section 2.1.6). Pour les alignements, les trois séquences génomiques Glyma18g08950 (F6H1), Glyma18g08930 (F6H2) et Glyma08g43890 (F6H3), et la seule séquence F6H isolée chez le soja et publiée sous le numéro d’accession GenBank : Y10490.1 ont été utilisées. La longueur des séquences sélectionnées varie entre 2950pb et 3640pb afin d’être suffisamment en amont de la partie 5’UTR (entre 200pb et 500pb) et en aval de la partie 3’UTR (entre 50pb et 500pb). Au vu de la taille de ces trois gènes cibles, chacun d’eux a été amplifié en deux fois (partie A et partie B). Ainsi 6 couples d’amorces spécifiques ont été dessinés (Tableau 7), de façon à ce que leur Tm moyen soit identique (Tm moyen = 59°C). 107 Tableau 7 : Amorces utilisées pour amplifier les séquences génomiques F6H1, F6H2, et F6H3 Tm moyen de chaque couple : 59°C Nom de Amorce l’amplicon Forward F6H1 partie A F6H1 F1 AGTGTCCTCAAACCACTGCAT F6H1 R3 GATTTTGACCGGCTATGTCC 1557 pb F6H1 partie B F6H1 F st2.1 GTATGCTTTACTGCCTTCACACTTTAG F6H1 R st2.1 CAAATGGAGAGTAGGTCCACAGG 2370 pb F6H2 partie A F6H2 AF TGGCTATGCTAACATCCTCGT F6H2 R3 TTGGTGCTTTGGAAGTTGAA 1621 pb F6H2 partie B F6H2 BF CAGGACCACGTACACAATGC F6H2 R6 TGTCGATGCCTATCTTTTTCC 1407 pb F6H3 partie A F6H3 F1 GAGCCTAAATTCAGCGGATCT F6H3 R4 GCAGAATCCACCAATAAGTGTAAG 1985 pb F6H3 partie B F6H3 BF GGAACAGAACAAGCAAACCTG F6H3 R7 TTGATGGAAATGATGGTGGA 1322 pb Séquence 5’3’ Amorce Reverse Séquence 5’3’ Taille de l’amplicon Le mélange réactionnel utilisé est celui avec le Master mix de Promega (cf. section 2.1.6). Les amplifications PCR de ces 3 gènes ont été réalisées dans les conditions suivantes : une dénaturation initiale à 94°C pendant 5 min suivie de 30 cycles consistant en une dénaturation à 94°C pendant 1 min, une hybridation à 59°C pendant 1 min (Tm moyen du couple utilisé) et une élongation à 72°C pendant 3 min (1 min /Kb). Après les 30 cycles, la réaction de PCR se termine par une étape d’élongation à 72°C pendant 10 min. La taille des fragments attendus a été vérifiée sur gel d’agarose (cf. section 2.1.8). Les produits PCR obtenus ont ensuite été clonés dans des vecteurs pGEM-T® et séquencés (cf. sections 2.1.10 et 2.1.11). Trois réplicats ont été réalisés pour chacune des variétés Imari, Queen et PI567580A. Les différents fragments séquencés ont ensuite été analysés et alignés (cf. section 2.3.1) afin de reconstituer l’intégralité des deux séquences génomiques consensus. Au final, pour les trois gènes F6H1 et F6H2, et F6H3, 18 fragments ont été analysés pour chacune des 3 lignées étudiées, soient 54 fragments au total. Les séquences génomiques F6H1, F6H2 et F6H3 des 3 variétés ont été déposées dans Genbank sous les numéros d’accession : JX127148 (Imari), JX127149 (Queen), JX127150 (PI567580A) pour F6H1; JX127151 (Imari), JX127152 (Queen), JX127153 (PI567580A) pour F6H2; et JX127154 (Imari), JX127155 (Queen), JX127156 (PI567580A) pour F6H3. 3.3.2.3 Analyse de l’expression de F6H1, F6H2 et F6H3 par RT-PCR À partir de feuilles de soja élicitées 108 Le premier gène F6H (Y10490.1) a été isolé chez le soja après élicitation par des extraits de levure (Schopfer et Ebel, 1998). Un traitement du même type a donc été adopté pour tenter de détecter d’éventuels ARNm des trois gènes à partir de feuilles des variétés Queen et Imari. choix des éliciteurs : Deux traitements éliciteurs capables d’activer les réactions naturelles de défense de la plante en stimulant la voie des phénylpropanoïdes ont été retenus : la laminarine (SigmaAldrich) et le chitosan (Sigma-Aldrich) (Aziz et al., 2003 ; Khan et al., 2003 ; Rabea et al., 2003). La laminarine, polymère de glucose (β-1,3 glucane) extrait de l’algue marine Laminaria digitata, a été utilisée à une concentration de 200 mg.L-1 dans de l’eau. Après dissolution complète, la solution a été stérilisée par filtration. Le chitosan est un polysaccharide naturel extrait de l’exosquelette de crustacé. C’est une forme désacétylée de la chitine qui est aussi un constituant de la paroi cellulaire de nombreux champignons filamenteux. Le chitosan a été utilisé à une concentration de 20 mg.L-1 dans de l’acide chlorhydrique 0,005N. Le pH de la solution a ensuite été ajusté à 5,5 avec de l’hydroxyde de sodium (NaOH 1M). infiltrations des folioles : Les folioles ont été infiltrées à l’aide d’une aiguille. Un contrôle avec de l’H2O a également été effectué pour évaluer le stress provoqué par l’infiltration en comparaison avec la zone non traitée « NT ». Chacun des trois traitements a été effectué sur deux feuilles d’âge différent en 5 points de piqûres (Figure 41). Figure 41 : Points d’infiltration d’un traitement et les différentes zones de traitement d’une foliole 109 suivi de l’expression par RT-PCR: La RT-PCR est réalisée à partir des ADNc obtenus par rétro-transcription des ARNs extraits à partir de folioles traitées des variétés Imari et Queen (cf. section 2.1.5). Pour obtenir les résultats reflétant le niveau d’expression des gènes, les échantillons ont été ajustés à une même concentration (1,6 µg d’ARN ont servi à la synthèse de 20µL d’ADNc). Les PCR sur ADNc nouvellement synthétisés ont été effectuées sur les 3 gènes cibles F6H1, F6H2 et F6H3, un gène de référence et 2 gènes de contrôles. Le gène de l’ubiquitine considéré comme constitutif et ubiquitaire a été choisi comme référence. Les gènes PAL1 et IFS1 codant respectivement pour la phényl ammonia lyase (PAL) et pour l’isoflavone synthase (IFS) ont été utilisés comme « contrôles». Pour amplifier les séquences, des amorces spécifiques ont été dessinées (cf. section 2.1.6) pour PAL1 (référence Genbank X52953.1) et IFS1 (référence Genbank AF195798) et un couple extrait de la littérature a été utilisé pour la séquence Ubi (Tableau 8). Ces dernières permettent d’amplifier des fragments compris entre 132 et 531pb. Tableau 8 : Amorces utilisées pour l’amplification des transcrits PAL1, IFS1 et Ubiquitine Tm moyen de chaque couple: 56°C Nom de Amorce l’amplicon Forward PAL1 PAL1-F GCCAAAAGAGGTTGAAGGTG PAL1-R IFS1 IFS1-F AAGTAGGAAGGGACCCCAAA Ubi Ubi-F TCTGACACCATTGACAATGTG Séquence 5’3’ Amorce Reverse Séquence 5’3’ Taille de Référence l'amplicon AACCAAAGCTTCTGCAAACAA Genbank X52953.1 422pb IFS1-R CGTACGAAACAAAGACAAATGG Genbank AF195798 531pb Ubi-R CTTCTGGATGTTGTAGTCAGC Subramanian et al.2005 132pb Des amorces spécifiques ont été dessinées (cf. section 2.1.6) pour amplifier chacun des trois gènes F6H1, F6H2 et F6H3 à partir des séquences génomiques. Ces amorces amplifient des fragments courts (entre 227 et 442 pb) à la fin du dernier exon et la partie 3’UTR (Tableau 9). 110 Tableau 9 : Amorces utilisées pour les amplifications des ARNm F6H1, F6H2 et F6H3 Tm moyen de chaque couple: 56°C Nom de Amorce l’amplicon Forward Séquence 5’ 3’ Amorce Reverse Séquence 5’ 3’ Taille de l’amplicon F6H1 F6H1-F GCGAAAAGCAGGGTCATAGT F6H1-R AGCAATGCTGGACATCCTTT 442pb F6H2 F6H2-F TTTGGGTTGACCAATGTTGA F6H2-R AAAGTTTTCTTTATTCTCAGCTCTTTT 227pb F6H3 F6H3-F TTTGGCTTGACCAATGTTGA F6H3-R GCCCCTGTCATGATATCCAA 322pb Les PCR ont été réalisées avec le Master mix de Promega (cf. section 2.1.6) dans les conditions suivantes : une dénaturation initiale à 94°C pendant 5 min suivie de 40 cycles consistant en une dénaturation à 94°C pendant 1 min, une hybridation à 56°C pendant 1 min (Tm moyen du couple utilisé) et une élongation à 72°C pendant 1 min. Après les 40 cycles, la réaction de PCR se termine par une étape d’élongation à 72°C pendant 10 min. L’identité des 3 ARNm amplifiés a été contrôlée sur gel d’agarose et les fragments amplifiés ont été séquencés. À partir de germes et de cotylédons L’expression des trois gènes F6H1, F6H2 et F6H3 a également été suivie par RT-PCR dans les germes à 25 JAF et 40 JAF et les cotylédons à 40 JAF et 50 JAF. Quatre réplicats biologiques pour chacun des compartiments des variétés Queen, Imari, NS Kasha, Dwight+, Dwight – et PI567580A ont été analysés. La RT-PCR est réalisée à partir des ARNs totaux de germes et de cotylédons (cf. section 2.1.5). Pour obtenir les résultats reflétant le niveau de transcription des gènes, la même méthodologie que pour les feuilles élicitées a été appliquée pour calibrer la quantité d’ARNs totaux ainsi que pour les amplifications PCR (mêmes gènes, mêmes amorces, mêmes conditions PCR). 111 112 CHAPITRE III : Étude de l’expression des gènes de la voie de biosynthèse des isoflavones dans les compartiments de la graine 113 1 INTRODUCTION Les graines de soja contiennent de grandes quantités d’isoflavones (génistéine, daidzéine et glycitéine). Selon de précédentes études réalisées au laboratoire, la teneur en isoflavones et leur composition dans les graines de soja présentent une variabilité marquée si l’on considère séparément les deux compartiments de la graine : les cotylédons et le germe. La glycitéine et la daidzéine sont en effet les deux plus importantes isoflavones du germe alors que dans les cotylédons la génistéine et la daidzéine prédominent. De plus, les isoflavones sont quatre à dix fois plus concentrées dans les germes que dans les cotylédons (Rasolohery et al., 2008). Un net décalage de leur accumulation est observé entre ces deux compartiments au cours du développement de la graine. En effet, la teneur en isoflavones ne commence à augmenter dans les cotylédons que lorsqu’elle a atteint son maximum dans les germes (Berger et al., 2008). La voie de biosynthèse des isoflavones est à ce jour bien caractérisée, de nombreux gènes codant pour les principales enzymes de cette voie ont été clonés chez le soja (Dixon et al., 2002 ; Yu et McGonigle, 2005) et la présence de SNPs (Single Nucleotide Polymorphism) corrélés aux teneurs en isoflavones sur les séquences des isoflavone synthases a été soulignée (Cheng et al., 2008). Les expérimentations entreprises visent à lever une partie du voile sur le déterminisme génétique à l’origine des différences rencontrées pour la teneur en isoflavones et leur composition dans les germes et les cotylédons de la graine de soja au cours de son développement. Une meilleure compréhension doit être en effet permise par l’étude du polymorphisme de séquence des gènes IFS1 et IFS2 codant pour les isoflavone synthases, enzymes clefs de la voie de biosynthèse des isoflavones. L’étude porte également sur le suivi de l’expression de ces deux gènes IFS1 et IFS2 et d’autres gènes (CHS, CHR, CHI) situés en amont dans cette voie de biosynthèse, à différents stades critiques de développement pendant la maturation de la graine, dans des variétés très différentes pour leur teneur et leur composition en isoflavones. Ceci doit conduire à une potentielle identification des relations entre l’expression de ces gènes et le contenu et la composition en isoflavones dans les germes et les cotylédons. Ainsi, la problématique consistera-t-elle à évaluer si le polymorphisme de séquence (présence de certains SNPs sur les isoflavone synthases) et/ou si les taux d’expression de 114 certains gènes clefs de cette voie, sont liés aux différences de teneur et composition en isoflavones observées dans ces deux compartiments distincts de la graine de soja. Afin de conforter les travaux antérieurs (Rasolohery et al., 2008) montrant les différences de teneur et de composition en isoflavones ainsi que le net décalage de leur accumulation dans les deux compartiments, les expérimentations ont porté sur deux variétés aux comportements contrastés (Imari et Queen) cultivées en serre et dont les graines ont été prélevées et disséquées à différents stades de développement : de 25 JAF (R5, début du grossissement de la graine) jusqu’à 70 JAF (R8, maturité). Les résultats obtenus ont fait l’objet d’une première publication scientifique insérée dans ce document de thèse : ARTIGOT M-P., DAYDÉ J., BERGER M., 2012. Expression of key genes of the isoflavonoid pathway in hypocotyls and cotyledons during soybean seed maturation. Crop Science (accepté pour publication). 115 2 PUBLICATION SCIENTIFIQUE 116 EXPRESSION OF KEY GENES OF THE ISOFLAVONOID PATHWAY IN HYPOCOTYLS AND COTYLEDONS DURING SOYBEAN SEED MATURATION Marie-Pierre Artigot, Jean Daydé and Monique Berger* Université de Toulouse, Ecole d’Ingénieurs Purpan, Toxalim UMR 1331 INRA/INP/UPS - 75, voie du TOEC - BP 57611 – 31076 Toulouse cedex 3 – France Received ________________________; Corresponding author (m.berger@purpan.fr) 117 ABSTRACT Soybean seeds accumulate large amounts of isoflavones, known for their phytoestrogenic activities. Three isoflavones (genistein, daidzein and glycitein) are found in the seed. They are 4 to 10 time more concentrated in hypocotyls than in cotyledons. Moreover, isoflavone composition markedly diverges between these two seed parts and their accumulation kinetic begin in cotyledons at 40 Days After Flowering (DAF), once accumulation in hypocotyls has plateaued. The relation between the genes of the isoflavonoid pathway and the isoflavone content has been determined through an investigation of i) the variability of IFS genomic sequences in 6 cultivars with contrasted isoflavone content and ii) the expression of key genes in 2 cultivars at 25, 40 and 60 DAF, in hypocotyls and cotyledons. Isoflavone synthases (IFS1 and IFS2) polymorphism was not related to the isoflavone content. The CHS7 and CHS8 expression levels were only related to isoflavone accumulation kinetics in the cotyledons, but not with the total content in the seed at maturity. CHS9 was the most expressed CHS isoform, and the only one correlated with the hypocotyl isoflavone accumulation kinetics. The CHR and CHI expression profiles were significantly different between the two seed parts. These results indicate that isoflavone pathway is under very different regulation control in cotyledons and hypocotyls during the seed maturation. This discrepancy should be taken into account in the studies on genetic and environmental effects on isoflavone contents. 118 INTRODUCTION Isoflavonoids belong to a distinct group of secondary metabolites derived from the phenylpropanoid pathway. These compounds are found predominantly in leguminous plants, and in particularly high level in soybean seeds. They play essential roles in plant environment interactions especially for plant- microbe interaction (Graham and Graham, 1996; Subramanian et al., 2005; Subramanian et al., 2006; Naoumkina et al., 2010). Isoflavones are also extensively studied for their potential role in human health (Messina et al., 2009; Taylor et al., 2009). However, even if their health benefits are generally highlighted, due to their phytoestrogenic activity, it has also been pointed out that they are potentially harmful (Wuttke et al., 2006; Turck, 2007). Moreover, given their metabolism, all the isoflavones may not have the same effect on health (Ruefer et al., 2007; Choi et al., 2008). Three isoflavones (genistein, daidzein and glycitein) are found in the seed. They are four to ten times more concentrated in hypocotyls (embryo axis) than in cotyledons. Additionnally, isoflavone composition markedly diverges between these seed parts: glycitein and daidzein are the most abundant isoflavones in hypocotyls while only genistein and daidzein are found in cotyledons (Tsukamoto et al., 1995; Kim et al., 2007; Berger et al., 2008; Rasolohery et al., 2008). The isoflavone pathway is well characterized, and many of the corresponding genes have been cloned from soybean and other leguminous species (Dixon et al., 2002). The first key enzyme is chalcone synthase (CHS) which produce naringenin chalcone (Yu and Jez, 2008). In soybean, nine genes are known to encode CHS (Tuteja and Vodkin, 2008). These family members exhibit a large similarity of nucleotide sequences in the coding regions (80 to 99%) and play an important role during the plant development or in response to environmental stimuli (Shimizu et al., 1999; Chen et al., 2009; Chen et al., 2011). Recently, CHS7 and CHS8 expressions have been correlated to isoflavone accumulation in the seed (Yi et al., 2010a). Chalcone reductase (CHR) can then produce isoliquiritigenin from naringenin chalcone. This enzyme activity is therefore a crucial step in the 119 determination of the genistein to daidzein ratio (Yu et al., 2000). In soybean, CHR is encoded by a gene family comprising at least 11 putative members (Naoumkina et al., 2010), but only one has been cloned and characterized (Welle and Grisebach, 1989). The chalcone intermediates are converted in liquiritigenin and naringenin, the flavanone precursors of daidzein and genistein, respectively, by chalcone isomerases (CHI). These enzymes are grouped in two classes: the class II CHI genes are more probably those implicated in the isoflavone pathway. The class I CHI can only transform naringenin chalcone whereas the class II CHI also accept isoliquiritigenin (Ralston et al., 2005). The biosynthesis of glycitein is not completely elucidated. However, it is admitted that its flavanone intermediate (6,7,4’trihydroxyflavanone) is produced from liquiritigenin (Latunde-Dada et al., 2001). The isoflavone skeleton is constructed by a cytochrome P450, 2-hydroxyisoflavanone synthase (IFS; isoflavone synthase) which catalyze the C-2 to C-3 aryl migration (Jung et al., 2000). Two genes, IFS1 and IFS2, with a high sequence similarity (93%) have been identified in soybean. The two isoforms can convert naringenin and liquiritigenin in their corresponding isoflavanone, both with a better efficiency for liquiritigenin (Steele et al., 1999; Jung et al., 2000). The glycitein putative intermediate is also converted in its corresponding isoflavanone by IFS2 (Latunde-Dada et al., 2001). IFS1 and IFS2 are expressed in all the plant tissues, with a maximum for IFS1 in root and seed coat, whereas IFS2 is most highly expressed in the seed or in response to elicitation treatment (Dhaubhadel et al., 2003). Environment, genotypes and their interaction are widely recognized for their influence on seed isoflavone content (Lee et al., 2003; Primomo et al., 2005; Rasolohery et al., 2008). However, despite large effects of environment, broad-sense heritability for total or individual isoflavone content is generally found to be high (> 0.70). Several quantitative trait loci (QTL) for individual or total isoflavone concentrations in soybean seeds have recently been discovered (Kassem et al., 2004; Primomo et al., 2005; Zeng et al., 2009; Gutierrez-Gonzalez et al., 2011). All these studies 120 have found many QTL with small individual additive effects, often environment dependent and with AA epistasis, demonstrating the complexity of isoflavone traits. These QTL are generally dependent on the parental lines. Nevertheless, some major QTL have been found in different crosses and environments and genes of the isoflavone pathway have been suggested as candidate genes (Gutierrez-Gonzalez et al., 2010b). On the other hand, a polymorphism study of IFS1 and IFS2 from different Chinese cultivars revealed some causative SNPs that are associated with soybean seed isoflavone levels (Cheng et al., 2008). Previous studies have shown differential expressions of isoflavone pathway key genes in diverse soybean tissues but only a few studies have been conducted on the whole seed at different development stages. These works were done without distinction of hypocotyls and cotyledons (Dhaubhadel et al, 2003, 2007; Chen et al., 2009; Gutierrez-Gonzalez et al., 2009, Yi et al. 2010). Even though it does not impact in a serious manner the seed weight (2.5 %), the hypocotyl can provide up to 20% of the total seed isoflavone. It has been shown that these two seed parts are under distinct control, with different accumulation times and quantities (Berger et al., 2008), different environmental responses (Rasolohery et al., 2008), and weak genetic correlation between cotyledons and hypocotyls contents and profiles (Daydé et al., 2004). Furthermore, their gene expression patterns can widely differ during the seed development, as it has been shown for Kunitz trypsin inhibitor genes (Perezgrau and Goldberg, 1989). In this study, our aims are i) to evaluate IFS1 and IFS2 polymorphisms in cultivars highly differentiated for isoflavone content, taking into account the differences between the seed parts, and to identify potentially related SNPs or indels ii) to follow IFS1 and IFS2 expression in cotyledons and hypocotyls at critical stages during the seed maturation in cultivars differing in their isoflavone content and composition (Berger et al., 2008; Rasolohery et al., 2008) and iii) to investigate the relationships between the expression of upstream key genes in the isoflavonoid pathway (CHS, 121 CHR, class I and II CHI multi-gene family members) and the contrasted isoflavone content and composition of hypocotyls and cotyledons. MATERIALS AND METHODS Plant material and growth conditions Six soybean cultivars have been used: Imari, Queen, Noir de Toulouse, NS Kasha and 2 accessions from the USDA, Soybean Germplasm Collection (Urbana, IL, USA), Qi si mi (PI567580A) and Bai gun dou (PI567417C). Imari, Queen, Noir de Toulouse and NS Kasha were already known for their highly contrasted isoflavone content and composition. The two USDA accessions have been observed during the evaluation of the USDA Soybean Germplasm Collection by R. Nelson (Nelson, personal communication). Plants were sown in March and grown in a greenhouse with natural light at Toulouse, France (43°36'N; 1°24'E). Inoculated seeds with Bradyrhizobium japonicum were planted in 30 cm diameter (5L) pots in a 1:1:1 soil: sand: peat mixture. After germination, two plants per pot were maintained. The 36 pots (6 per cultivar) were completely randomized. Irrigation was given as necessary to avoid water stress, and twice a week, the plants were fertilized with 200mL of a solution of N:P:K and micro elements (modified Hoagland solution with half strength N). Sampling Young leaves were harvested on three plants per cultivar. They were immediately flash frozen in liquid nitrogen and stored at -80°C till genomic DNA extraction. Seeds of Imari and Queen were regularly harvested during their maturation at six development stages, from 20 DAF to the complete maturity (70 DAF). Each sample was made of 10 seeds collected at the same stage on 6 different plants of the same cultivar, at the same time, a duplicate (twin) was made with 10 seeds of the same pods and this was replicated on 6 other plants. Upon harvest, cotyledons and hypocotyls were rapidly separated by hand and flash frozen with liquid 122 nitrogen. Two samples of dissected cotyledons and hypocotyls were freezed-dried, weighed, and kept at -20°C until the isoflavone analysis. Their “twins” were stored at -80°C until further use for gene expression analysis. Isolation of IFS1 and IFS2 genomic sequences Total genomic DNA was extracted from 100mg of leaf tissue, using the DNeasy Plant Mini Kit (Qiagen, Courtaboeuf, France) according to the manufacturer’s recommendations. The concentration of DNA was determined at 260nm with a NanoDrop ND-1000 UV-Vis spectrophotometer (NanoDrop Technologies, Wilmington, DE, USA). Specific primers were designed using Primer3 software version 0.4.0 (http://frodo.wi.mit.edu/primer3/) (Rozen et Skaletsky, 2000). Two primer sets were designed. The forward primers were designed on 5’specific untranslated region (UTR) (700bp upstream the start codon for IFS1 and 1000bp for IFS2) and the reverse on 3’UTR (100bp downstream the stop codon) to amplify specifically the whole IFS1 (2588bp) and IFS2 (2877bp) genes and a significant fraction of the promoter. Primer sets were as follows: (F: 5’-AACACAAGCAAGGGCTTTAGG-3’/ R: 5’-CATAAAAAGCAACTGCGATGG3’), annealing temperature 61°C, and (F:5’-GCAAAGAGAACCAAAACAAAATTTG-3’/ R: 5’GATGAACGAGACCTTATTGAAATGATG-3’), annealing temperature 62°C for IFS1 and IFS2, respectively. PCR were conducted in a 50µl reaction volume by using 2.5 units of Taq DNA polymerase (Invitrogen, Carlsbad, USA) following manufacturer’s recommendations with a GeneAmp PCR System 9700 thermocycler (Applied Biosystems, Forster City, USA). Thermocycling was performed as follows: an initial denaturation at 94°C for 5 min, 30 cycles consisting of denaturation at 94°C for 45 s, annealing at 61°C (i.e., IFS1) or 62°C (i.e., IFS2) for 1min, and extension 72°C for 3 min. After the cycles the PCR reaction ended with an extension at 72°C for 10 min. The expected length of PCR products was checked on a 0.8% agarose gel under UV light after SYBR Gold staining. 123 PCR products were ligated in the pCR2.1-TOPO vector (Invitrogen, Carlsbad, USA) for amplification in TOP10F’ E.coli competent cells (Invitrogen, Carlsbad, USA). Plasmids were purified by using the GenElute Plasmid Miniprep kit (Sigma-Aldrich). Miniprep-purified plasmids were sequenced on both strands with M13F and M13R and internal specific primer sets on a 3130 XL automated DNA sequencer (Applied Biosystems, Forster City, USA). Three replicates based on three different PCR were realized by gene and by cultivar. Sequenced fragments were analyzed on BioEdit (Hall, 1999) and assembled using Multalin (http://multalin.toulouse.inra.fr/multalin/) (Corpet, 1988). Chemicals used in HPLC HPLC grade acetonitrile and methanol were purchased from SDS (Peypin, France). Deionized water was generated from a Milli-Q analytical deionization system (Millipore, Saint Quentin Yvelines, France). Purified standards of genistein, daidzein, glycitein, and of their 7-Oglycoconjugates, genistin, daidzin and glycitin were purchased from Chromadex (Santa Ana, CA, USA). Isoflavone extraction and HPLC analysis The harvested freeze-dried hypocotyls and cotyledons were ground in liquid nitrogen using ceramic mortars and pestles. Duplicate aliquots of each finely powdered sample (0.1 g particles Ø <0.200mm) were extracted with 80% aqueous methanol for 2h at room temperature (50mg powder in 1ml for cotyledons and 2mg in 100 µL for hypocotyls). The residue was removed after centrifugation 10 min at 12000g and decantation of the clear supernatant. The supernatant was filtered (0.2 μm, Acrodisc Syringe Filters, GHP membranes) and analyzed by HPLC with a P4000 pump controller, AS3000 autosampler (Spectra Physics Analytical Inc., Fremont, California, US) and an UV 340 detector (Dionex, Voisins Le Bretonneux, France). The analytical C18 column, 35 x 4.6 mm i.d., 1.5 µm, Turbo80-ODS (Cluzeau, Sainte Foy La Grande, France) was kept at 30°C. The mobile phases were 0.05% (v/v) trifluoroacetic acid in water (solvent 124 A) and acetonitrile (solvent B) with a 12 min multistep gradient elution. Solvent B increased from 0 to 16 % in 2 min, then to 24 % in 4 min, to 32% in 3 min, and finally increased to 100% in 1 min. The gradient program recycled back to the initial state of 100% solvent A in 2min. UV absorbance was monitored at 260 nm. The injection volume was 2 μL and the flow rate was 1.3 mL. min-1. Identification and quantification of each isoflavone component were realized as previously described in Hubert et al. (2005). RNA isolation and cDNA synthesis Each sample (50 mg of flash-frozen tissue) for gene expression analyses was ground using Fastprep lysing matrix tubes (MP Biomedicals, France) with a FastPrep®-24 system (MP Biomedicals, France). Total RNA was isolated from each sample with 1ml of QIAzol reagent (Qiagen, Courtaboeuf, France) by standard isopropanol-chloroform precipitation. The resulting RNA pellets were washed with 75% ethanol and resuspended in RNase free water. RNA concentration was measured using a NanoDrop ND-1000 UV-Vis spectrophotometer (NanoDrop Technologies, Wilmington, DE, USA). The quality and the integrity of RNA was determined with the 260 : 280 nm and 260 : 230 nm absorbance ratios and checked on 1.2% agarose gel electrophoresis (Sambrook et al., 1989), prior to DNase digestion. For each sample, 2µg of total RNA was digested in a volume of 20 µL with RNase-Free DNase I (Qiagen, Courtaboeuf, France) to remove genomic DNA contamination according to the manufacturer’s instructions. After DNase I digestion, RNA concentration was determined again with the NanoDrop spectrophotometer, and first-strand cDNA synthesis was performed using 2 µg of DNase-treated total RNA in a 20 µL reaction using an High Capacity cDNA Archive Kit (Applied Biosystems, Forster City, USA), following the manufacturer’s instructions. RT- controls were identical to cDNA reactions, except that water was added to the solution instead of reverse transcriptase. All cDNA samples were diluted 1:5. 125 Primer Design The expression of 14 genes was followed: nine genes coding for chalcone synthases CHS, (Clough et al., 2004; Tuteja and Vodkin, 2008) (i.e., CHS1, CHS2, CHS3, CHS4, CHS5, CHS6, CHS7, CHS8, CHS9), four genes coding for chalcone isomerases CHI, (Ralston et al., 2005) (i.e., CHI1A, CHI2, CHI1B1, CHI1B2), the two isoflavone synthases IFS (Subramanian et al., 2004) (i.e., IFS1, IFS2) and one for chalcone reductase CHR (Welle and Grisebach, 1989). Based on soybean mRNA sequences published in National Center for Biotechnology Information (NCBI) Genbank (Table 1), specific primer pairs for corresponding genes were designed using Primer Express software Version 2.0.0 (Applied Biosystems, Forster City, USA). For IFS1 and IFS2 primer sets, mRNA sequences of Imari and Queen cultivars (i.e., JN133900, JN099682, JN133902, and JN133901 GenBank accession numbers in this study) were used. Specific Primer pairs were defined to amplify 51 bp to 136 bp fragments. Primer specificity was confirmed theoretically by blasting primer sequence against soybean genome sequences at Phytozome (http://www.phytozome.net/) using the BLASTN algorithm, and experimentally by obtaining unique amplification products as evidenced by dissociation curve peaks. All products were sequenced and compared with the target gene (Table1). RT-qPCR RT-qPCRs were performed in 96-well plates using the CFX96 real-time PCR detection system (Bio-Rad, Hercules, CA, USA). IQ SYBR Green Supermix (Bio-Rad, Hercules, CA, USA) was used for real-time DNA quantification following the manufacturer’s recommendations. Each run includes a negative control without cDNA template for each primer combination. Two biological replicates and three technical replicates for each of them were performed. A 900 nM primer concentration and 5µL of prepared cDNA (5-fold dilution) were used in a final volume of 25 µL per well. PCR conditions for all genes were set up as follows: 95°C for 3 min, followed by 40 cycles of amplification at 95°C for 10 s for denaturing, 60°C for 30 s for a combined annealing/ 126 extension step. Following amplification, a melting curve program (60 to 95°C with a heating rate of 0.5°C s-1) was added. Relative Gene Expression Analysis in RT-qPCR Housekeeping genes were used for the normalization of the expression of the target genes. According to a previous study, the soybean genes encoding actin and β-tubulin were selected (Gutierrez-Gonzalez et al., 2010a). The software Best-Keeper (Pfaffl et al., 2004) (http://genequantification.com/bestkeeper.html) was used to determine which of the HKGs is most suitable and can be used for the normalization of the target gene expressions. Compared with actin, transcripts levels obtained for β-tubulin gene exhibited the lowest variation with a standard variation (SD) <1 and a coefficient of variation of 1.79 (vs 2.2 for actin). Thus, the relative transcript levels of the target genes were estimated by normalizing them against β-tubulin. Data was analyzed with the LinReg PCR software (v11.0, university of Amsterdam, Amsterdam, Netherlands), (Ruijter et al., 2009). Statistical Analyses Isoflavone concentration (in µmol.g-1) and normalized relative gene expression were analyzed following the general linear model with XLSTAT 2011 (Addinsoft, Paris, France) to identify significant cultivar and stage main effects and their interaction. Tukey’s tests were made on cultivar x stage interaction means. 127 RESULTS Isoflavone synthase genomic sequences between contrasted cultivars The two genomic sequences obtained for the 6 cultivars included a 5’ upstream flanking portion of the promoter region, the 5’UTR, and terminated in the 3’UTR (as predicted in phytozome). Despite their highly contrasted isoflavone contents (Table 2), the 6 cultivars did not display a great variability in their genomic IFS1 and IFS2 sequences. They have been separated in two groups (Table 3 and 4): on the one hand Imari, Queen, Noir de Toulouse and PI567580A (allele 1) and on the other hand NS Kasha and PI567417C (allele 2). In the IFS1 sequence (Table 3), the allele 1 had a higher similarity with Williams 82 (Glyma1 soybean reference sequence assembly in Phytozome, (Schmutz et al., 2010)) than the allele 2. Most of the differences were in the promoter region. Only three SNPs have been found in the coding region: in the first exon at position 1561 (Glu 265 Gly) for the allele 1 and two SNP in the second exon for the allele 2 (synonymous mutations on Thr 309 and Thr 498 codons). The polymorphism was lower in IFS2 (Table 4). It has been exclusively found in non-coding regions. The allele 1 had less similarity with Williams 82 than the allele 2. However, the isoflavone content (Table 2) was not correlated with the allelic forms of the isoflavone synthases. Queen, NS Kasha and Noir de Toulouse accumulated twice as much isoflavones as Imari in their cotyledons whereas PI567417C had very low isoflavone content (10 times less than Imari). In hypocotyls, the isoflavone content was between 2.53 and 15.09 µmol.g-1. Accumulation of isoflavones in the seed fractions The accumulation of total isoflavones has been monitored separately in the hypocotyls and cotyledons in Imari and Queen from 25 to 70 DAF (Figure 2). In the cotyledons, the total isoflavone content at maturity was significantly lower in Imari than in Queen (0.6 µmol.g-1 vs 1.5 µmol.g-1, respectively). In the two cultivars, the isoflavone accumulation began in cotyledons after the 40 th DAF. In contrast, the isoflavone accumulation began very early in the hypocotyls and the content was very high. As soon as 25 DAF, the total isoflavone content has already reached 5.3 µmol.g-1 128 and 3.3 µmol.g-1 in Queen and Imari, respectively. Thus, it was quite stable from 32-40th day after flowering and yielded values around 10 µmol.g-1 at maturity. Expression of isoflavone synthase genes Since these two genes have the same sequence in the two cultivars, they may be expressed differently during the seed maturation. The dramatic differences between hypocotyls and cotyledons were exploited to investigate the relation between isoflavone accumulation and the relative expression of the two isoflavone synthase genes. According to the time course of the accumulation (Figure 2) three critical stages of the seed development were selected for gene expression studies : i) at 25 DAF, when isoflavone accumulation began in hypocotyls more than ten days before its beginning in cotyledons; ii) at 40 DAF, when it reaches its maximum in hypocotyls and just began in the cotyledons; and iii) at 60 DAF, when it reaches its maximum in the cotyledons. Isoflavone synthase expression was correlated with the accumulation in the cotyledons and it was slightly higher for IFS2 than IFS1 (Figure 3). In the cotyledons, according to the isoflavone accumulation, the IFS1+IFS2 expression level had a 5-fold increase between 25 and 40 DAF, and again a 5-fold increase between 40 and 60 DAF. However, the expression levels of the IFS were not correlated with the total isoflavone content in the seed, neither at the seed fraction level (very low expression in hypocotyls), nor at the cultivar level (the difference between IFS1+IFS2 relative expression was not significant between Imari and Queen). Expression of chalcone synthase genes Beside their contrasting total isoflavone content, seed fractions as well as cultivars display distinctive ratios of individual isoflavones (Table 5), in agreement with previous studies (Berger et al., 2008; Rasolohery et al., 2008). There was only daidzein and genistein in cotyledons, with a slightly higher proportion of genistein in Imari than in Queen. Glycitein was found only in the hypocotyls, particularly in high levels in Queen, whereas genistein represented about 10% of the total isoflavones. 129 The 9 genes coding for chalcone synthase have been followed (Figure 4). The CHS1 to CHS6 relative expression levels were very low compared to those of CHS7, CHS8 and CHS9. However, CHS1, CHS2 and CHS3 were indubitably induced in the cotyledons of Imari (a 2.5-fold increase of CHS3 at 40 DAF, and another 8-fold increase between 40 and 60 DAF, in contrast with the 3-fold decrease observed in Queen). These 3 CHS genes were less expressed in the hypocotyls. The relative expression of CHS4, CHS5 and CHS6 was low and equivalent in cotyledons and in hypocotyls. The last three CHS genes were highly expressed: the relative expressions of CHS7 and CHS8 were correlated with the accumulation of isoflavones in the cotyledons. However, this is not the case for the hypocotyls. CHS9 was for far the most abundant transcript in the two seed parts, and decreased from 25 DAF to the end of maturity. This profile is consistent with the isoflavone accumulation in the hypocotyls. The difference between Queen and Imari was significant in cotyledons at 25 DAF (p<0.05). The decrease was more pronounced in the hypocotyls (70 to 80% decrease between 25 and 40 DAF for Queen and Imari, respectively) than in the cotyledons. Expression of chalcone reductase Chalcone reductase activity is necessary to the biosynthesis of daidzein and glycitein, which both represent almost 90% of the isoflavones in hypocotyls, Accordingly, the highest expression of CHR was observed in hypocotyls at 25 DAF (significantly different from the other stages and from the expression in cotyledons at all the stages, p< 0.001) when the accumulation of isoflavones was very active in this seed fraction (Figure 5). The CHR expression then decreased (90 % between 25 and 40 DAF). Strikingly, a significant difference was observed between Imari and Queen in cotyledons at 60 DAF (p=0.044). However, this induction could not be related to daidzein accumulation (Table 5: 36.8% vs 43.6% of the total isoflavones for Imari and Queen, respectively). 130 Expression of chalcone isomerase genes The chalcone isomerase is responsible for the formation of the two flavanones precursors of genistein and daidzein. However, this enzyme competes with the chalcone reductase for naringenin chalcone, and may therefore contribute to the genistein to daidzein ratio in a complex manner. Three of the four CHI genes studied (CHI1A, CHI1B1 and CHI1B2) encode class II chalcone isomerases, which accept naringenin chalcone and isoliquiritigenin, whereas CHI2 belong to the class I, specific to naringenin chalcone (Ralston et al., 2005). CHI1A had the highest level of expression. At 25 DAF, its relative expression in the hypocotyls was very elevated in Imari, but not significantly different from that of Queen (p=0.056). The difference with the cotyledons was not significant either (p=0.077 and p=0.156 with Queen and Imari, respectively). However, there was a clear decrease in the hypocotyls during the maturation of the seed, with a 95% and 50% decrease in Imari and Queen, respectively, between 25 and 40 DAF. This decrease was also observed in the cotyledons of Imari (80%) at 40 DAF. Interestingly in cotyledons, an induction of the gene was observed between 40 and 60 DAF, corresponding to the highest activity of isoflavone accumulation in this seed part. The expression of CHI1B1 paralleled that of CHI1A in hypocotyls, with a 80% decrease between each stage in the two cultivars (significant for all, p<0.05), but in contrast to CHI1A, it did not increase in cotyledons. The expression of CHI1B2 was induced in the cotyledons of Queen, with a 2-fold increase between 25 and 40 DAF, and a 5.7-fold increase between 40 and 60 DAF (highly significant, p<0.01). At the same time, the expression decreases in the hypocotyls. CHI2 had a low relative expression and a constant decrease in the two seed parts during the seed maturation. 131 DISCUSSION The flavonoid pathway intermediates are common precursors of many secondary metabolites (Winkel-Shirley, 2001; Yu and Jez, 2008). Thus, isoflavone synthase which catalyzes the first step of the isoflavone pathway could be a bottleneck in the pathway. The polymorphism already found in IFS1 and IFS2 coding sequences (Kim et al., 2005) has not been correlated with the isoflavone content. However, another study on more contrasted cultivars including non-coding upstream regions has found 5 SNPs correlated with isoflavone content (Cheng et al., 2008). According to these previous studies, IFS2 displayed less polymorphism than IFS1 (Cheng et al. 2008). Interestingly, the specific mutations found in IFS1 allele 2 vs allele 1 were also found in 6 of the 17 Chinese Glycine max cultivars studied by Cheng et al., (2008). Likewise, 4 of these 17 cultivars also had the IFS2 allele 2, and one of them had the IFS1 and IFS2 allele 2. Though the 18 Korean Glycine max cultivars studied by Kim et al. (2005) were only sequenced on their coding regions, they also displayed the two IFS1 alleles: 3 of them had the 1561G>A SNP (allele 1) and 4 displayed the 1914T>A SNP (allele 2). In the same manner, we did not found any relation between these two allelic forms and cultivar differences in isoflavone content. Furthermore, none of the 5 SNP previously found correlated with isoflavone content (Cheng et al., 2008) have been observed in the 6 cultivars studied here. The IFS2 gene is most expressed in the developing seed and related with isoflavone accumulation (Dhaubhadel et al., 2003; Gutierrez-Gonzalez et al., 2010a). This is consistent with a colocalization recently found of this gene with a QTL for isoflavone content (Gutierrez-Gonzalez et al., 2010b). Despite their common IFS1 and IFS2 sequences, Imari and Queen displayed highly contrasted phenotypes. However, while these differences cannot be related to the protein sequence, any nondetected variations in the genomic sequence may modulate the expression level of the transcripts. In this study, the relative expression levels observed did not significantly differ between the two cultivars. Moreover, the relative expression at 60 DAF in the cotyledons was in favor of Imari, 132 which had the lowest isoflavone content. Thus, neither the sequence, nor any transcriptional or post transcriptional activity could explain any limiting effect of isoflavone synthase in this study. The finding of SNP related to isoflavone content in these two genes, as well as the multiple cultivar dependent QTLs and AA epistatic effects found in previous studies (Kassem et al., 2004; Primomo et al., 2005; Zeng et al., 2009; Gutierrez-Gonzalez et al., 2011) indicate that the regulation of this pathway is highly complex and can vary with the genotypes. Strikingly, the expression profile of IFS1 and IFS2 in hypocotyls was rather low and followed more the isoflavone accumulation in the cotyledons than in the hypocotyls. This corroborates the hypothesis of a separated regulation of the isoflavone pathway in these two seed parts (Berger et al., 2008) and probably a large part of post-translational regulations which could be related to the integration of these enzymes in multienzymatic complexes. As it has previously been reported, the chalcone synthases CHS7 and CHS8 expression are related with total isoflavone content in the cotyledons which represent the major part of the seed (Dhaubhadel et al., 2007; Yi et al., 2010a; Yi et al., 2010b). However, contrary to Chen et al. (2011), we did not found any relation with the isoflavone content of the cultivars. Furthermore, the expression of these genes was not correlated with the profile of the intensive isoflavone accumulation in the hypocotyls. This suggests wide differences between these two seed parts. This study was also the first to follow CHS9 expression. This gene was highly expressed in cotyledons and in hypocotyls. Moreover, it was the only CHS gene correlated with the isoflavone content in the hypocotyls. In the cotyledons, the decrease was less intense than in hypocotyls. Remarkably, it was also more expressed in the cotyledons of Queen, which has the higher isoflavone content. Thus a possible implication of CHS9 in the isoflavone pathway must be investigated. The chalcone reductase activity is required for the biosynthesis of daidzein, and probably also for glycitein (Latunde-Dada et al., 2001). Thus, in hypocotyls, 90% of the isoflavones may be dependent on the CHR activity. Accordingly, in this study, the followed CHR expression was 133 correlated with isoflavone accumulation in the hypocotyls. The same gene displayed an early expression in the whole seed in a recent study (Gutierrez-Gonzalez et al., 2010a). The differential expression of this gene in the two seed fractions may be responsible for inconsistent results previously observed (Dhaubhadel et al., 2003; Chen et al., 2011). The chalcone isomerase genes studied here encompassed the two CHI gene classes. The class I gene CHI2 was the less expressed, and had a decreasing expression during the seed maturation. When heterologously expressed in yeast, this gene only converted naringenin chalcone whereas the class II genes were able to convert isoliquiritigenin (Ralston et al., 2005). The three other CHI genes studied here belong to the probably most involved group in the isoflavone pathway. CHI1A was highly expressed in the two seed parts. In hypocotyls, its expression profile coincided with the accumulation of isoflavones. In cotyledons, a decrease between 25 DAF and 40 DAF was followed by an increase in the late maturation stage. This gene was induced in early seed maturation and was stimulated by long term progressive water stress in Williams 82 (Gutierrez-Gonzalez et al., 2010a). The two other forms, CHI1B1 and CHI1B2 had yet never been followed independently in the same study. A transient induction of CHI1B1 in the late R5 stage has been observed in the cultivar Williams 82 (Gutierrez-Gonzalez et al., 2010a). In this study, the expression of CHI1B1 corresponded to the hypocotyl activity while CHI1B2 was induced at 60 DAF in the cotyledons of the cultivar having the highest isoflavone content. Therefore, the implication of these two chalcone isomerases in the isoflavonoid pathway could be the result of a distinct regulation of the isoflavone biosynthesis pathway in the two seed parts. In conclusion, this study has highlighted the existence of two allelic forms of IFS1 and IFS2. However, this polymorphism was not correlated with isoflavone content. The comparison of two contrasted cultivars for total isoflavone contents carrying the same IFS1 and IFS2 alleles pointed out that this phenotype is not correlated with a differential expression of the isoflavone synthase genes. This first CHS9 expression report has revealed that it was the most expressed chalcone 134 synthase isoform in the seed. Moreover, the CHS9 expression coincided with the accumulation profile of isoflavone in hypocotyl. Finally, hypocotyls and cotyledons appeared under highly differentiated expression patterns. Thus, we could confirm that CHS7 and CHS8 expressions were correlated with isoflavone accumulation in cotyledons, but it was not the case in hypocotyls. The comparison of the two seed fractions in contrasted cultivars also supports the hypothesis that CHR expression is related to the biosynthesis of daidzein. Besides, the class II CHI may also be involved in the specific isoflavone profiles in cultivars and/or seed fractions. Acknowledgements: This project was supported by research grants from the «Midi-Pyrénées Région» and its health-food network. The authors thank Pr Randall Nelson, curator of the USDA soybean germplasm collection (Urbana, IL), for the supply of the two accessions used in this study and the French group Euralis Semences for the supply of their germplasm accessions NS Kasha and Noir de Toulouse. 135 REFERENCES Les références bibliographiques de cette publication sont citées dans la partie « Références Bibliographiques » à la fin de ce manuscrit. 136 FIGURES Figure1: Simplified representation of isoflavone biosynthesis in soybean showing key intermediates and enzymes. CHS: Chalcone synthase; CHR: chalcone reductase; CHI: chalcone isomerase; IFS: isoflavone synthase – actually a 2 hydroxyisoflavanone synthase; HID: Hydroxyisoflavanone dehydratase producing the final isoflavone; F6H: flavanone 6 hydroxylase; IOMT: putative 2,6,7 trihydroxyisoflavanone 6 O-methyl transferase Figure 2: Total isoflavone accumulation in seed fractions during maturation, from 25 to 70 days after flowering (DAF), for two French cultivars, Imari (○) and Queen (●). Means ± Standard deviations (n=2 samples of 10 seeds). 137 Figure 3: Isoflavone synthase (IFS) isoforms expression in seed fractions during seed maturation (at 25, 40 and 60 days after flowering) in two cultivars, Imari and Queen. Relative transcript ratio represents number of target gene mRNA copies relative to β-tubulin. Means ± Standard deviations Figure 4: Chalcone synthase (CHS) isoforms expression in seed fractions (top = cotyledons and bottom = hypocotyls) during seed maturation (at 25, 40 and 60 days after flowering) in two cultivars, Imari and Queen (Left: CHS1 to CHS6 and right: CHS7 to CHS9). Relative transcript ratio represents number of target gene mRNA copies relative to β-tubulin. Means ± Standard deviations. 138 Figure 5: Chalcone reductase (CHR) expression in seed fractions during seed maturation (at 25, 40 and 60 days after flowering) in two cultivars, Imari and Queen. Relative transcript ratio represents number of target gene mRNA copies relative to β-tubulin. Means ± Standard deviations. Figure 6: Chalcone isomerase (CHI) isoforms expression in seed fractions during seed maturation (at 25, 40 and 60 days after flowering) in two cultivars, Imari and Queen. Relative transcript ratio represents number of target gene mRNA copies relative to β-tubulin. Means ± Standard deviations. 139 TABLES Table 1: Primers designed and used in real-time quantitative reverse transcription-polymerase chain reaction (RT-qPCR) for selectively amplifying genes of the isoflavone pathway and housekeeping genes in soybean hypocotyls and cotyledons. CHS: chalcone synthase, CHI: Chalcone isomerase, CHR: chalcone reductase, IFS: isoflavone synthase. CHS1, CHS2 and CHS3 primer sets were extracted directly from literature (Tuteja et al. 2004) GenBank Target Primer accession number gene(s) name for target gene Forward and reverse primer sequences (5’to 3’) PCR product size Ampliand location of con primers Tm (°C) CHS1 DQ239918 CHS1-F CHS1-R GCAAGAGAACAAATCTTTCTTTTTTCATAT CAGAAGCATTTGCAGGGCA 104bp pos. 1166 to 1269 78 CHS2 X65636.1 CHS2-F CHS2-R ACAACAAATCTTTCTTTTTTCATATGTATTG GAAGGCAGGGCAGGGAA 85bp pos. 2060 to 2145 76 CHS3 X53958.1 CHS3-F CHS3-R CCAAGTCCTTTTCTTTCTTATTCATTC AGAAGCATGTGAGGGAAGCAG 95bp pos. 1544 to 1639 75.5 CHS4 X52097.1 CHS4-F CHS4-R CACTTTGCAACATCCATCCAAG CTGGAGCAAAGGATGAAAGTGA 71bp pos. 782 to 852 76.5 CHS5 L07647.1 CHS5-F CHS5-R TGAGCCACTTTGCCACATTC GCACGAAAGAAAAGGGTATGAGG 51bp pos. 444 to 494 76.5 CHS6 L03352.1 CHS6-F CHS6-R CATCGATCCCCATCATTCATATC CCAAGAATTAATGAAACTCAAGTAGTAGTAGC 72bp pos. 529 to 600 74 CHS7 M98871.1 CHS7-F CHS7-R CAAATCGCATTGGTATCTGAAATC TGATCTCAGCTACGCTAACCATCT 53bp pos. 767 to 819 74.5 CHS8 AY237728.1 CHS8-F CHS8-R TTCTGAATATCATCACTTAATTTGAAGGAA TCTCAGCTACGCTCACCATCTTT 51bp pos. 804 to 854 72 CHS9 EF623853.1 CHS9-F CHS9-R GAACCTACCCACCCTTTTCAGTTA TGGAAAGTGTCTTGGAATGTTGG 58bp pos. 1967 to 1755 75 CHR X55730.1 CHR-F CHR-R CTGACTTCACATGCAAGAAAGACA CTGTTTCACGGCCTCAATGAT 53bp pos. 99 to 154 76 CHI1A AY595413.1, DQ835284.1 CHI1A-F CHI1A-R CTTAAAACGCAGTTTGGCTTCTC CTATAATGCCGTGGCTCAATACC 56bp pos. 849 to 904 79 CHI2 AY595415.1 CHI2-F CHI2-R TCCAGATTATCTCACTTATTCAAAGAGC GAGTTCACTTATGAGATTGAGGGTCAC 64bp pos. 627 to 690 75.5 CHI1B1 AY595414.1 CHI1B1-F CHI1B1-R AACATTGAAAACTGAGAGTTGCAGC AGGTCTTCTAAAGATAGTTGGCAACTG 51bp pos. 728 to 778 74 CHI1B2 AY595419.1 CHI1B2-F CHI1B2-R AAGAGTTAGAGGCCAATCCCAAC GTCCCCTAAAGATTGTTCTCAGTTTT 53bp pos. 650 to 702 74.5 IFS1 this study: JN099682, JN133900 IFS1-F IFS1-R GCAAATCAAGGGCCTTGTTGT GAGCCTTTTGCAACACCCTG 116bp pos. 895 to 1010 83.5 IFS2 this study : JN133901, JN133902 IFS2-F IFS2-R ACCAAGGACCACATCAAGGGT ACGAGCCTTTTCCAACACCTTA 126bp pos. 1969 to 2094 83 ATGTGTGCTGCTGATCCTCG CCACCTCCTTTGTGCTCATCTT 82bp pos. 989 to 1070 81.5 TTGTTGGCCGACCTCGAC CAGTTGCTGACTATACCATGCTCAAT 136bp pos. 107 to 242 80 β-tubulin X60216.1, M21296.1, β-tubulinF M21297.1, U12286.1 β-tubulinR Actin V00450.1, J01298.1 Actin-F Actin-R 140 Table 2: Isoflavone content in the seed parts and Genbank accession number for IFS1 and IFS2 for the 6 cultivars used. The standard error of the means has been calculated with the ANOVA residual square. Total isoflavones (µmol.g-1) Cultivar Hypocotyl Genbank accession Cotyledons IFS1 IFS2 PI567580A 8.81 0.94 JQ934955 JQ934959 PI567417C 2.53 0.05 JQ934957 JQ934961 Imari 10.01 0.61 JN099682 JN133901 Queen 11.05 1.49 JN133900 JN133902 Noir de Toulouse 15.09 1.89 JQ934954 JQ934958 NS Kasha 12.50 1.67 JQ934956 JQ934960 1.72 0.35 Standard Error Table 3: Comparison of nucleotide sequences of IFS1 gene of 6 soybean cultivars with Williams 82 (Glycine max sequence on Phytozome v8.0) A A T T T C G G C C --------------------- A G A C G TT G A A PI567580A T T T C G G C C Williams 82 T T - C G G C C ----------------------------------------- A G A C G - A A T G TT TT G A A A A A NS Kasha C C T A A A A T TAATAATTAATAACTAAAATA A A G C A A- A T G PI567417C C C T A A A A T TAATAATTAATAACTAAAATA A A G C A Gene Structure 458 G 300 TT 256 A G A C G 254 --------------------- 228 T T T C G G C C 183 Queen Noir de Toulouse 174 A A 165 G 141 TT 125 A G A C G 64 --------------------- 61 T T T C G G C C 36 1914 614615 Imari 207-227 2481 Position 1561 Name AA T G 595- 770- 1886769 1667 2553 5’UTR Exon1 Exon2 141 Table 4: Comparison of nucleotide sequences of IFS2 gene of 6 soybean cultivars with Williams 82 (Glycine max sequence on Phytozome v8.0) 2815-2823 2831 2880 Position 556 Name A --------- A G TT A --------- A G TT A --------- A G TT A --------- A G Williams 82 AG - GTCATCATC G A NS Kasha TT - GTCATCATC G G PI567417C TT - GTCATCATC G G 2-3 Imari TT Queen Noir de Toulouse PI567580A 9721101 5’UTR Gene Structure 11021998 Exon1 19992134 Intron 21352803 Exon2 3’UTR Table 5: Isoflavone composition of the seed fractions in the cultivars Imari and Queen. For each isoflavone, the conjugated and aglycones form has been summed and expressed in % of total isoflavones (µmol). Seed part Cultivar Cotyledons Hypocotyls % Genistein % Daidzein % Glycitein Imari 63.2% 36.8% - Queen 56.4% 43.6% - Imari 10.8% 51.0% 38.2% Queen 10.5% 29.8% 59.7% 142 3 SYNTHESE ET CONCLUSION Les résultats obtenus dans cette première partie des travaux de thèse permettent d’accéder à une meilleure compréhension du déterminisme génétique de la compartimentation des isoflavones dans la graine de soja. Ceci a tout d’abord été permis par l’étude du polymorphisme des séquences génomiques des gènes IFS1 et IFS2 ainsi que leur suivi d’expression dans les deux compartiments de la graine, germes et cotylédons, à différents stades critiques pendant la maturation de la graine dans des variétés très différentes pour leur contenu et leur composition en isoflavones. Puis, d’autres éléments ont été apportés par l’étude des relations entre l’expression des gènes codant pour des enzymes clefs (CHS, CHR, CHI) situées en amont dans la voie de biosynthèse et l’accumulation des isoflavones dans les germes et les cotylédons. Cette approche a effectivement mis en évidence l’existence de deux formes alléliques des séquences IFS1 et IFS2. Cependant, conformément à Kim et al. (2005b) nous n’avons pas trouvé de liaison entre ce polymorphisme et le contenu en isoflavones. De plus, aucun des 5 SNPs précédemment identifiés comme étant corrélés avec le contenu en isoflavones (Cheng et al., 2008) n’ont été observés ici. La comparaison des variétés Imari et Queen différenciées par leur contenu en isoflavones totales, portant les mêmes allèles IFS1 et IFS2, démontre que ces deux phénotypes ne sont pas dépendants d’une expression différentielle des gènes codant pour les isoflavone synthases (IFS). En effet, l’expression relative des gènes IFS1 et IFS2 dans les cotylédons à 60 JAF est en faveur de la variété Imari qui possède le plus faible contenu en isoflavones. L’activité transcriptionnelle de ces deux gènes ne semble donc pas pouvoir expliquer les différences de teneur en isoflavones de ces deux variétés. D’autre part, la comparaison des deux compartiments (germes et cotylédons) montre que les taux d’expression des gènes IFS1 et IFS2 sont assez faibles dans les germes. En revanche, dans les cotylédons les taux d’expression suivent plutôt l’accumulation des isoflavones. Ceci corrobore l’hypothèse d’une régulation séparée de la voie de biosynthèse des isoflavones dans ces deux compartiments (Berger et al., 2008). Les profils d’expression très différenciés des gènes codant pour des enzymes clefs en amont dans cette voie de biosynthèse entre les deux compartiments de la graine ont également 143 permis de renforcer cette hypothèse. En effet, l’expression de trois gènes CHS7, CHS8 et CHS9 codant pour les chalcone synthases qui contrôlent le flux de métabolites à l’entrée de la voie de biosynthèse des flavonoïdes, se distingue entre les deux compartiments de la graine. Comme cela a déjà été observé dans de précédentes études (Gutierrez-Gonzalez et al., 2010a ; Yi et al., 2010a), l’expression des gènes CHS7 et CHS8 est reliée avec l’accumulation des isoflavones dans les cotylédons qui représentent la majeure partie de la graine et pour lesquels la teneur en isoflavones totales est maximale à 60 JAF. Le gène CHS9, nouveau membre du cluster CHS1-CHS3-CHS4-CHS5-CHS9 (Groupe de liaison A2 situé sur le chromosome Gm08) (Tuteja et Vodkin, 2008) est colocalisé avec deux QTLs associés respectivement à la teneur en isoflavones totales et en daidzéine (Gutierrez-Gonzalez et al., 2010b). Son profil d’expression qui n’avait jamais été observé jusqu’à maintenant, montre qu’il est le gène des chalcone synthases le plus exprimé dans les germes et les cotylédons et qu’il est le seul à présenter un profil d’expression en adéquation avec l’accumulation des isoflavones dans les germes. L’expression de ces gènes CHS semble clairement en lien avec les différences observées entre les deux compartiments de la graine de soja pour la synthèse des isoflavones. La comparaison des deux compartiments de la graine des variétés Imari et Queen, souligne également que le profil d’expression du gène codant pour la CHR, nécessaire à la synthèse de 90% des isoflavones dans le germe, est en adéquation avec l’accumulation des isoflavones dans le germe. Par ailleurs, ce gène est également induit à 60 JAF dans les cotylédons d’Imari, alors que la plus forte accumulation de daidzéine a lieu dans les cotylédons de Queen. Ce comportement étonnant pourrait indiquer une différence de régulation post- transcriptionnelle ou l’intégration de la chalcone réductase dans une autre voie de biosynthèse. En fait, il existe plusieurs gènes codant pour des chalcone réductases et celui-ci semble plus impliqué dans la synthèse des isoflavones des germes que dans celle des cotylédons. Plusieurs gènes codant pour des chalcone isomérases ont été suivis. Conformément à la littérature (Ralston et al., 2005), les chalcone isomérases de type II (CHI1A, CHI1B1 et CHI1B2), capables d’isomériser la naringénine chalcone et l’isoliquiritigénine, semblent plus impliquées dans la biosynthèse des isoflavones que celle de type I (CHI2). Le gène CHI1A présente une forte expression dans les germes et les cotylédons, et son profil d’expression coïncide avec l’accumulation des isoflavones dans les germes. L’expression de CHI1B1 correspond aussi à l’activité dans le germe alors que CHI1B2 est induit dans les cotylédons à 60JAF dans la variété Queen ayant le contenu en isoflavones le plus élevé. Ainsi, les chalcone isomérases pourraient bien avoir un rôle spécifique dans l’expression des profils caractéristiques d’isoflavones des variétés et/ ou des compartiments de la graine. 144 Cette étude démontre clairement que ni le polymorphisme de séquences des gènes IFS1 et IFS2 ni leurs expressions relatives ne sont liés aux teneurs en isoflavones des compartiments de la graine. Cependant, les différents profils d’expression de ces gènes et de ceux en amont dans la voie de biosynthèse confirment l’existence de deux voies de régulation bien distinctes de la biosynthèse des isoflavones dans les germes et les cotylédons. Ces résultats permettent ainsi de mieux définir les facteurs génétiques contribuant à la compartimentation des isoflavones observée dans la graine de soja (Berger et al., 2008 ; Rasolohery et al., 2008). Cependant, ces différences d’expression dans les deux compartiments pourraient également refléter des variations dans les mécanismes de régulation post-traductionnelle et conduire à de nouvelles hypothèses. 145 146 CHAPITRE IV : Étude de l’expression de gènes candidats codant pour la Flavonoïde 6-hydroxylase, intervenant dans la biosynthèse de la glycitéine 147 1 INTRODUCTION Comme nous l’avons confirmé dans la première partie de nos travaux de recherche, la teneur et la composition en isoflavones (génistéine, daidzéine et glycitéine) dans la graine de soja sont caractéristiques des deux compartiments de la graine et un net décalage de leur accumulation est observé dans ces deux compartiments (Berger et al., 2008 ; Rasolohery et al., 2008 ; Artigot et al., 2012). La teneur en isoflavones ne commence à augmenter dans les cotylédons que lorsqu’elle a atteint son maximum dans les germes. Les isoflavones sont particulièrement concentrées dans le germe qui peut contenir jusqu’à dix fois plus d’isoflavones que les cotylédons, devenant ainsi un sous-produit hautement valorisable pour le marché des suppléments santé. La daidzéine et la glycitéine sont les deux isoflavones les plus abondantes du compartiment germe alors que, dans les cotylédons, ce sont la génistéine et la daidzéine qui prédominent. La glycitéine est en effet exclusivement présente dans le germe. Ces trois molécules suscitent un grand intérêt en raison de leurs propriétés phytoestrogéniques et antioxydantes (Cederroth et Nef, 2009). Cependant, chacune d’elles peut avoir des effets bénéfiques différents sur la santé (Lee et al., 2010a ; Wang et Chen, 2010). Les isoflavones peuvent aussi avoir des effets délétères de perturbateurs endocriniens, notamment chez l’enfant (AFSSA et AFSSAPS, 2005). Ainsi, la teneur en isoflavones de la matière première ou des produits transformés nécessite d’être maîtrisée. Considérée comme une isoflavone mineure dans la graine entière, la glycitéine a été très peu étudiée et sa synthèse n’est pas encore complètement élucidée. Une seule fonction F6H (Flavonoïde 6-hydroxylase) a été mise en évidence par expression hétérologue d’un cDNA (Genbank Y10490.1) isolé à partir de cellules élicitées de soja (Schopfer et Ebel, 1998). Cette enzyme F6H catalyse l’hydroxylation en position 6 du cycle A du précurseur liquiritigénine pour permettre la synthèse de l’intermédiaire flavanone de la glycitéine (6,7,4’trihydroxyflavanone) dans la feuille de soja (Latunde-Dada et al., 2001). Cependant, même si ce gène est exprimé dans la feuille élicitée (Schopfer et Ebel, 1998), il n’est pas détecté dans les stades précoces de développement de la graine (de 5 à 23 JAF) (Goldberg et Harada, 2009). De plus, le génome du soja ayant subi plusieurs cycles de duplication et de diploïdisation (Schmutz et al., 2010), nous avons émis l’hypothèse que la flavonoïde 6hydroxylase ne devait pas être codée par un gène unique. 148 Les expérimentations entreprises visent à mieux définir et caractériser la voie de biosynthèse de la glycitéine dans la graine, plus particulièrement dans le germe qui est fortement concentré en ce composé. Une meilleure compréhension du processus régissant la synthèse de la glycitéine doit être en effet permise par l’étude d’autres gènes putatifs présents sur le génome du soja (F6H2 et F6H3) ayant une forte homologie de séquence avec le seul déjà isolé (F6H1) dans la feuille (Schopfer et Ebel, 1998). L’étude porte également sur le suivi d’expression de ces trois gènes (F6H1, F6H2 et F6H3) dans les feuilles élicitées et dans les deux compartiments de la graine (germe et cotylédons), à différents stades de développement et dans des variétés très différenciées pour leur contenu en glycitéine dans le germe. Ainsi la problématique consistera-t-elle à évaluer si l’expression d’un de ces gènes est spécifique du germe, s’il est le candidat potentiel dans la voie de biosynthèse de la glycitéine, et /ou si le taux d’expression de l’un d’entre eux est lié aux variations de teneur en glycitéine observées dans les différentes variétés. Afin de prendre en compte la diversité génétique (Rasolohery et al., 2008), les différences de teneur et de composition en isoflavones entre les germes et les cotylédons et le net décalage de leur accumulation dans ces deux compartiments (Berger et al., 2008), les expérimentations ont porté sur quatre variétés de soja, aux teneurs extrêmement variées en glycitéine dans les germes, dont deux ayant déjà été étudiées dans le premier volet de nos travaux (Imari et Queen), et dont les graines ont été prélevées à différents stades de développement. Les expérimentations ont été conduites en phytotron, et les prélèvements et les dissections se sont étalés du stade 25 JAF (R5, début du grossissement de la graine) à 50 JAF (R7, quasi maturité). Les résultats obtenus ont fait l’objet de la seconde publication scientifique insérée dans ce document de thèse : ARTIGOT M-P., BAES M., DAYDÉ J., BERGER M., 2012. Expression of flavonoid-6-hydroxylase candidate genes in normal and mutant soybean genotypes for glycitein content. Molecular Biology Reports (soumis pour publication). 149 2 PUBLICATION SCIENTIFIQUE 150 EXPRESSION OF FLAVONOID 6-HYDROXYLASE CANDIDATE GENES IN NORMAL AND MUTANT SOYBEAN GENOTYPES FOR GLYCITEIN CONTENT Marie-Pierre Artigot, Mathieu Baes, Jean Daydé and Monique Berger* Université de Toulouse, École d’Ingénieurs Purpan, Toxalim UMR 1331 INRA/INP/UPS 75, voie du TOEC - BP 57611 – 31076 Toulouse cedex 3 – France *Corresponding author: mail m.berger@purpan.fr Phone : +33 561 15 30 28 Fax: +33 561 15 30 60 151 ABSTRACT Soybean (Glycine max L.) seeds accumulate large amounts of isoflavones (genistein, daidzein and glycitein), secondary metabolites known for their phytoestrogenic activities. Isoflavone composition depends on the seed part and glycitein is almost found exclusively in hypocotyls. Moreover, two major phenotypes are encountered in soybean cultivars, with either low (35%) or high (55%) levels of glycitein in their hypocotyls. This trait was under a quasi-mendelian heredity, implicating almost one or two genes. A CYP71D9 cDNA displaying a flavonoid 6hydroxylase (F6H) activity had previously been isolated from elicitor-induced soybean cells. This enzyme allows the synthesis of the glycitein flavanone intermediate (6,7,4’trihydroxyflavanone) by catalyzing the A-ring hydroxylation of liquiritigenin. In this study, the CYP71D9 gene (F6H1) and two other candidates (F6H2 and F6H3) were studied using contrasted soybean cultivars for glycitein content (0, 35%, 55% and 80%). Their expression was observed in chitosan elicited leaves. They encode P450 proteins of 496, 469 and 481 amino acids respectively and were responsive to chitosan in elicitated leaves. The expression patterns of these three genes were also determined in cotyledons and hypocotyls at different developmental stages. F6H1 and F6H2 were not expressed in the developing seed. F6H3 was only expressed in hypocotyls. Its expression levels did not correlate with hypocotyls glycitein content, but it was not expressed in the null mutant for glycitein. Thus, this F6H3 gene is a good potential candidate for glycitein biosynthesis in soybean seed. 152 INTRODUCTION Isoflavonoids are a distinct group of secondary metabolites present predominantly in leguminous plants. They are particularly abundant in soybean [Glycine max (L.)] seeds which contain three isoflavones: genistein, daidzein and glycitein, mostly in conjugated forms (βglycosides and their malonyl derivatives). They provide a wide range of functions, playing an important role in plant environment interactions (Subramanian et al., 2006) and serving as precursors for the production of phytoalexins during plant-microbe interaction (Graham and Graham, 1996; Naoumkina et al., 2006). Isoflavones are also known for their phytoestrogenic activities and their potential role in human health (Ferrari, 2009; Messina et al., 2009), including those of glycitein which have been described in a large variety of cell types (Song et al., 1999; Gutierrez-Zepeda et al., 2005; Kang et al., 2007). Due to the presence of a methoxy group in position C6, glycitein has a low affinity to estrogenic receptors (Chang et al., 2005; Sakamoto et al., 2010) and generate 6 hydroxy or methoxy metabolites, with an unknown activity (Ruefer et al., 2007). However, several studies have reported a potent inhibitory effect on invasiveness of breast and prostate cancer cells (Kim et al., 2002; Magee et al., 2004; Clubbs and Bomser, 2009) or, more recently, in the inhibition of glioma tumor cells invasion (Lee et al., 2010a). Total isoflavones concentration and composition are dependent on the seed part. They can be up to 10 times more concentrated in hypocotyls (embryo axis) than in cotyledons and, while it is considered as a minor isoflavone in the whole seed, glycitein is present exclusively and in large amounts in hypocotyls (Kim and Chung, 2007; Berger et al., 2008; Rasolohery et al., 2008). Previous studies on segregating populations and in a core collection have shown the existence of two major phenotypes (their mean values were either 35% or 55% of glycitein in their hypocotyls), with a quasi-mendelian heredity implicating one or two genes 153 (Daydé et al., 2004). Due to their role in plant microorganism relations, the isoflavone content is responsive to elicitor treatment (Khan et al., 2003). Isoflavones are synthesized by a branch of the phenylpropanoid pathway (Yu and McGonigle, 2005) and elicitor treatment acts through the stimulation of the activity of the first steps of the biosynthetic pathway (Graham and Graham, 1996; Khan et al., 2003; Naoumkina et al., 2010). The first critical enzymes are phenylammonia-lyase (PAL) which directs phenylalanine into the phenylpropanoid pathway, and chalcone synthase (CHS) which produce the first flavonoid, naringenin chalcone (Clough et al., 2004; Tuteja and Vodkin, 2008). Then, depending on the subsequent reduction of this precursor, genistein or daidzein can be produced. The chalcone intermediates, naringenin chalcone or isoliquiritigenin, are changed in naringenin and liquiritigenin, respectively by a chalcone isomerase (CHI) (Ralston et al., 2005). The biosynthesis of glycitein has not been completely elucidated yet. However, it is admitted that its flavanone intermediate is produced from liquiritigenin (Latunde-Dada et al., 2001). As soybean produces isoflavonoid constituents possessing 6,7-dihydroxy substitution patterns on ring A, the biosynthetic relationship of flavonoid 6-hydroxylase to isoflavonoid biosynthesis has been investigated. A cDNA (GenBank accession number Y10490.1) isolated from elicitor-induced soybean cells (Schopfer and Ebel, 1998), encodes a protein with a flavonoid 6-hydroxylase (F6H) activity (Latunde-Dada et al., 2001). This enzyme is a cytochrome P450 monooxygenase belonging to the CYP71D subfamily (Nelson, 2009), which allows the synthesis of the glycitein flavanone intermediate (6,7,4’- trihydroxyflavanone) by catalyzing the A-ring hydroxylation of liquiritigenin (Figure 1). This intermediate can be metabolized in its corresponding isoflavanone by a 2- hydroxyisoflavanone synthase (known as isoflavone synthase, IFS) (Latunde-Dada et al., 2001), responsible for the 2,3 aryl ring migration (Akashi et al., 1999; Steele et al., 1999; Jung et al., 2000). A putative 6-isoflavone-O-methyltransferase (6-IOMT), should occur after 154 the IFS to form the glycitein. This methylation can take place on the isoflavanone or isoflavone intermediate. However, the 6-IOMT function has never been observed in soybean. The flavonoid 6-hydroxylase encoding gene is expressed in soybean elicited leave (Schopfer and Ebel, 1998), but not in developing seed at very early development stages (from 5 to 23 DAF) (Goldberg and Harada, 2009). As, soybean genome has undergone multiple rounds of duplication and diploidization during its evolution (Schmutz et al., 2010), we hypothesized that flavonoid 6-hydroxylase is not encoded by a unique gene. In this study, our aim was to find a candidate for the F6H function in the soybean seed. MATERIAL AND METHODS Plant material and growth conditions The soybean cultivars Imari, Queen, NS Kasha and Qi si mi (PI567580A), an accession from the USDA Soybean Germplasm Collection (Urbana, IL, USA), have been selected for their contrasted glycitein content in hypocotyls: around 35%; 55%, 80% for Imari, Queen and NS Kasha, respectively, whereas PI567580A is a null mutant. Plants were grown in a phytotron (Vötsch HGC 0714, Weiss Umweltechnik, Germany). Inoculated seeds with Bradyrhizobium japonicum were planted in 20 cm diameter (3L) pots in a 1:1:1 soil: sand: peat mixture. After germination, one plant per pot was maintained. The 16 pots (4 per cultivar) were completely randomized. Irrigation was given as necessary to avoid water stress. Fertilization was given twice a week with 200 mL modified Hoagland solution with half strength N. Light, temperatures and humidity conditions were set to 23/18°C day/night temperatures, 16/8h day/night photoperiod and 65/85% relative humidity. This experiment has been duplicated (autumn 2010 and spring 2011). 155 Preparation of elicitors Two elicitor treatments: laminarin and chitosan (Sigma-Aldrich) were used. Laminarin was dissolved in water at 200 mg.L-1 and sterilized by filtration. Chitosan was dissolved in a 0.005 N HCl solution at 20 mg.L-1 and the pH was adjusted to 5.5 with 1M NaOH. All elicitor solutions were prepared on the day of use. Elicitor treatment and sampling of soybean leaflets Elicitor treatments (chitosan, laminarin and a water control) were applied at the V4 stage (Fehr et al., 1971) , on two fully expanded trifoliated leaves per plant for each cultivar Imari and Queen. Two plants were used per cultivar. Four treatments (5 infiltration points each) were applied on the same leaflet divided in quarters: 3 treated (chitosan, laminarin, and H2O) and a control zone without injection. The 3 leaflets of the leaf were treated and collected 7h after elicitation, partitioned according to the 4 treatments, flash-frozen in liquid nitrogen and stored at -80°C. Two negative controls were also collected on the opposite leaves (“T0” just before the treatment and “T7h”, 7h after elicitation). Seed sampling Seeds of Imari, Queen, NS Kasha, and PI567580A were regularly harvested during their maturation at three development stages: 25, 40 and 50 DAF. Four biological samples (pods) were collected for each stage on four different plants per cultivar. Upon harvest, each seed (2 or 3 per pod) was rapidly dissected; hypocotyl and cotyledons were separated by hand, flashfrozen with liquid nitrogen and stored at -80°C. A similar replicate was made in the duplicate experiment. Choice of putative target genes A single transcript encoding a flavonoid 6-hydroxylase has been so far isolated in soybean (GenBank accession Y10490.1) (Schopfer and Ebel, 1998). Homologous sequences have been researched using BLASTN algorithm on the assembly of the soybean genome, Glyma 156 1.0 (http://www.phytozome.org/soybean.php). Alignments, trees and hydrophobic profiles have been made using bioinformatics tools on Mobyle portal (InstitutPasteur,http://bioweb2.pasteur.fr),and Multalin (http://multalin.toulouse.inra.fr/multalin/) (Corpet, 1988). Genomic sequences amplification and sequencing Total genomic DNA was extracted from 100mg of leaf tissue (DNeasy Plant Mini Kit, Qiagen, Courtaboeuf, France), according to the manufacturer’s recommendations. The concentration of DNA was determined at 260nm (NanoDrop ND-1000 UV-Vis spectrophotometer, NanoDrop Technologies, Wilmington, DE, USA). The totality [between 200bp and 450bp upstream the start codon in the 5' specific untranslated region (UTR) and between 50bp and 500bp downstream the stop codon in the 3'UTR] of the target putative F6H sequences genes (named F6H1 for Glyma18g08950.1 corresponding to Y10490.1, F6H2 for Glyma18g08930.1 and F6H3 for Glyma08g43890.1) was amplified using specific primers (Online resource 1) designed with Primer3 software (Rozen and Skaletsky, 2000). PCR were conducted in a 25µL reaction volume (PCR master mix 2X, Promega, France) following manufacturer’s recommendations. Thermocycling (GenAmp PCR System 9700 thermocycler; Applied Biosystems, Forster City, USA) was performed as follows: initial denaturation (94°C for 5 min), 30 cycles (1 min at 94°C; 1 min at 59°C; 3 min at 72°C) and final extension (72°C for 10 min). The expected length of PCR products was checked on a 0.8% agarose gel under UV light after ethidium bromide staining. PCR products were then ligated in the pGEM-T vector (Promega, France) for amplification in JM109 E.coli competent cells (Promega, France). Plasmids were purified (GenElute Plasmid Miniprep kit, Sigma-Aldrich) and sequenced on both strands with SP6/T7 primer set (GATC biotech AG, Konstanz, Germany). Three replicates based on three different PCR were conducted by gene and by cultivar. Sequenced fragments were analysed on BioEdit (Hall, 157 1999). The resulting genomic sequences have been deposited to Genbank, under accession numbers: JX127148 (Imari), JX127149 (Queen), JX127150 (PI567580A) for F6H1; JX127151 (Imari), JX127152 (Queen), JX127153 (PI567580A) for F6H2; and JX127154 (Imari), JX127155 (Queen), JX127156 (PI567580A) for F6H3. Expression profile analysis RNA isolation and cDNA synthesis Total RNA was extracted from 50 mg of flash-frozen elicited leaflets or cotyledons (RNeasy Plant Mini kit Qiagen, Courtaboeuf, France) or from 5mg of single hypocotyl (NucleoSpin RNA XS kit, Macherey-Nagel, Düren, Germany) following manufacturers’ recommendations. RNA concentration was measured using a NanoDrop ND-1000 UV-Vis spectrophotometer (NanoDrop Technologies, Wilmington, DE, USA). The quality and the integrity of RNA was determined with the 260:280 nm and 260:230 nm absorbance ratios and checked on 1.2% agarose gel electrophoresis (Sambrook and Fritsch, 1989), prior to DNase digestion and cDNA synthesis For each sample, 1.6 µg of total RNA was digested in a volume of 11 µL with RNase-Free DNase I (Fermentas, France) according to the instructions provided by the manufacturer. After DNase I digestion, RNA concentration was measured, and first-strand cDNA synthesis was performed using 1,6 µg of DNase-treated total RNA in a 20 µL reaction (Maxima First Strand cDNA Synthesis Kit, Fermentas, France), following the manufacturer’s instructions. RT- controls were identical to cDNA reactions, but that reverse transcriptase was replaced by water. All cDNA samples were diluted 1:5. RT-PCR The RT-PCR reactions were performed by using the housekeeping gene soybean ubiquitin as the RNAs calibration control. Two other control genes PAL1 (Genbank X52953.1) and IFS1 (Genbank AF195798) coding for phenyl ammonia lyase (PAL) and isoflavone synthase (IFS) were used. Primer set used for ubiquitin has been extracted from literature 158 (Subramanian et al., 2005). Specific primers amplifying the end of the last exon and a part of 3'UTR (short fragments between 227 and 442bp) were designed. Primer sequences were : IFS1, F 5’-AAGTAGGAAGGGACCCAAA-3’, R 5’-CGTACGAAACAAAGACAAATGG-3’; PAL1, F 5’-GCCAAAAGAGGTTGAAGGTG-3’, R 5’-AACCAAAGCTTCTGCAAACAA-3’; F6H1, F 5’-GCGAAAAGCAGGGTCATAGT-3’, R’- AGCAATGCTGGACATCCTTT-3’; F6H2, F 5’- TTTGGGTTGACCAATGTTGA -3’, R 5’- AAAGTTTTCTTTATTCTCAGCTCTTTT -3’and F6H3, F 5’- TTTGGCTTGACCAATGTTGA -3’, R 5’- GCCCCTGTCATGATATCCAA -3’. RT-PCR was conducted in a 25 µL reaction volume (PCR master mix 2X, Promega, France) following manufacturer’s recommendations. Thermocycling (GenAmp PCR System 9700 thermocycler; Applied Biosystems, Forster City, USA) was performed as follows: initial denaturation (94°C for 5 min), 40 cycles (94°C for 1 min; 56°C for 1 min, and 72°C for 1 min), and a final extension (72°C for 10 min). To control F6H1, F6H2 and F6H3 transcripts identity, the samples were deposited on 1.8% agarose gel and the unique fragments obtained to the expected size were purified directly from the gels using the QIAquick gel kit (Qiagen, Courtaboeuf, France) following the manufacturer's instructions and sequenced (GATC biotech AG, Konstanz, Germany). 159 RESULTS F6H1, F6H2 and F6H3 isolation The putative F6H sequences have been retrieved using BLASTN algorithm on the assembly of the soybean genome, Glyma 1.0 (Phytozome). The previously characterized Y10490.1 sequence (Latunde-Dada et al., 2001) corresponds to the predicted gene Glyma18g08950.1. Two other predicted coding sequences with a high level of homology: Glyma18g08930 (78.7%) and Glyma08g43890 (78.8%) have been identified (Figure 2). The three genes have been named F6H1, F6H2 and F6H3, respectively. They were sequenced in three soybean cultivars (Imari, Queen and PI567580A). A 3637bp sequence (including 239bp upstream in 5’UTR and 46bp downstream in 3’UTR) was obtained for F6H1, a 2946bp sequence (including 195bp in 5’UTR and 465bp in 3’UTR) for F6H2 and a 3139bp sequence (including 440bp in 5’UTR and 382bp in 3’UTR) for F6H3. The two genes F6H1 and F6H3 showed a similar structure with two exons of 878bp and 613bp for F6H1 and 832bp and 614 for F6H3, interrupted by one long intron of 1861bp for F6H1 and a shorter one of 851bp for F6H3. The gene F6H2 had three exons (883bp, 101bp and 426bp) interrupted by two introns of 789bp and 87bp. Alignments of F6H1 genomic sequences from Imari and PI567580A cultivars revealed a 99.9% homology. In the genomic sequence of Queen, many differences were in the intron, including a 90bp deletion (Online resource 2). The three sequences showed a final 3.6% variation rate. Among these, only two SNPs have modified the 496 amino acid sequence (Figure 3): in the first exon at position 732 (Thr 165 Ala) and in the second one at position 3473 (Asp 459 Tyr). The genomic sequence of F6H2 in Queen and PI567580A were identical whereas Imari had 0.2% differences (Online Resource 3), the SNP at position 283 in the first exon induce a modification of the amino acid sequence (Ala 30 Thr). Queen and PI567580A 160 had also identical F6H3 genomic sequences (Online Resource 4), while Imari had a SNP in the second exon (2386C>T) without influence on the amino acid sequence. The predicted proteins should have 496, 469 and 481 amino acids for F6H1, F6H2 and F6H3, respectively. The shorter predicted peptide for F6H2 was due to the supplementary intron inducing a 27 amino acid deletion (from V330 to E358, Figure 4). The three proteins F6H1, F6H2 and F6H3 correspond to predicted sequences identified in the soybean P450 database as CYP71D9, CYP71D101 and CYP71D102, respectively (Nelson, 2009). These three proteins showed therefore high sequence similarity and none of the transitions mutations occurred in the P450s signatures and conserved domains (Werck-Reichhart and Feyereisen, 2000): the central part of helix I containing the consensus sequence (Ala/Gly-GlyX-Asp/Glu-Thr-Thr/Ser), although Asp/Glu was replaced by Gln for F6H2 and F6H3; the absolutely conserved (Glu-X-X-Arg) motif essential for locking the haem pocket and stabilizing the core structure; and the haem-binding loop (Phe-X-X-Gly-X-Arg-X-Cys-X-Gly) (Figure 4). The hydropathy plots (Kyte and Doolittle, 1982) of the three predicted proteins were quite similar, excepted for F6H3, which have lost its N terminal transmembrane domain (Figure 5). Soybean leaflets elicitation The F6H1, F6H2 and F6H3 genes were expressed in the leaves of cv ‘Imari’ and ‘Queen’. Unique amplicons of expected size were obtained for each gene studied (Ubi : 132bp ; PAL1 : 422bp ; IFS1 : 531bp ; F6H1 : 442bp ; F6H2 : 227bp ; F6H3 : 322bp) (Figure 6). The specificity of the primers was confirmed by the sequence of the amplified fragments for F6H1, F6H2 and F6H3. The expression of housekeeping gene encoding ubiquitin is constitutive and ubiquitous for all the samples. The two control genes: PAL1 and IFS1 and the three target genes F6H1, F6H2 and F6H3 were all consistently expressed for all the control samples: T0, T7h and NT. The expression of the five genes was increased in elicited samples 161 (laminarin or chitosan) and also in those treated with water, for both cultivars studied. However, the intensity of obtained spots indicated that these five genes could to be more responsive to chitosan elicitation than to laminarin. Expression profiles in hypocotyl and cotyledons of developing seeds Expression profile analysis in hypocotyls and cotyledons of four soybean cultivars with very high contrasted glycitein content were carried out at three development stages of the seed (25 DAF, 40 DAF and 50 DAF) (Figure 7). Previous experiments have shown the accumulation of isoflavones begins at 25 DAF in the hypocotyls and reaches a maximum around 40 DAF (Berger et al., 2008; Rasolohery et al., 2008). In cotyledons, the maximum content of isoflavone is 4 to 10 fold lower than in hypocotyls. Isoflavones begin their accumulation at 40 DAF and increase rapidly during the 7 next days. The cotyledons content only genistein and daidzein. Therefore the expression profile has been analyzed at 25 and 40 DAF in hypocotyls and at 40 and 50 DAF in cotyledons. The housekeeping gene encoding ubiquitin was consistently expressed at each development stage (25, 40 and 50 DAF) whatever the cultivar and the seed part studied. The two controls genes: PAL1 and IFS1 were consistently expressed in hypocotyls at 25 DAF and 40 DAF but also in cotyledons at 40 and 50 DAF. However, the highest expression was observed in cotyledons at 50 DAF. The F6H1 and F6H2 transcripts were not detected in any of the seed parts, whatever the development stage and cultivar studied. In contrast, F6H3 transcript was consistently expressed in hypocotyls at 25 DAF and 40 DAF for all contrasted cultivars except for PI567580A which does not produce glycitein. Interestingly, these three genes were not expressed in the cotyledons whatever the cultivar or the development stage considered. 162 DISCUSSION The metabolism of glycitein was so far considered as a minor isoflavone in soybean. But conversely, it is one of the major isoflavone in the hypocotyl, and this seed fraction is widely used as raw material for dietary supplements. The biosynthesis of this isoflavone has not been elucidated yet. It is generally admitted that it is derived from liquiritigenin which is hydroxylated in position 6 of the A ring by a flavonoid 6-hydroxylase. The isoflavone synthase converts this intermediate in 6, 7, 4’, trihydroxyisoflavanone (Latunde-Dada et al., 2001) which is further methylated by a still unknown isoflavanone or isoflavone -6-O methyltransferase. However, the only F6H observed until now has been isolated from elicited leaves. Our aim was to identify such an activity in hypocotyl. Two predicted genes in soybean genomic sequence, F6H2 (Glyma18g08930) and F6H3 (Glyma08g43890), had a high coding sequence homology (79%) with the already described F6H1 gene (Glyma18g08950) (Schopfer and Ebel, 1998; Latunde-Dada et al., 2001). Their predicted protein revealed also high homology and all of their P450s distinctive domains were strictly conserved [38]. Owing to these sequence similarities, the two enzymes F6H2 and F6H3 may exert the same flavonoid 6-hydroxylase function as F6H1 in soybean (Latunde-Dada et al., 2001). Strikingly, the F6H3 sequence had lost its transmembrane helix domain which is reduced to 4 apolar amino acids. However, this shortened peptide had a normal “hinge” of prolines preceded by basic and polar residues. The hydropathic profile did not displayed subsequent abnormalities. Currently, such P450 have not been described in plants, but the N-transmembrane helix has probably only a passive role of anchor in the reticulum membrane (Gideon et al., 2012). Thus, the functionality and the integration of this protein in a multienzymatic complex could be unaffected by the absence of a transmembrane helix. The induction of the phenylpropanoids biosynthetic genes in response to elicitors of biological origin has been studied and documented for plant model systems (Dixon et al., 163 2002). Among them, chitosan and laminarin originating from cell walls of fungi or from marine organisms has been reported to elicit a variety of defense reactions in higher plants, including the stimulation of PAL and the accumulation of phytoalexins (Aziz et al., 2003; Khan et al., 2003). They have been used here to maximize the probability of detection of the product of predicted genes F6H2 and F6H3. Clearly, these predicted genes are functional and expressed as memberships of the phenylpropanoid group. Hypocotyl has its proper pattern and determinism of isoflavone accumulation (Berger et al., 2008) and is the only part of the seed storing glycitein (Kudou et al., 1991; Tsukamoto et al., 1995). The specific activity of F6H3 in this compartment is consistent with this behavior. Interestingly, while isoflavone synthase IFS1 and phenylamonia-lyase PAL1 mRNA are detected in cotyledons at 40 and 50 DAF, in accordance with the active isoflavone biosynthesis taking place during this period (Berger et al., 2008), not any mRNA of the candidate genes for F6H function has been detected. In fact, the only gene F6H1 known to encode the F6H function was not expressed in the hypocotyl. This is in agreement with the data of early maturing soybean seed transcriptome analysis (Goldberg and Harada, 2009). In this database, the expression data of F6H2 and F6H3 could not be separated. They gave a weak and inconsistent signal at 5 and 15 DAF but they were not detected at 23 DAF in the cultivar they used. However in our study, F6H3 was expressed in all the 3 cultivars but not in the null mutant line PI567580A In conclusion, the high sequence similarities and the strictly conserved P450 signatures domains obtained for the two F6H2 and F6H3 putative proteins indicate that they may exert the same flavonoid 6-hydroxylase function than F6H1 in soybean. Furthermore, as F6H1 is probably not implicated in glycitein biosynthesis in the hypocotyls, F6H3 appeared here as a very good potential candidate to assume this function. 164 Acknowledgements: We thank Christel Couderc and Daphné Puech for their help and technical assistance. This project was supported by research grants from the Midi-Pyrénées Région. The authors thank Pr Randall Nelson, curator of the USDA soybean germplasm collection (Urbana, IL), for the supply of the accession used in this study and the French group Euralis Semences for the supply of their germplasm accessions NS Kasha. 165 REFERENCES Les références bibliographiques de cette publication sont citées dans la partie « Références Bibliographiques » à la fin de ce manuscrit. 166 FIGURE LIST Figure 1: Schematic representation of the general isoflavonoid pathway. CHS: chalcone synthase; CHR: Chalcone reductase; CHI: Chalcone isomerase; putative F6H: Flavonoid 6hydroxylase; IFS: isoflavone synthase; IOMT; 6-isoflavone-O-methyltransferase 167 Figure 2: Rooted dendrogram of the predicted coding sequences having more than 65% homology with the characterized flavonoid 6-hydroxylase (Y10490.1). Sequences have been retrieved from soybean (Glycine max), common bean (Phaseolus vulgaris) and barrel medic (Medicago truncatula). The tree has been generated with the aligned sequences using ClustalW 2.0.12 multiple alignment and Phylip 3.67 drawgram 168 Figure 3: Alignments of the predicted protein sequences for F6H1 (a), F6H2 (b) and F6H3 (c) in the 3 cultivars: Imari, Queen and PI567580A (PIA) 169 Figure 4: Comparison of the F6H1 (CYP71D9), F6H2 (CYP71D101) and F6H3 (CYP71D102) protein sequences. The conserved key motifs of P450 have been underlined. Figure 5: Hydrophobic scores and detection of transmembrane domain in the three sequences (Kyte-Doolittle scale, core window size = 10; hedge = 5; critical loop size = 60) 170 Figure 6: F6H1, F6H2 and F6H3 expression profiles in soybean elicited leaflets after elicitation treatment. T0 and T7h: control treatment on independent leaflets at the beginning and at the end of the treatment. NT, H2O, Lam and Chit: treatment on the four quarter of the treated leaflet (non-treated, control H2O injection, laminarin and chitosan). The 3 leaflets have been treated on 4 plants per cultivar Figure 7: Expression profiles of the three genes F6H1, F6H2 and F6H3 in the hypocotyls and cotyledons of four soybean cultivars (Imari, Queen, PI567580A and NS Kasha) during seed development. Ubi: Ubiquitin; PAL: Phenylamonia-lyase; IFS: isoflavone synthase; F6H: Flavonoid 6-hydroxylase 171 SUPPLEMENTARY MATERIAL Online resource 1: Primers used to amplify F6H1, F6H2 and F6H3 genomic sequences Average Tm of each primer sets : 59°C Amplicon Primer name Forward F6H1 part A F6H1 F1 AGTGTCCTCAAACCACTGCAT F6H1 R3 GATTTTGACCGGCTATGTCC 1557 bp F6H1 part B F6H1 F st2.1 GTATGCTTTACTGCCTTCACACTTTAG F6H1 R st2.1 CAAATGGAGAGTAGGTCCACAGG 2370 bp F6H2 part A F6H2 AF TGGCTATGCTAACATCCTCGT F6H2 R3 TTGGTGCTTTGGAAGTTGAA 1621 bp F6H2 part B F6H2 BF CAGGACCACGTACACAATGC F6H2 R6 TGTCGATGCCTATCTTTTTCC 1407 bp F6H3 part A F6H3 F1 GAGCCTAAATTCAGCGGATCT F6H3 R4 GCAGAATCCACCAATAAGTGTAAG 1985 bp F6H3 part B F6H3 BF GGAACAGAACAAGCAAACCTG F6H3 R7 TTGATGGAAATGATGGTGGA 1322 bp Sequence 5’3’ Amplicon Reverse Sequence 5’3’ Amplicon size 172 Online resource 2: alignment of F6H1 genomic sequences (Glyma18g08950 for Imari, Queen and PI567580A (boxes = exons) 173 Online resource 3: alignment of F6H2 genomic sequences (Glyma18g08930 for Imari, Queen and PI567580A (boxes = exons) 174 Online resource 4: alignment of F6H3 genomic sequences (Glyma08g43890 for Imari, Queen and PI567580A (boxes = exons) 175 176 3 SYNTHÈSE ET CONCLUSION Les résultats obtenus dans cette deuxième partie des travaux de thèse concernent la compréhension du processus régissant la biosynthèse de la glycitéine dans la graine de soja, plus particulièrement dans le germe qui est fortement concentré en ce composé. Ceci a tout d’abord été permis par l’étude de deux autres gènes putatifs : F6H2 (Glyma18g08930) et F6H3 (Glyma08g43890) présents sur le génome du soja et ayant une forte homologie de séquence avec le seul déjà isolé (F6H1) dans la feuille. Puis, d’autres éléments ont été apportés par l’étude du suivi d’expression de ces trois gènes (F6H1, F6H2 et F6H3) dans les feuilles élicitées ainsi que dans les deux compartiments de la graine (germes et cotylédons), à différents stades de développement, dans des variétés très différentes pour leurs contenus en isoflavones dans les germes. Cette approche a permis de mettre en évidence le faible taux de variation des séquences génomiques isolées pour un même gène entre les trois variétés étudiées (Imari, Queen et PI567580A) très différenciées pour leur contenu en isoflavones dans les germes. Le taux de variation obtenu entre les trois variétés est de 3,6% pour F6H1, 0,2% pour F6H2 et 0,04% pour F6H3. Il en découle ainsi une très forte homologie des séquences protéiques F6H1 et F6H2 correspondantes (99,6% et 99,8% respectivement) avec seulement quelques différences mineures et une homologie parfaite de 100% pour F6H3. Ces faibles taux de variation obtenus pour les séquences génomiques F6H1, F6H2 et F6H3 corroborent l’absence de polymorphisme des séquences génomiques des isoflavone synthases déjà identifié pour ces mêmes variétés (Imari, Queen et PI567580A) dans la première partie de ces travaux de recherche (Artigot et al., 2012). Les trois protéines F6H1, F6H2 et F6H3 correspondent respectivement aux cytochromes P540 CYP71D9, CYP71D101 et CYP71D102 selon la classification de Nelson (Nelson, 2009). Les deux séquences protéiques putatives F6H2 et F6H3 montrent une forte similitude avec celle de F6H1, cytochrome P450 monooxygénase transmembranaire dont la fonction d’hydroxylation en position 6 du substrat liquiritigénine est connue dans la feuille de soja (Latunde-Dada et al., 2001). De plus, on note également la stricte conservation des différents domaines caractéristiques des P450s membranaires sur ces deux séquences protéiques putatives (Werck-Reichhart et Feyereisen, 2000). Cependant, la protéine putative F6H3 présente un segment hydrophobe très court dans la région N-terminale. 177 Bien que la fonction biologique de ces deux enzymes putatives ne soit pas ici démontrée, il est important de souligner que les deux gènes : Glyma18g08930 et Glyma08g43890 initialement choisis, codant respectivement pour les enzymes putatives F6H2 et F6H3 sont ceux ayant les plus fortes homologies de séquences codantes : 78,7% pour Glyma18g08930 et 78,8% pour Glyma08g43890, avec F6H1 sur le génome du soja. L’expression des deux gènes putatifs F6H2 et F6H3 dans la feuille ainsi que l’induction de leur expression par le stress de l’infiltration elle-même (traitement contrôle avec l’eau) et par les traitements éliciteurs, avec une sensibilité marquée au chitosan, démontre que les séquences prédites Glyma18g08930 et Glyma08g43890 correspondent bien à des ARN messagers dans la feuille de soja. D’autre part, le gène F6H1 qui est le seul caractérisé codant pour la fonction flavonoïde 6-hydroxylase dans la feuille, n’est pas le bon candidat pour la synthèse de la glycitéine dans la graine. En effet, conformément à ce qu’avaient observé Goldberg et Harada, (2009) sur des stades précoces de développement de la graine, allant de 5 à 23 JAF, nous n’avons pas détecté d’expression de ce gène dans la graine même à des stades plus tardifs de développement (25 et 40JAF). Aucun des trois gènes F6H1, F6H2 et F6H3 n’est exprimé dans les cotylédons, quel que soit le stade de développement étudié (40 et 50 JAF). Dans les germes, seul le gène F6H3 s’exprime aux deux stades étudiés ici : 25 et 40 JAF. Cette expression s’avère être spécifique du germe, ce qui corrobore parfaitement l’accumulation de la glycitéine présente en grande quantité dans ce compartiment (Berger et al., 2008 ; Rasolohery et al., 2008 ; Artigot et al., 2012). De plus, l’absence d’expression de F6H3 chez le mutant PI567580A ne produisant pas de glycitéine dans les germes, met en évidence son rôle potentiel de gène clef dans la voie de biosynthèse de la glycitéine. L’expression du gène IFS1 n’apparaît pas plus importante dans les germes qui contiennent 4 à 10 fois plus d’isoflavones que dans les cotylédons quelle que soit la variété et le stade de développement étudié. Ces résultats sont en adéquation avec ceux obtenus dans la première partie des travaux (Artigot et al., 2012), soulignant ainsi l’absence de liaison stricte entre le taux d’expression du gène IFS1 et la teneur en isoflavones dans les compartiments de la graine. La comparaison des variétés Queen, Imari et NS Kasha différenciées pour leur contenu en glycitéine dans les germes, ne montre pas de relation avec le taux d’expression de F6H3. 178 En effet, ce gène n’est pas plus exprimé dans les germes des variétés de forte teneur en glycitéine (NS Kasha) que dans les variétés de plus faible teneur (Imari). Il en est de même pour les lignées Dwight quasi isogéniques (Gly+: 35% daidzéine et 55% glycitéine dans les germes et Gly– : 55% daidzéine et 35% de glycitéine) que nous avons également étudiées. Ceci semble montrer que l’enzyme F6H3, si elle intervient bien dans sa biosynthèse, n’est pas un facteur limitant pour l’accumulation de la glycitéine dans les germes. Cette étude démontre ainsi que l’expression du gène F6H3 est spécifique du germe et que son taux d’expression n’est pas relié aux variations de teneurs en glycitéine observées dans les différentes variétés. Cette protéine semble présenter une partie hydrophobe raccourcie de ses 17 premiers acides aminés. Il ne lui resterait donc qu’un court segment hydrophobe avant la partie charnière constituée d’un segment d’acides aminés basiques et d’un segment riche en prolines (Pro-Pro-X-Pro). Ces résultats ouvrent donc la voie à plusieurs démarches expérimentales, qui permettraient de vérifier l’activité biologique de ce gène F6H3 in vivo et d’évaluer la capacité de l’enzyme correspondante à hydroxyler le substrat liquiritigénine en position 6 dans la voie de biosynthèse de la glycitéine. 179 180 CHAPITRE V : DISCUSSION GENERALE ET CONCLUSION 181 La première partie de nos expérimentations a permis de souligner, en accord avec la littérature (Eldridge et Kwolek, 1983 ; Tsukamoto et al., 1995) et la précédente approche physiologique menée au laboratoire (Berger et al., 2008 ; Rasolohery et al., 2008), la grande différence de teneur et de composition en isoflavones entre les germes et les cotylédons ainsi que le net décalage de leur accumulation dans ces deux compartiments. Le fractionnement de la graine permet de répondre à une demande industrielle très différenciée concernant les teneurs en isoflavones (des germes à forte concentration en isoflavones pour le marché des suppléments santé ou des cotylédons à faible concentration destinés au marché des « soyfoods »). Le déterminisme génétique de telles différences n’est pas connu. Les avancées sur la caractérisation des gènes codant pour les enzymes structurales de la voie de biosynthèse des isoflavones (Latunde-Dada et al., 2001 ; Dixon et al., 2002 ; Hirota et al., 2004 ; Akashi et al., 2005 ; Ralston et al., 2005 ; Yu et McGonigle, 2005), ont permis l’exploration de cette problématique. Une meilleure compréhension de ce déterminisme ouvrant aussi la voie à une maîtrise des profils des isoflavones dans les variétés est toutefois nécessaire et fait l’objet de nos travaux. L’étude des séquences génomiques des isoflavones synthases (IFS1 et IFS2), enzymes clefs dans la voie de biosynthèse des isoflavones, a mis en évidence l’existence de deux formes alléliques. Bien que 5 SNPs corrélés avec la teneur en isoflavones aient été identifiés dans ces gènes ou leurs promoteurs (Cheng et al., 2008), aucun d’entre eux n’a été observé ici. De plus, les formes alléliques que nous avons révélées sont indépendantes de la teneur en isoflavones. L’activité transcriptionnelle des gènes IFS1 et IFS2 n’explique pas non plus les différences de teneurs entre les variétés Imari et Queen. Néanmoins, elle souligne l’implication d’une régulation bien distincte de la synthèse des isoflavones entre les germes et les cotylédons. Cette hypothèse est renforcée par les profils d’expression très différenciés de certains gènes situés en amont dans cette voie de biosynthèse entre les deux compartiments de la graine. En particulier, 3 gènes de chalcone synthase (CHS7, CHS8 et CHS9), enzyme contrôlant le flux de métabolites à l’entrée de la voie de biosynthèse des flavonoïdes, ont effectivement montré une expression en lien très étroit avec les différences de teneurs dans les compartiments de la graine. Comme il a été observé récemment (Gutierrez-Gonzalez et al., 2010a ; Yi et al., 2010a), l’induction des gènes CHS7 et CHS8 coïncide avec l’accumulation des isoflavones. Toutefois, cette relation n’est vraie que dans le cas des cotylédons, et dans 182 notre étude, le taux d’expression de ces gènes n’est pas corrélé aux différences de teneur en isoflavones entre les variétés Imari et Queen. En fait, le gène CHS9 est le plus fortement exprimé des 9 homologues que nous avons suivis, et ceci autant pour les cotylédons que pour les germes. Contrairement à CHS7 et CHS8, son profil d’expression est en adéquation avec l’accumulation des isoflavones dans les germes. C’est également le cas du gène codant pour la CHR nécessaire à la synthèse de 90% des isoflavones dans le germe. Conformément à la littérature (Ralston et al., 2005), les chalcone isomérases de type II (CHI1A, CHI1B1 et CHI1B2), capables d’isomériser la naringénine chalcone et l’isoliquiritigénine, semblent plus impliquées dans la biosynthèse des isoflavones que celle de type I (CHI2). En effet, les profils d’expression des gènes CHI1A et CHI1B1 correspondent à l’activité dans le germe alors que le gène CHI1B2 est tardivement induit dans les cotylédons de la variété Queen ayant la teneur en isoflavones la plus élevée. Ceci conduit à l’hypothèse d’un rôle spécifique des chalcone isomérases dans l’expression des profils caractéristiques d’isoflavones des variétés et/ ou des compartiments de la graine. Nous avons ainsi pu montrer que le polymorphisme de séquences des gènes IFS1 et IFS2 ainsi que leurs expressions relatives ne sont pas liés aux teneurs en isoflavones des compartiments de la graine. Néanmoins, l’activité transcriptionnelle de ces deux gènes et de certains gènes intervenant en amont dans ces biosynthèses, dans l’un ou l’autre des compartiments, a permis de confirmer l’existence de deux voies de régulation bien distinctes de la biosynthèse des isoflavones dans le germe et les cotylédons. Ces résultats permettant ainsi de mieux appréhender le déterminisme génétique à l’origine des différences de teneurs et de profils observés dans ces deux compartiments de la graine (Berger et al., 2008 ; Rasolohery et al., 2008). Nous avons également constaté que les différences d’expression des gènes clefs dans les deux compartiments ne sont pas toujours reliées aux différences de teneurs observées, ce qui pourrait refléter des variations dans les mécanismes de régulation transcriptionnelle. En effet, un premier facteur de transcription nommé GmMYB176 directement impliqué dans la régulation positive de la voie de biosynthèse des isoflavones a été mis en évidence (Yi et al., 2010). Celui-ci se fixe sur l’élément cis-spécifique du promoteur du gène CHS8 intervenant dans la voie de biosynthèse des isoflavones pour constituer la base d’activation de la transcription de ce dernier (Figure 42). De plus, cet élément cis-spécifique est également présent sur les promoteurs des gènes CHS7, IFS1 et IFS2 intervenant aussi dans cette voie de biosynthèse des isoflavones. 183 Figure 42 : Représentation schématique de la base d’activation de la transcription du gène CHS8 intervenant dans la voie de biosynthèse des isoflavones d’après Yi et al. (2010) D’après nos résultats, nous avons pu mettre en évidence que les taux d’expression de ces quatre gènes étaient concomitants avec l’accumulation des isoflavones dans les cotylédons. Ainsi, nous pourrions supposer qu’un tél mécanisme d’activation soit présent au niveau des cotylédons et pas au niveau du germe. Pour cela, il semblerait donc interressant d’étudier si d’éventuelles différences d’expression de ce gène GmMYB176 au niveau de ces deux compartiments permettraient d’expliquer les différences de teneurs en isoflavones. Ces différences d’expression des gènes clefs dans les deux compartiments de la graine qui ne sont pas toujours reliées aux différences de teneurs observées pourraient également refléter des mécanismes de régulation post-traductionnelle. La régulation post-traductionnelle s’exerce par exemple au niveau de l’activation et de l’inactivation des enzymes, généralement provoquée par le niveau de leur phosphorylation. Un tel mécanisme semble présent dans cette voie de biosynthèse des isoflavones. Il a été observé pour la PAL à partir de cultures cellulaires élicitées de Phaseolus vulgaris dans lesquelles la stimulation des protéines kinases calcium dépendantes (CDPK) peut effectivement mener à une phosphorylation accrue et à un turnover de la PAL (Allwood et al., 1999). Cette régulation post-traductionnelle pourrait également avoir lieu au niveau de l’intégration des différentes isoformes de ces enzymes dans des complexes multienzymatiques (Dhaubhadel et Li, 2010 ; Yi et al., 2010b). Ces derniers sont cependant très instables et ne peuvent être étudiés qu’in vivo ou de manière indirecte. Néanmoins, l’existence d’un complexe spécifique à la voie des flavonoïdes vient récemment d’être montrée in vivo chez Arabidopsis thaliana grâce à la microscopie FRET (Fluorescence 184 Resonance Energy Transfer) qui permet de détecter des variations de fluorescence induites par les interactions entre protéines (Crosby et al., 2011). La spécificité d’une enzyme peut également être dictée par son intégration dans le complexe. C’est notamment le cas de la 4’IOMT responsable de la méthylation des isoflavanones en position 4’. In vitro cette enzyme peut aussi méthyler efficacement les isoflavones en position 7 alors qu’in vivo, elle ne produit que des méthylations en 4’, probablement en raison d’une transmission orientée du substrat, propre au phénomène de « channelling » induit par la construction du complexe multienzymatique (Liu et al., 2006). Cette organisation des enzymes en complexes soulève aussi la question de l’influence des interactions enzymatiques dans les différences de profils exprimées par les génotypes et dans les compartiments. Chez le tabac, il a été montré que deux isoformes de la PAL (PAL1 et PAL2) interagissaient différemment avec la C4H (P450 membranaire), cette dernière ayant une plus grande affinité pour l’isoforme PAL1. Ceci impliquerait un rôle spécifique des isoformes dans la construction du complexe, et donc dans son efficience ou encore dans les produits formés (Winkel, 2004). En supposant que l’accumulation des messagers reflète l’expression des protéines correspondantes, un mécanisme analogue pourrait faire intervenir les différentes isoformes de la chalcone synthase et de la chalcone isomérase. On pourrait par exemple imaginer des interventions différentes de CHS7, CHS8, CHS9, CHI1A, CHI1B1 et CHI1B2 selon leurs quantités relatives au cours du temps, ou dans les compartiments de la graine (Figure 43). germes CHS9 cotylédons CHI1A CHI1B1 / CHI1B2 CHS7 / CHS8 CHI1B2 Figure 43 : Schématisation des complexes multienzymatiques potentiellement présents dans les cotylédons et le germe d’après Dhaubhadel et al. (2008) 185 De même, la réduction de la naringénine chalcone en isoliquiritigénine par la CHR nécessite une association intime entre les deux enzymes CHS et CHR, car elle a probablement lieu avant la fermeture du cycle A (Austin et Noel, 2003 ; Wang, 2011). Selon les isoformes mises en jeu, la proportion de composés réduits pourrait ou non varier et ainsi mener in fine à la synthèse d’une proportion plus ou moins élevée de daidzéine ou génistéine. Ainsi, les résultats obtenus dans cette première partie de nos travaux et les différentes hypothèses émises à partir des différents types de régulation rapportés par la littérature, laissent entrevoir la complexité de régulation de cette voie de biosynthèse des isoflavones. Les isoflavones sont particulièrement concentrées dans le germe qui peut en contenir jusqu’à dix fois plus que les cotylédons, devenant ainsi un sous-produit hautement valorisable pour le marché des suppléments santé. La glycitéine, exclusivement présente dans le germe, dont la structure est la plus éloignée du 17β-œstradiol avec un groupement méthoxy en position C6, lui confère une faible affinité envers les récepteurs œstrogéniques (Chang et al., 2005 ; Sakamoto et al., 2010). Celle-ci est très peu métabolisée dans l’organisme et l’activité des produits issus de sa déméthylation n’a pas encore été étudiée (Ruefer et al., 2007). Ainsi, la teneur en isoflavones de la matière première ou des produits transformés nécessite d’être maîtrisée. Le germe ne représentant que 2 à 3% de la masse totale de la graine, la glycitéine a longtemps été considérée comme une isoflavone mineure et sa voie de biosynthèse n’est pas encore complètement élucidée. Ainsi, afin de mieux comprendre le processus régissant la synthèse de la glycitéine dans la graine et plus particulièrement dans le germe, la deuxième partie des expérimentations a été consacrée à l’étude d’autres gènes putatifs présents sur le génome du soja. L’étude et les tests d’expression des gènes F6H2 et F6H3 et du seul déjà caractérisé (F6H1) codant pour une flavonoïde 6-hydroxylase ont été réalisés dans différents tissus, notamment les germes à différents stades de développement, dans des variétés très différenciées pour leur contenu en glycitéine dans le germe. Nous avons ainsi pu confirmer l’absence d’expression dans la graine du seul gène caractérisé F6H1 codant pour une fonction flavonoïde 6-hydroxylase dans la feuille (Goldberg et Harada, 2009). Les trois gènes F6H1, F6H2 et F6H3 ne s’expriment pas dans les cotylédons et seul F6H3 est exprimé dans les germes, excepté pour la variété mutante ne produisant pas de glycitéine. Son expression apparait donc en lien avec l’accumulation de la glycitéine dans le germe. En revanche, comme pour les gènes étudiés dans la première partie de ce travail, l’accumulation des transcrits n’est pas directement corrélée avec les différences 186 d’accumulation de la glycitéine dans les germes des variétés capables de synthétiser ce composé. Ces différences d’expression entre les compartiments et les variétés ont ainsi permis de mettre en évidence le rôle clef potentiel du gène F6H3 dans la synthèse de la glycitéine dans le germe, permettant in fine de mieux définir sa voie de biosynthèse dans la graine. De tels résultats ouvrent donc la voie à une démarche expérimentale complémentaire à ce travail, qui permettrait de vérifier l’activité de ce gène in-vivo et d’évaluer la capacité de l’enzyme F6H3 correspondante à hydroxyler correctement le substrat liquiritigénine. Pour ce faire, la technique d’expression hétérologue dans la levure Saccharomyces cerevisiae, technique de prédilection pour l’expression hétérologue de gènes codant pour des cytochromes P450, est envisageable. L’efficacité d’un tel système pour la surexpression de gènes codant pour des cytochromes P450 potentiellement impliqués dans les voies de biosynthèse de métabolites secondaires chez les eucaryotes, n’est plus à démontrer. Plusieurs travaux ont permis de montrer la fonctionnalité de cette technique (Artigot et al., 2009), comme notamment, l’expression hétérologue de cytochromes P450 intervenant dans la voie de biosynthèse des isoflavones chez le soja, celle des isoflavones synthases (Jung et al., 2000) et de la flavonoïde 6-hydroxylase induite dans la feuille en condition d’élicitation (LatundeDada et al., 2001). Dans notre étude, l’identification de motifs conservés de P450s membranaires de classe II dans cette protéine F6H3, permettrait de définir sa localisation au niveau de la fraction microsomale. Cependant, le segment hydrophobe dans la région Nterminale semble très court et laisse donc à penser que cette protéine pourrait être relativement soluble. L’extraction de cette protéine à partir du cytosol ou des microsomes des cellules de levure pourrait être envisagée afin de définir sa localisation, de valider les résultats des analyses bioinformatiques réalisées ici et d’enrichir les connaissances sur les P450 hydroxylases intervenant dans la voie de biosynthèse des isoflavones. L’expression hétérologue de ce gène F6H3 dans la levure, permettrait d’illustrer pour la première fois, comment la liquiritigénine est élaborée en 6,7,4’-trihydroxyflavanone dans la graine, et conduirait à définir davantage la voie et les produits des gènes responsables de la biosynthèse de la glycitéine dans la graine de soja. L’ensemble de ces résultats permet ainsi d’accéder à une meilleure compréhension des mécanismes intervenant à l’échelle moléculaire dans la compartimentation des isoflavones observée dans la graine de soja. Ni le polymorphisme de séquence des gènes IFS1 et IFS2 ni leurs expressions relatives ne sont liés aux teneurs en isoflavones totales des variétés. 187 Cependant, les profils d’expression de ces gènes et de ceux en amont dans la voie confirment l’existence de deux voies de régulation bien distinctes de biosynthèse des isoflavones dans le germe et les cotylédons. En effet, les profils d’expression des gènes CHS9, CHI1A, CHI1B1 et CHI1B2 se distinguent au niveau du germe alors que les profils des gènes CHS7, CHS8 et CHI1B2 se distinguent au niveau des cotylédons. Les seules pistes restant à démontrer sont l’implication de la chalcone synthase CHS9 et des chalcone isomérases CHI1A, CHI1B1 et CHI1B2 qui pourraient jouer un rôle par une variation de leur affinité pour les substrats et/ou une différence d’intégration dans le complexe multienzymatique de biosynthèse des isoflavones. Ces travaux ont également permis l’identification d’une nouvelle enzyme F6H3 que nous proposons pour la synthèse de la glycitéine dans la graine de soja, plus particulièrement au niveau du germe, bien que son analyse fonctionnelle reste à étudier. Finalement, la structure particulière (segment hydrophobe raccourci en N-terminal) que semble montrer cette enzyme candidate F6H3 pourrait ainsi indiquer une forte implication de l’architecture du complexe enzymatique et des contraintes qui en découlent dans l’utilisation préférentielle d’une voie ou d’une autre dans le schéma de biosynthèse des isoflavones. En effet, une telle structure pourrait encore permettre une certaine interaction avec la membrane et participer au positionnement de l’enzyme dans les complexes enzymatiques auxquels participent les autres P450 intervenant dans cette voie de biosynthèse (C4H, IFS). Selon la voie de biosynthèse de la glycitéine, la F6H devrait s’intégrer juste avant l’IFS (Figure 44) et le fait d’avoir un domaine de fixation membranaire incomplet pourrait faciliter son intégration dans le complexe. Figure 44 : Représentation schématique de F6H3 dans le complexe multienzymatique potentiel de biosynthèse de la glycitéine d’après Dhaubhadel et al. (2008) 188 In fine, l’ensemble de ces résultats devrait permettre de lever une partie du voile sur le déterminisme génétique de la composition et de proposer un modèle global de maîtrise de la teneur et de la composition en isoflavones dans la graine, afin de répondre aux attentes et aux besoins de l’ensemble des utilisateurs. 189 190 TABLE DES ILLUSTRATIONS 191 LISTE DES FIGURES Figure 1 : Principaux stades physiologiques du cycle végétatif du soja d’après le CETIOM – http://www.cetiom.fr ............................................................................................. 20 Figure 2 : Principaux stades physiologiques du cycle reproductif du soja d’après le CETIOM –http://www.cetiom.fr .............................................................................................. 21 Figure 3 : Structure de la graine de soja ......................................................................... 22 Figure 4 : Premiers stades de développement de l’embryon des angiospermes d’après Goldberg et al. (1994) .............................................................................................................. 23 Figure 5 : Représentation schématique du stade de développement « globulaire » et du stade de développement « cœur » de l’embryon de soja (Goldberg et Harada, 2009)............. 24 Figure 6: Schéma du début de la maturation de l’embryon de soja (Goldberg et Harada, 2009) ...................................................................................................... 25 Figure 7 : Structure type et numérotation des cycles des chalconoïdes (a) des flavanoïdes (b) et des pterocarpanes (c). La chalcone la plus souvent rencontrée est la 2',4,4',6'-tétrahydroxychalcone, ou naringénine chalcone. Les flavanones et flavones ont un groupement cétone en C4 ; les isoflavonoïdes sont caractérisés par la position en C3 du groupement aryl (cycle B). Les ptérocarpanes sont formées à partir des isoflavones (après hydroxylation en 6’). ................................................................................................................ 29 Figure 8 : Structure des isoflavones de soja ................................................................... 30 Figure 9 : Structure et conjugaison des 3 familles d’isoflavones de soja ....................... 30 Figure 10: Comparaison structurale des isoflavones et du 17-β-estradiol ...................... 31 Figure 11 : Succession des stades physiologiques intervenant durant le développement de la graine de soja – en pointillés rouge : variation de la matière sèche d’après Goldberg, (2007) – http://estdb.biology.ucla.edu/seed/project#seed ....................................... 34 Figure 12 : Accumulation des isoflavones dans les cotylédons (A, B, C) et les germes (D, E, F) chez 4 variétés de soja sous 3 conditions de cultures : en serre en 2003 (A,D), 2004 (B,E) et au champ en 2005 (C,F) d’après Berger et al. (2008) ................................................ 35 Figure 13 : Processus global d’infection jusqu’à la formation du nodule fonctionnel chez les légumineuses. ...................................................................................................................... 41 Figure 14 : Etapes initiales de la biosynthèse des composés secondaires phénoliques d’après Winkel-Shirley, (2001) ................................................................................................ 42 192 Figure 15 : Voie de biosynthèse des isoflavones de soja d’après Yu et al. (2003) ; Du et al. (2010) ; Wang, (2011) ......................................................................................................... 43 Figure 16 : Les isoflavones aglycones et leurs dérivés méthylés identifiés chez Trifolium pratense et Medicago truncatula.............................................................................................. 45 Figure 17 : Régulation enzymatique des formes conjuguées d’isoflavones chez le soja (Suzuki et al., 2006) ................................................................................................................. 46 Figure 18 : Principales étapes du transport des isoflavones chez le soja (Dhaubhadel et al., 2008) ......................................................................................................... 47 Figure 19 : Réactions catalysées par la chalcone synthase (Halbwirth, 2010). La réduction par une chalcone réductase est spécifique des légumineuses et nécessite un type dédié de chalcone isomérase (CHI) capable d’accepter l’isoliquiritigénine ............................ 50 Figure 20 : Structure tridimensionnelle de la Chalcone synthase – (a) et (b) Construction de l’homodimère et positionnment des sites actifs. Les deux sous-unités sont colorées respectivement en jaune et en bleu - (c) comparaison avec la KAS III (Austin et Noel, 2003) .................................................................................................................................................. 51 Figure 21 : Modèle d’une structure tertiaire de P450 monooxygénase d’après Urlacher et Eiben (2006) ......................................................................................................................... 53 Figure 22 : Arbre phylogénétique représentant chacune des 127 familles de P450 identifiées chez les plantes d’après Nelson et Werck-Reichhart (2011) .................................. 54 Figure 23 : Mécanisme proposé pour la migration aryl catalysée par le CYP93C (IFS) : la migration aryl de la (2S)-flavanone pour former le produit 2-hydroxyisoflavanone d’après Mizutani et Sato (2011) ............................................................................................................ 56 Figure 24 : Classification des chalcones isomérases – les Gma (Glycine max) sont les enzymes du soja correspondant aux CHI1A, CHI1B1, CHI1B2, CHI2, CHI3, CHI4A et CHI4B (Ralston et al., 2005) ................................................................................................... 58 Figure 25 : Les IOMT intervenant dans la voie de biosynthèse des isoflavonoïdes chez les légumineuses ....................................................................................................................... 61 Figure 26 : Les deux dernières étapes dans la biosynthèse des isoflavones conjuguées chez le soja d’après Dhaubhadel et al. (2008).......................................................................... 62 Figure 27 : Complexe multienzymatique et channeling dans la voie de biosynthèse des isoflavones d’après Winkel-Shirley (1999) .............................................................................. 64 Figure 28 : Influence de la lumière sur les ARNm de la PAL (mPAL), sur les activités des enzymes PAL et CHS et sur la teneur en flavonoïdes de suspensions cellulaires de persil d’après Hahlbrock (1981)......................................................................................................... 72 193 Figure 29 : Modèles d’organisation de différentes voies de biosynthèse de métabolites secondaires utilisant les phénylpropanoïdes. Les cytochromes P450 permettent l’ancrage membranaire. a) synthèse de la lignine b) synthèse des flavonols c) synthèse des anthocyanes (Winkel, 2004) ......................................................................................................................... 77 Figure 30 : Concentrations en isoflavones totales (µmol.g-1 MS) dans des graines de soja à différents stades de développements (JAF : Jours Après floraison) en serre et en champ d’après Rasolohery et al. (2008) .............................................................................................. 82 Figure 31 : Détermination du cycle seuil ........................................................................ 89 Figure 32 : exemple de courbes représentant l’augmentation de la fluorescence au cours du temps obtenues lors des analyses ........................................................................................ 90 Figure 33 : Réactions contrôles NTC ............................................................................. 92 Figure 34 : Composition des plasmides PCR2.1 TOPO® et PGEM-T® ....................... 94 Figure 35 : Chromatogramme d’absorption UV à 260 nm obtenu après séparation HPLC sur colonne RP C18 d’un extrait de cotylédons à 40 JAF ........................................................ 96 Figure 36 : Chromatogramme d'absorption UV à 260 nm obtenu après séparation HPLC sur colonne RP C18 d’un extrait de germes à 40JAF .............................................................. 97 Figure 37 : Les 6 stades de développement des graines de soja prélevées : de 25 à 70 JAF ......................................................................................................................................... 102 Figure 38 : Obtention d’un pic unique garant de la spécificité d’un couple d’amorces utilisé ...................................................................................................................................... 104 Figure 39 : Les feuilles d’âge différent prélevées pour chaque traitement éliciteur utilisé ................................................................................................................................................ 105 Figure 40 : Dendrogramme des séquences codantes prédites ayant plus de 65% d’homologie avec Y10490.1 .................................................................................................. 106 Figure 41 : Points d’infiltration d’un traitement et les différentes zones de traitement d’une foliole ........................................................................................................................... 109 Figure 42 : Représentation schématique de la base d’activation de la transcription du gène CHS8 intervenant dans la voie de biosynthèse des isoflavones d’après Yi et al. (2010) ................................................................................................................................................ 184 Figure 43 : Schématisation des complexes multienzymatiques potentiellement présents dans les cotylédons et le germe d’après Dhaubhadel et al. (2008) ........................................ 185 Figure 44 : Représentation schématique de F6H3 dans le complexe multienzymatique potentiel de biosynthèse de la glycitéine d’après Dhaubhadel et al. (2008) .......................... 188 194 LISTE DES TABLEAUX Tableau 1 : Composition en acides aminés essentiels de la graine de soja (CETIOM, 2005)......................................................................................................................................... 26 Tableau 2 : Profil des acides gras contenus dans les fractions de la graine de soja (en % des acides gras totaux).............................................................................................................. 27 Tableau 3 : Nombre de gènes codant pour des FTs impliqués dans la régulation de la synthèse des (iso)flavonoïdes chez Medicago truncatula, Lotus japonicus et Glycine max d’après Libault et al. (2009) ..................................................................................................... 66 Tableau 4: Les facteurs de transcription MYB et bHLH impliqués dans la régulation des (iso)flavonoïdes chez les légumineuses ............................................................................. 68 Tableau 5 : Amorces spécifiques utilisées pour amplifier l’intégralité des séquences génomiques IFS1 et IFS2 ....................................................................................................... 100 Tableau 6 : Amorces internes utilisées pour les séquençages des gènes IFS1 et IFS2 100 Tableau 7 : Amorces utilisées pour amplifier les séquences génomiques F6H1, F6H2, et F6H3 ................................................................................................................................... 108 Tableau 8 : Amorces utilisées pour l’amplification des transcrits PAL1, IFS1 et Ubiquitine ............................................................................................................................... 110 Tableau 9 : Amorces utilisées pour les amplifications des ARNm F6H1, F6H2 et F6H3 ................................................................................................................................................ 111 195 196 REFERENCES BIBLIOGRAPHIQUES 197 A AFSSA et AFSSAPS 2005. Sécurité et bénéfices des phyto-oestrogènes apportés par l'alimentation Recommandations. AFSSA, pp.370. AKAGI, T.; IKEGAMI, A.; TSUJIMOTO, T.; KOBAYASHI, S.; SATO, A.; KONO, A. et YONEMORI; K. 2009. DkMyb4 is a Myb transcription factor involved in proanthocyanidin biosynthesis in persimmon fruit. Plant Physiol, 151, 2028-2045. AKASHI, T.; AOKI, T.; AYABE, S. 1999. Cloning and functional expression of a cytochrome P450 cDNA encoding 2-hydroxyisoflavanone synthase involved in biosynthesis of the isoflavonoid skeleton in licorice. Plant Physiol, 121, 821-828. AKASHI, T.; AOKI, T.; AYABE, S. 2005. Molecular and biochemical characterization of 2hydroxyisoflavanone dehydratase. Involvement of carboxylesterase-like proteins in leguminous isoflavone biosynthesis. Plant Physiol, 137, 882-891. AKASHI, T.; SAWADA, Y.; AOKI, T.; AYABE; S. 2000. New scheme of the biosynthesis of formononetin involving 2,7,4 '-trihydroxyisoflavanone but not daidzein as the methyl acceptor. Biosci Biotechnol Biochem, 64, 2276-2279. AKASHI, T.; SAWADA, Y.; SHIMADA, N.; SAKURAI, N.; AOKI, T.; AYABE, S. 2003. cDNA cloning and biochemical characterization of S-adenosyl-L-methionine: 2,7,4'-trihydroxyisoflavanone 4'-Omethyltransferase, a critical enzyme of the legume isoflavonoid phytoalexin pathway. Plant Cell Physiol, 44, 103-112. AL-TAWAHA, A. et SEGUIN, P. 2006. Seeding date, row spacing, and weed effects on soybean isoflavone concentrations and other seed characteristics. Can J Plant Sci, 86, 1079-1087. AL-TAWAHA, A.; SEGUIN, P.; SMITH, D.; BONNELL, R. 2007. Irrigation level affects isoflavone concentrations of early maturing soya bean cultivars. J Agron Crop Sci,193, 238-246. ALKHAROUF, N. W.; KLINK, V. P.; CHOUIKHA, I. B.; BEARD, H. S.; MACDONALD, M. H.; MEYER, S.; KNAP, H. T.; KHAN, R.; MATTHEWS, B. F. 2006. Timecourse microarray analyses reveal global changes in gene expression of susceptible Glycine max (soybean) roots during infection by Heterodera glycines (soybean cyst nematode). Planta, 224, 838-852. ALLWOOD, E. G.; DAVIES, D. R.; GERRISH, C.; ELLIS, B. E.; BOLWELL, G. P. 1999. Phosphorylation of phenylalanine ammonia-lyase: evidence for a novel protein kinase and identification of the phosphorylated residue. FEBS Lett, 457, 47-52. ANDRIOTIS, V. M.; PIKE, M. J.; KULAR, B.; RAWSTHORNE, S.; SMITH, A. M. 2010. Starch turnover in developing oilseed embryos. New Phytol, 187, 791-804. ANTUNES, P.; RAJCAN, I.; GOSS, M. 2006. Specific flavonoids as interconnecting signals in the tripartite symbiosis formed by arbuscular mycorrhizal fungi, Bradyrhizobium japonicum (Kirchner) Jordan and soybean (Glycine max (L.) Merr.). Soil Biol Biochem, 38, 533-543. ARIAS, J. A.; DIXON, R. A. ; LAMB, C. J. 1993. Dissection of the functional architecture of a plant defense gene promoter using a homologous in vitro transcription initiation system. Plant Cell, 5, 485-96. ARTIGOT M.-P.; DAYDÉ J.; BERGER M. 2012. Expression of key genes of the isoflavonoid pathway in hypocotyls and cotyledons during soybean seed maturation. Crop Sci (accepté pour publication). ARTIGOT, M.-P. ; LOISEAU, N. ; LAFFITTE, J. ; MAS-REGUIEG, L. ; TADRIST, S. ; OSWALD, I. P. ; PUEL, O. 2009. Molecular cloning and functional characterization of two CYP619 cytochrome P450s involved in biosynthesis of patulin in Aspergillus clavatus. Microbiology, 155, 1738-1747. AUSTIN, M. B. et NOEL, J. P. 2003. The chalcone synthase superfamily of type III polyketide synthases. Nat Prod Rep, 20, 79-110. AZIZ, A.; POINSSOT, B.; DAIRE, X.; ADRIAN, M.; BÉZIER, A.; LAMBERT, B.; JOUBERT, J. M.; PUGIN, A. 2003. Laminarin elicits defense responses in grapevine and induces protection against Botrytis cinerea and Plasmopara viticola. Mol Plant Microbe Interact, 16, 1118-1128. 198 B BADGER, T. M.; GILCHRIST, J. M.; PIVIK, R. T.; ANDRES, A.; SHANKAR, K.; CHEN, J. R.; RONIS, M. J. 2009. The health implications of soy infant formula. Am J Clin Nutr, 89, 1668S-1672S. BAGGETT, B. R.; COOPER, J. D.; HOGAN, E. T.; CARPER, J.; PAIVA, N. L.; SMITH, J. T. 2002. Profiling isoflavonoids found in legume root extracts using capillary electrophoresis. Electrophoresis, 23, 1642-1651. BARRETT, J. R. 2002. Soy and children's health: a formula for trouble. Environ Health Perspect, 110, A294-A296. BEC-FERTÉ, M. P.; KRISHNAN, H. B. ; PROMÉ, D. ; SAVAGNAC, A. ; PUEPPKE, S. G. ; PROMÉ, J. C. 1994. Structures of nodulation factors from the nitrogen-fixing soybean symbiont Rhizobium fredii USDA257. Biochemistry, 33, 11782-11788. BEDNAREK, P. et OSBOURN, A. 2009. Plant-microbe interactions: chemical diversity in plant defense. Science, 324, 746-748. BENT, A. 2011. Pathogens drop the hint: don't forget phytoalexin pathways. Cell Host Microbe, 9, 169-170. BERGER, M. ; ARTAL, J. ; THEODOROU, V. ; NEPVEU, F. ; DAYDÉ, J. 2002. Facteurs de variation de la teneur en isoflavones du soja. Symposium Aliment Santé . Toulouse, 25 Avril 2002. BERGER, M.; RASOLOHERY, C. A.; CAZALIS, R.; DAYDÉ, J. 2008. Isoflavone accumulation kinetics in soybean seed cotyledons and hypocotyls: Distinct. pathways and genetic controls. Crop Sci, 48, 700-708. BERHOW, M. A.; KONG, S. B.; VERMILLION, K. E.; DUVAL, S. M. 2006. Complete quantification of group A and group B soyasaponins in soybeans. J Agric Food Chem, 54, 2035-2044. BERNARD, R. L. 1972. Two genes affecting stem termination in soybeans. Crop Sci, 12, 235-239. BOMATI, E. K. ; AUSTIN, M. B. ; BOWMAN, M. E. ; DIXON, R. A. ; NOEL, J. P. 2005. Structural elucidation of chalcone reductase and implications for deoxychalcone biosynthesis. J Biol Chem, 280, 30496-30503. BOSCREDON, A. 2001. Variabilité de la teneur et de la composition en isoflavones de la graine de soja (Glycine max L. Merr): effet des facteurs génotypiques et environnementaux. Mémoire d'ingénieur, laboratoire d'agrophysiologie, Ecole d'Ingénieur purpan, Toulouse., pp 83. BOTTA, B. ; MENENDEZ, P. ; ZAPPIA, G. ; DE LIMA, R. A. ; TORGE, R. ; DELLE MONACHE, G. 2009. Prenylated Isoflavonoids: Botanical Distribution, Structures, Biological Activities and Biotechnological Studies. An Update (1995-2006). Curr Med Chem, 16, 3414-3468. BOUÉ, S. M.; CARTER, C. H.; EHRLICH, K. C.; CLEVELAND, T. E. 2000. Induction of the soybean phytoalexins coumestrol and glyceollin by Aspergillus. J Agric Food Chem, 48, 2167-2172. BRITZ, S. J. et KREMER, D. F. 2002. Warm temperatures or drought during seed maturation increase free alpha-tocopherol in seeds of soybean (Glycine max L. Merr.). J Agric Food Chem, 50, 6058-6063. BROUGHTON, W. J.; JABBOURI, S.; PERRET, X. 2000. Keys to symbiotic harmony. J Bacteriol, 182, 5641-5652. BROUGHTON, W. J.; ZHANG, F.; PERRET, X.; STAEHELIN, C. 2003. Signals exchanged between legumes and rhizobium: agricultural uses and perspectives. Plant Soil, 252, 129-137. BUER, C. S. ; IMIN, N. ; DJORDJEVIC, M. A. 2010. Flavonoids: New Roles for Old Molecules. J Integr Plant Biol, 52, 98-111. BURIAS, N. 1991. Amélioration de la fixation symbiotique de l'azote et productivité chez le soja (Glycine max. (L.) Merrill). Thèse : Physiologie végétale, 91 INPT 0023. 199 C CALDWELL, C. R.; BRITZ, S. J.; MIRECKI, R. M. 2005. Effect of temperature, elevated carbon dioxide, and drought during seed development on the isoflavone content of dwarf soybean [Glycine max (L.) Merrill] grown in controlled environments. J Agric Food Chem, 53, 1125-1129. CAMPOS-VARGAS, R.; NONOGAKI, H.; SUSLOW, T.; SALTVEIT, M. E. 2005. Heat shock treatments delay the increase in wound-induced phenylalanine ammonia-lyase activity by altering its expression, not its induction in Romaine lettuce (Lactuca sativa) tissue. Physiol Plant, 123, 82-91. CARRERA, C. ; MARTINEZ, M. J. ; DARDANELLI, J. ; BALZARINI, M. 2011. Environmental Variation and Correlation of Seed Components in Nontransgenic Soybeans: Protein, Oil, Unsaturated Fatty Acids, Tocopherols, and Isoflavones. Crop Sci, 51, 800-809. CARUSI, D. 2000. Phytoestrogens as hormone replacement therapy: an evidence-based approach. Prim Care Update Ob Gyns, 7, 253-259. CASTELO-BRANCO, C. et CANCELO HIDALGO, M. J. 2011. Isoflavones: effects on bone health. Climacteric, 14, 204-211. CEDERROTH, C. R. et NEF, S. 2009. Soy, phytoestrogens and metabolism: A review. Mol Cell Endocrinol, 304, 30-42. CETIOM 2005. Soja 2005. ed CETIOM. pp 21. CHANG, F.R.; HAYASHI, K.; CHUA, N.H.; KAMIO, S.; HUANG, Z.Y.; NOZAKI, H.; WU, Y.C. 2005. The transgenic Arabidopsis plant system, pER8-GFP, as a powerful tool in searching for natural product estrogen-agonists/antagonists. J. Nat. Prod, 68 , 971-973. CHEDRAUI, P.; SAN MIGUEL, G.; SCHWAGER, G. 2011. The effect of soy-derived isoflavones over hot flushes, menopausal symptoms and mood in climacteric women with increased body mass index. Gynecol Endocrinol, 27, 307-313. CHEN, A. et ROGAN, W. J. 2004. Isoflavones in soy infant formula: a review of evidence for endocrine and other activity in infants. Annu Rev Nutr, 24, 33-54. CHEN, H.; JIANG, H.; MORGAN, J. A. 2007. Non-natural cinnamic acid derivatives as substrates of cinnamate 4-hydroxylase. Phytochemistry, 68, 306-311. CHEN, H.; SEGUIN, P.; ARCHAMBAULT, A.; CONSTAN, L.; JABAJI, S. 2009a. Gene expression and isoflavone concentrations in soybean sprouts treated with chitosan. Crop Sci, 49, 224-236. CHEN, H.; SEGUIN, P.; JABAJI, S.; LIU, W. 2011. Spatial distribution of isoflavones and isoflavonerelated gene expression in high- and low-isoflavone soybean cultivars. Can. J. Plant Sci., 91, 697-705. CHEN, H.; SEGUIN, P.; JABAJI, S. H. 2009b. Differential expression of genes encoding the phenylpropanoid pathway upon infection of soybean seedlings by Rhizoctonia solani. Can J Plant Pathol, 31, 356-367. CHENG, G.; WILCZEK, B.; WARNER, M.; GUSTAFSSON, J. A.; LANDGREN, B. M. 2007. Isoflavone treatment for acute menopausal symptoms. Menopause, 14, 468-473. CHENG, H.; YU, O.; YU, D. Y. 2008. Polymorphisms of IFS1 and IFS2 gene are associated with isoflavone concentrations in soybean seeds. Plant Sci, 175, 505-512. CHENNUPATI, P. ; SEGUIN, P. ; LIU, W. 2011. Effects of high temperature stress at different development stages on soybean isoflavone and tocopherol concentrations. J Agric Food Chem, 59, 13081-13088. CHIARI, L. ; NAOE, L. K. ; PIOVESAN, N. D. ; JOSÉ, I. C. ; CRUZ, C. D. ; MOREIRA, M. A. ; DE BARROS, E. G. 2006. Inheritance of isoflavone contents in soybean seeds. Euphytica, 150, 141-147. CHOI, S.; HA, T.; AHN, J.; KIM, S.; KANG, K.; HWANG, I.; KIM, S. 2008. Estrogenic activities of isoflavones and flavones and their structure-activity relationships. Planta Med, 74, 25-32. CHOMCZYNSKI, P. et SACCHI, N. 1987. Single-step method of RNA isolation by acid guanidinium thiocyanate-phenol-chloroform extraction. Anal Biochem, 162, 156-159. 200 CLOUGH, S. J.; TUTEJA, J. H.; LI, M.; MAREK, L. F.; SHOEMAKER, R. C. et VODKIN, L. O. 2004. Features of a 103-kb gene-rich region in soybean include an inverted perfect repeat cluster of CHS genes comprising the I locus. Genome, 47, 819-831. CLUBBS, E. A. et BOMSER, J. A. 2009. Basal cell induced differentiation of noncancerous prostate epithelial cells (RWPE-1) by glycitein. Nutr Cancer, 61, 390-396. COOPER, J. E. 2007. Early interactions between legumes and rhizobia: disclosing complexity in a molecular dialogue. J Appl Microbiol, 103, 1355-1365. CORPET, F. 1988. Multiple sequence alignment with hierarchical clustering. Nucleic Acids Res, 16, 1088110890. CROSBY, K. C.; PIETRASZEWSKA-BOGIEL, A.; GADELLA, T. W. J., JR. ; WINKEL, B. S. J. 2011. Forster resonance energy transfer demonstrates a flavonoid metabolon in living plant cells that displays competitive interactions between enzymes. Febs Letters, 585, 2193-2198. D D'HAEZE, W. et HOLSTERS, M. 2002. Nod factor structures, responses, and perception during initiation of nodule development. Glycobiology, 12, 79R-105R. DALKIN, K.; EDWARDS, R.; EDINGTON, B.; DIXON, R. A. 1990. Stress Responses in Alfalfa (Medicago sativa L.): I. Induction of Phenylpropanoid Biosynthesis and Hydrolytic Enzymes in Elicitor-Treated Cell Suspension Cultures. Plant Physiol, 92, 440-446. DAYDÉ, J. 1989. Contribution à l'amélioration génétique du soja (Glycine max (L.) Merrill) par la création de variétés semi-déterminées ou déterminées. Thèse - Biologie et technologie végétale, option Amélioration des plantes. Institut National Polytechnique. Toulouse. DAYDÉ, J.; BERGER, M.; THEODOROU, V. 2004. Screening and breeding soybeans for isoflavone content and composition. VII World Soybean Research Conference - VI International Soybean Processing and Utilization Conference - III Congresso Brasileiro De Soja, Proceedings, 845-851. DAYDÉ, J.; BERGER, M.; THEODOROU, V. 2002. Variation of soybean isoflavones content and composition. Proceedings of CISCE 2002 (China and international soybean conference and exhibition 2002), November 6-9, Beijing, china., pp 361-362. DAYDÉ, J. et LACOMBE, S. 2000. Variation of isoflavone content and composition in soybean seeds and related products. Proceedings. Dawn of the Innovative Era for Soybeans - Proceedings of the Third International Soybean Processing and Utilisation Conference - October 15-20. Tsukuba, Ibaraki, Japan., pp. 55-58. DE VEAU, E. J. ; ROBINSON, J. M. ; WARMBRODT, R. D. ; KREMER, D. F. 1992. Photosynthate metabolism in the source leaves of n(2)-fixing soybean plants. Plant Physiol, 99, 1105-1117. DEAVOURS, B. E.; LIU, C. J.; NAOUMKINA, M. A.; TANG, Y. H.; FARAG, M. A.; SUMNER, L. W.; NOEL, J. P.; DIXON, R. A. 2006. Functional analysis of members of the isoflavone and isoflavanone O-methyltransferase enzyme families from the model legume Medicago truncatula. Plant Mol Biol, 62, 715-733. DÉNARIÉ, J.; DEBELLÉ, F. ; PROMÉ, J. C. 1996. Rhizobium lipo-chitooligosaccharide nodulation factors: signaling molecules mediating recognition and morphogenesis. Annu Rev Biochem, 65, 503-535. DESHPANDE, A. S. ; SURENDRANATHAN, K. K. ; NAIR, P. M. 1993. The phenyl propanoid pathway enzymes in Solanum tuberosum exist as a multienzyme complex. Indian J Biochem Biophys, 30, 3641. DEVI, M. K. A.; GONDI, M.; SAKTHIVELU, G.; GIRIDHAR, P.; RAJASEKARAN, T.; RAVISHANKAR, G. A. 2009. Functional attributes of soybean seeds and products, with reference to isoflavone content and antioxidant activity. Food Chem, 114, 771-776. 201 DHAUBHADEL, S.; FARHANGKHOEE, M.; CHAPMAN, R. 2008. Identification and characterization of isoflavonoid specific glycosyltransferase and malonyltransferase from soybean seeds. J Exp Bot, 59, 981-994. DHAUBHADEL, S.; GIJZEN, M.; MOY, P.; FARHANGKHOEE, M. 2007. Transcriptome analysis reveals a critical role of CHS7 and CHS8 genes for isoflavonoid synthesis in soybean seeds. Plant Physiol, 143, 326-338. DHAUBHADEL, S. et LI, X. 2010. A new client for 14-3-3 proteins: GmMYB176, an R1 MYB transcription factor. Plant Signal Behav, 5, 921-923. DHAUBHADEL, S.; MCGARVEY, B. D.; WILLIAMS, R.; GIJZEN, M. 2003. Isoflavonoid biosynthesis and accumulation in developing soybean seeds. Plant Mol Biol, 53, 733-743. DIXON, R. A. 2004. Phytoestrogens. Annu Rev Plant Biol, 55, 225-261. DIXON, R. A. ; ACHNINE, L. ; KOTA, P. ; LIU, C. J. ; REDDY, M. S. ; WANG, L. 2002. The phenylpropanoid pathway and plant defence-a genomics perspective. Mol Plant Pathol, 3, 371-390. DIXON, R. A. et FERREIRA, D. 2002. Genistein. Phytochemistry, 60, 205-211. DIXON, R. A. ; HARRISON, M. J. ; PAIVA, N. L. 1995. The isoflavonoid phytoalexin – From enzymes to genes to transcription factors. Physiol Plant, 93, 385-392. DIXON, R. A. et PAIVA, N. L. 1995. Stress-Induced Phenylpropanoid Metabolism. Plant Cell, 7, 10851097. DIXON, R. A. et STEELE, C. L. 1999. Flavonoids and isoflavonoids - a gold mine for metabolic engineering. Trends Plant Sci, 4, 394-400. DIXON, R. A. et SUMNER, L. W. 2003. Legume natural products: understanding and manipulating complex pathways for human and animal health. Plant Physiol, 131, 878-885. DOERGE, D. R. 2011. Bioavailability of soy isoflavones through placental/lactational transfer and soy food. Toxicol Appl Pharmacol, 254, 145-147. DONG, J. Y. et QIN, L. Q. 2011. Does soy isoflavone extract improve blood pressure? J Hypertens, 29, 400-1; author reply 401-402. DU, H. ; HUANG, Y. B. ; TANG, Y. X. 2010. Genetic and metabolic engineering of isoflavonoid biosynthesis. Appl Microbiol Biotechnol, 86, 1293-1312. DU, H. ; ZHANG, L. ; LIU, L. ; TANG, X. F. ; YANG, W. J. ; WU, Y. M. ; HUANG, Y. B. ; TANG, Y. X. 2009. Biochemical and molecular characterization of plant MYB transcription factor family. Biochemistry (Mosc), 74, 1-11. DUBOS, C. ; LE GOURRIEREC, J. ; BAUDRY, A. ; HUEP, G. ; LANET, E. ; DEBEAUJON, I. ; ROUTABOUL, J. M. ; ALBORESI, A. ; WEISSHAAR, B. ; LEPINIEC, L. 2008. MYBL2 is a new regulator of flavonoid biosynthesis in Arabidopsis thaliana. Plant J, 55, 940-953. DUZAN, H. M. ; ZHOU, X. ; SOULEIMANOV, A. ; SMITH, D. L. 2004. Perception of Bradyrhizobium japonicum Nod factor by soybean [Glycine max (L.) Merr.] root hairs under abiotic stress conditions. J Exp Bot, 55, 2641-2646. E ECOCHARD, R. ; DENUC, M. ; AUSSEL, P. 1978. Développement plastique et productivité du soja: étude variétale. Ann Amélior Plantes, 28, 351-370. EDWARDS, R. et DIXON, R. A. 1991. Isoflavone O-methyltransferase activities in elicitor-treated cell suspension cultures of Medicago sativa. Phytochemistry, 30, 2597-2606. EGLI, D. B. 1989. Seed growth and development in soybean. In World soybean research conf. IV. Buenos Aires, Argentina, 5-9 March. In World soybean research conf. IV. Buenos Aires, Argentina, 5-9 March, pp 256-261. 202 ELDRIDGE, A. C. et KWOLEK, W. F. 1983. Soybean isoflavones: effect of environment and variety on composition. J Agric Food Chem, 31, 394-396. F FARAG, M. A.; HUHMAN, D. V.; DIXON, R. A. ; SUMNER, L. W. 2008. Metabolomics reveals novel pathways and differential mechanistic and elicitor-specific responses in phenylpropanoid and isoflavonoid biosynthesis in Medicago truncatula cell cultures. Plant Physiol, 146, 387-402. FAVIER, J. C. ; IRELAND-RIPERT, J. ; TOQUE, C. ; FEINBERG, M. 1995. Répertoire général des aliments - Table de composition. Deuxième édition, ed. INRA-AFSSA-CIQUAL-TEC & DOC., pp 928. FDA, 1999. Food labelling: Health claims; Soy proteins and coronary heart disease. 21 CFR Part 101. Federal Register 64, 57700-57733. FEHR, W. R. et CAVINESS, C. E. 1977. Stages of soybean development. Iowa Agric. Home Econ. Exp. Stn., Iowa State: Ames, IA., Vol.80. pp 11. FEHR, W. R.; CAVINESS, C. E.; BURMOOD, D. T.; PENNINGTON, J. S. 1971. Stages of development descriptions for soybeans Glycine max (L.) Merrill. Crop Sci, 11, 929-931. FENG, S.; SONG, L.; LEE, Y. K.; HUANG, D. 2010. The Effects of Fungal Stress on the Antioxidant Contents of Black Soybeans under Germination. J Agric Food Chem, 58, 12491-12496. FERRARI, A. 2009. Soy extract phytoestrogens with high dose of isoflavones for menopausal symptoms. J Obstet Gynaecol Res, 35, 1083-1090. FERRER, J. L. ; JEZ, J. M. ; BOWMAN, M. E. ; DIXON, R. A. ; NOEL, J. P. 1999. Structure of chalcone synthase and the molecular basis of plant polyketide biosynthesis. Nat Struct Biol, 6, 775-784. FLORES-SANCHEZ, I.J. et VERPOORTE, R. 2009. Plant polyketide synthases: a fascinating group of enzymes. Plant Physiol Biochem, 47, 167-174. FIECHTER, G.; RABA, B.; JUNGMAYR, A.; MAYER, H. K. 2010. Characterization of isoflavone composition in soy-based nutritional supplements via ultra performance liquid chromatography. Anal Chim Acta, 672, 72-78. FRANK, R. L. et VODKIN, L. O. 1991. Sequence and structure of a phenylalanine ammonia-lyase gene from Glycine max. DNA Seq, 1, 335-346. G GIDEON, D.A.; KUMARI, R.; LYNN, A.M.; MANOJ, K.M. 2012. What is the Functional Role of Nterminal Transmembrane Helices in the Metabolism Mediated by Liver Microsomal Cytochrome P450 and its Reductase? Cell Biochem Biophys, 63, 35-45 GOLDBERG, R. B. ; DE PAIVA, G. ; YADEGARI, R. 1994. Plant embryogenesis: zygote to seed. Science, 266, 605-614. GOLDBERG, B. et HARADA, J. 2009. Gene networks in seed development. http://seedgenenetwork.net/. Accessed 21 May 2012. GOODSTEIN, D. M.; SHU, S.; HOWSON, R.; NEUPANE, R.; HAYES, R. D.; FAZO, J.; MITROS, T.; DIRKS, W.; HELLSTEN, U.; PUTNAM, N.; ROKHSAR, D. S. 2012. Phytozome: a comparative platform for green plant genomics. Nucleic Acids Res, 40, D1178-D1186. GRAHAM, M. Y. 2005. The diphenylether herbicide lactofen induces cell death and expression of defenserelated genes in soybean. Plant Physiol, 139, 1784-1794. 203 GRAHAM, T. et GRAHAM, M. 1991b. Glyceollin elicitors induce major but distinctly different shifts in isoflavonoid metabolism in proximal and distal soybean cell populations. Mol Plant Microbe Interact, 4, 60-68. GRAHAM, T. L. et GRAHAM, M. Y. 1996. Signaling in Soybean Phenylpropanoid Responses (Dissection of Primary, Secondary, and Conditioning Effects of Light, Wounding, and Elicitor Treatments). Plant Physiol, 110, 1123-1133. GRAHAM, T. L.; GRAHAM, M. Y.; SUBRAMANIAN, S.; YU, O. 2007. RNAi silencing of genes for elicitation or biosynthesis of 5-deoxyisoflavonoids suppresses race-specific resistance and hypersensitive cell death in Phytophthora sojae infected tissues. Plant Physiol, 144, 728-740. GRÜN, I. U. ; ADHIKARI, K. ; LI, C. ; LI, Y. ; LIN, B. ; ZHANG, J. ; FERNANDO, L. N. 2001. Changes in the profile of genistein, daidzein, and their conjugates during thermal processing of tofu. J Agric Food Chem, 49, 2839-2843. GU, L. et GU, W. 2001. Characterisation of soy isoflavones and screening for novel malonyl glycosides using high-performance liquid chromatography-electrospray ionisation-mass spectrometry. Phytochem Anal, 12, 377-382. GUO, A.; HE, K.; LIU, D.; BAI, S.; GU, X.; WEI, L.; LUO, J. 2005. DATF: a database of Arabidopsis transcription factors. Bioinformatics, 21, 2568-2569. GUTIERREZ-GONZALEZ, J. J.; GUTTIKONDA, S. K.; TRAN, L. S.; ALDRICH, D. L.; ZHONG, R.; YU, O.; NGUYEN, H. T.; SLEPER, D. A. 2010a. Differential expression of isoflavone biosynthetic genes in soybean during water deficits. Plant Cell Physiol, 51, 936-948. GUTIERREZ-GONZALEZ, J. J.; VUONG, T. D.; ZHONG, R.; YU, O.; LEE, J. D.; SHANNON, G.; ELLERSIECK, M.; NGUYEN, H. T.; SLEPER, D. A. 2011. Major locus and other novel additive and epistatic loci involved in modulation of isoflavone concentration in soybean seeds. Theor Appl Genet, 123, 1375-1385. GUTIERREZ-GONZALEZ, J. J.; WU, X. L.; GILLMAN, J. D.; LEE, J. D.; ZHONG, R.; YU, O.; SHANNON, G.; ELLERSIECK, M.; NGUYEN, H. T.; SLEPER, D. A. 2010b. Intricate environmentmodulated genetic networks control isoflavone accumulation in soybean seeds. BMC Plant Biology, 10, 105. GUTIERREZ-GONZALEZ, J. J.; WU, X. L.; ZHANG, J.; LEE, J. D.; ELLERSIECK, M.; SHANNON, J. G.; YU, O.; NGUYEN, H. T.; SLEPER, D. A. 2009. Genetic control of soybean seed isoflavone content: importance of statistical model and epistasis in complex traits. Theor Appl Genet, 119, 10691083. GUTIERREZ-ZEPEDA, A.; SANTELL, R.; WU Z.; BROWN, M.; WU, Y.; KHAN, I.; LINK, C.; ZHAO, B.; LUO, Y. 2005. Soy isoflavone glycitein protects against beta amyloid-induced toxicity and oxidative stress in transgenic Caenorhabditis elegans. BMC Neuroscience 6, 54. H HACHUL, H.; BRANDÃO, L. C.; D'ALMEIDA, V.; BITTENCOURT, L. R.; BARACAT, E. C.; TUFIK, S. 2011. Isoflavones decrease insomnia in postmenopause. Menopause, 18, 178-184. HAHLBROCK, K. 1981. Flavonoids. In: The Biochemistry of Plants. Vol 7: Secondary Plant Products, Conn EE, ed, Academic Press, New York., 425-456. HALBWIRTH, H. 2010. The creation and physiological relevance of divergent hydroxylation patterns in the flavonoid pathway. Int J Mol Sci, 11, 595-621. HALL, T. A. 1999. BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98 NT. Nucleic Acids Symposium, Serie 41, 95-98. HAMADA, J. 1996. Isolation and Identification of the multiple forms of soybean phytases. JAOCS, 73, 1143-1151. 204 HAN, R. M.; TIAN, Y. X.; LIU, Y.; CHEN, C. H.; AI, X. C.; ZHANG, J. P.; SKIBSTED, L. H. 2009. Comparison of Flavonoids and Isoflavonoids as Antioxidants. J Agric Food Chem, 57, 3780-3785. HARTUNG, R. C.; SPECHT, J. E.; WILLIAMS, J. M. 1981. Modification of soybean plant architecture by genes for stem growth habit and maturity. Crop Sci, 21, 51-56. HASEMANN, C. A.; KURUMBAIL, R. G.; BODDUPALLI, S. S.; PETERSON, J. A.; DEISENHOFER, J. 1995. Structure and function of cytochromes P450: a comparative analysis of three crystal structures. Structure, 3, 41-62. HASHIM, M. F.; HAKAMATSUKA, T.; EBIZUKA, Y.; SANKAWA, U. 1990. Reaction mechanism of oxidative rearrangement of flavanone in isoflavone biosynthesis. FEBS Lett, 271, 219-222. HATTON, D.; SABLOWSKI, R.; YUNG, M. H.; SMITH, C.; SCHUCH, W.; BEVAN, M. 1995. Two classes of cis sequences contribute to tissue-specific expression of a PAL2 promoter in transgenic tobacco. Plant J, 7, 859-876. HE, X. Z.; REDDY, J. T.; DIXON, R. A. 1998. Stress responses in alfalfa (Medicago sativa L). XXII. cDNA cloning and characterization of an elicitor-inducible isoflavone 7-O-methyltransferase. Plant Mol Biol, 36, 43-54. HEMPEL, J.; ZEHNER, S.; GÖTTFERT, M.; PATSCHKOWSKI, T. 2009. Analysis of the secretome of the soybean symbiont Bradyrhizobium japonicum. J Biotechnol, 140, 51-58. HERMANN, S.; BERNDT, K. D.; WRIGHT, A. P. 2001. How transcriptional activators bind target proteins. J Biol Chem, 276, 40127-40132. HICHRI, I. ; BARRIEU, F. ; BOGS, J. ; KAPPEL, C. ; DELROT, S. ; LAUVERGEAT, V. 2011. Recent advances in the transcriptional regulation of the flavonoid biosynthetic pathway. J Exp Bot, 62, 24652483. HIRNER, B.; FISCHER, W. N.; RENTSCH, D.; KWART, M.; FROMMER, W. B. 1998. Developmental control of H+/amino acid permease gene expression during seed development of Arabidopsis. Plant J, 14, 535-544. HIROTA, A.; INABA, M.; CHEN, Y. C.; ABE, N.; TAKI, S.; YANO, M.; KAWAII, S. 2004. Isolation of 8hydroxyglycitein and 6-hydroxydaidzein from soybean miso. Biosci Biotechnol Biochem, 68, 13721374. HONG, S. K.; KITANO, H.; SATOH, H.; NAGATO, Y. 1996. How is embryo size genetically regulated in rice? Development, 122, 2051-2058. HSIEH, M. C. et GRAHAM, T. L. 2001. Partial purification and characterization of a soybean betaglucosidase with high specific activity towards isoflavone conjugates. Phytochemistry, 58, 995-1005. HUBERT, J. 2006. Caractérisation biochimique et propriétés biologiques des micronutriments du germe de soja :étude des voies de sa valorisation en nutrition et santé humaines. PhD, INP - EI Purpan. HUR, S.; NEWBY, Z. E.; BRUICE, T. C. 2004. Transition state stabilization by general acid catalysis, water expulsion, and enzyme reorganization in Medicago savita chalcone isomerase. Proc Natl Acad Sci, 101, 2730-2735. HYMOWITZ, T. et COLLINS, F. L. 1974. Variability of sugar content in seed of G. max and G. soja. Agron J, 66, 239-240. I IBRAHIM, R. K. ; BRUNEAU, A. ; BANTIGNIES, B. 1998. Plant O-methyltransferases: molecular analysis, common signature and classification. Plant Mol Biol, 36, 1-10. IP, H.; D'AOUST, F.; BEGUM, A. A.; ZHANG, H.; SMITH, D. L.; DRISCOLL, B. T.; CHARLES, T. C. 2001. Bradyrhizobium japonicum mutants with enhanced sensitivity to genistein resulting in altered nod gene regulation. Mol Plant Microbe Interact, 14, 1404-1410. 205 J JENKINS, G. I. 2009. Signal transduction in responses to UV-B radiation. Annu Rev Plant Biol, 60, 407-431. JEZ, J. M.; BOWMAN, M. E.; NOEL, J. P. 2002. Role of hydrogen bonds in the reaction mechanism of chalcone isomerase. Biochemistry, 41, 5168-5176. JEZ, J. M. et NOEL, J. P. 2002. Reaction mechanism of chalcone isomerase. pH dependence, diffusion control, and product binding differences. J Biol Chem, 277, 1361-1369. JIN, H. et MARTIN, C. 1999. Multifunctionality and diversity within the plant MYB-gene family. Plant Mol Biol, 41, 577-585. JONES, P. et VOGT, T. 2001. Glycosyltransferases in secondary plant metabolism: tranquilizers and stimulant controllers. Planta, 213, 164-174. JORGENSEN, K.; RASMUSSEN, A. V.; MORANT, M.; NIELSEN, A. H.; BJARNHOLT, N.; ZAGROBELNY, M.; BAK, S.; MOLLER, B. L. 2005. Metabolon formation and metabolic channeling in the biosynthesis of plant natural products. Curr Opin Plant Biol, 8, 280-291. JUNG, W.; YU, O.; LAU, S. M. C.; O'KEEFE, D. P.; ODELL, J.; FADER, G.; MCGONIGLE, B. 2000. Identification and expression of isoflavone synthase, the key enzyme for biosynthesis of isoflavones in legumes. Nat Biotechnol, 18, 208-212. JURGONSKI, L. J.; SMART, D. J.; BUGBEE, B.; NIELSEN, S. S. 1997. Controlled environments alter nutrient content of soybeans. Adv Space Res, 20, 1979-1988. K KANG, K.A.; ZHANG, R.; PIAO, M.J.; LEE, K.H.; KIM, B.J.; KIM, S.Y.; KIM, H.S.; KIM, D.H; YOU, H.J.; HYUN, J.W. 2007. Inhibitory effects of glycitein on hydrogen peroxide induced cell damage by scavenging reactive oxygen species and inhibiting c-Jun N-terminal kinase. Free Radic Res, 41, 720729. KASSEM, M.; MEKSEM, K.; IQBAL, M.; NJITI, V.; BANZ, W.; WINTERS, T.; WOOD, A.; LIGHTFOOT, D. 2004. Definition of soybean genomic regions that control seed phytoestrogen amounts. Journal of Biomed and Biotech, 1, 52-60. KELLY, L. A.; O'LEARY, J. J.; SEIDLOVA-WUTTKE, D.; WUTTKE, W.; NORRIS, L. A. 2010. Genistein alters coagulation gene expression in ovariectomised rats treated with phytoestrogens. Thromb Haemost, 104, 1250-1257. KEMPER, B. 2004. Structural basis for the role in protein folding of conserved proline-rich regions in cytochromes P450. Toxicol Appl Pharmacol, 199, 305-315. KHAN, W.; PRITHIVIRAJ, B.; SMITH, D. L. 2003. Chitosan and chitin oligomers increase phenylalanine ammonia-lyase and tyrosine ammonia-lyase activities in soybean leaves. J Plant Physiol, 160, 859863. KIM, B. G.; LEE, H. J.; PARK, Y.; LIM, Y.; AHN, J. H. 2006a. Characterization of an O-methyltransferase from soybean. Plant Physiol Biochem, 44, 236-241. KIM, B. G.; LEE, Y. J.; LEE, S.; LIM, Y.; CHEONG, Y.; AHN, J. H. 2008. Altered regioselectivity of a poplar O-methyltransferase, POMT-7. J Biotechnol, 138, 107-111. KIM, D. H.; KIM, B. G.; LEE, Y.; RYU, J. Y.; LIM, Y.; HUR, H. G.; AHN, J. H. 2005a. Regiospecific methylation of naringenin to ponciretin by soybean O-methyltransferase expressed in Escherichia coli. J Biotechnol, 119, 155-162. KIM, D. H.; KIM, B. G.; PARK, S. H.; KIM, N. Y.; LEE, Y. J.; MIN, S. Y.; PARK, Y. B.; LEE, J. B.; KIM, J. C.; LIM, Y.; CHONG, Y.; AHN, J. H. 2009. O-Methyltransferase from Soybean Uses Both Caffeoyl-CoA and Flavonoids as Substrates. J Kor Soc Appl Biol Chem, 52, 114-120. 206 KIM, E. H.; KIM, S. H.; CHUNG, J. I.; CHI, H. Y.; KIM, J. A.; CHUNG, I. M. 2006b. Analysis of phenolic compounds and isoflavones in soybean seeds (Glycine max (L.) merill) and sprouts grown under different conditions. Eur . Food Res . Technol., 222, 201-208. KIM, E. H.; SEGUIN, P.; LEE, J. E.; YOON, C. G.; SONG, H. K.; AHN, J. K.; CHUNG, I. M. 2011. Elevated Ultraviolet-B Radiation Reduces Concentrations of Isoflavones and Phenolic Compounds in Soybean Seeds. J Agron Crop Sci, 197, 75-80. KIM, H. K.; JANG, Y. H.; BAEK, H. S.; LEE, J. H.; PARK, M. J.; CHUNG, Y. S.; CHUNG, J. I.; KIM, J. K. 2005b. Polymorphism and expression of isoflavone synthase genes from soybean cultivars. Mol Cells, 19, 67-73. KIM, J. A. et CHUNG, I. M. 2007. Change in isoflavone concentration of soybean (Glycine max L.) seeds at different growth stages. J Sci Food Agric, 87, 496-503. KIM, J.A.; HONG, S.B.; JUNG, W.S.; YU C.Y.; MA, K.H.; GWAG J.G.; CHUNG, I.M. 2007. Comparison of isoflavones composition in seed, embryo, cotyledon and seed coat of cooked-with-rice and vegetable soybean (Glycine max L.) varieties. Food Chem., 102 , 738-744 KIM, M. H.; GUTIERREZ, A. M.; GOLDFARB, R. H. 2002. Different mechanisms of soy isoflavones in cell cycle regulation and inhibition of invasion. Anticancer Res, 22, 3811-3817. KIM, S. L.; BERHOW, M. A.; KIM, J. T.; CHI, H. Y.; LEE, S. J.; CHUNG, I. M. 2006c. Evaluation of soyasaponin, isoflavone, protein, lipid, and free sugar accumulation in developing soybean seeds. J Agric Food Chem, 54, 10003-10. KIMURA, Y. ; AOKI, T. ; AYABE, S. 2001. Chalcone isomerase isozymes with different substrate specificities towards 6'-hydroxy- and 6'-deoxychalcones in cultured cells of Glycyrrhiza echinata, a leguminous plant producing 5-deoxyflavonoids. Plant Cell Physiol, 42, 1169-1173. KINUGASA, T.; SATO, T.; OIKAWA, S.; HIROSE, T. 2011. Demand and supply of N in seed production of soybean (Glycine max) at different N fertilization levels after flowering. J Plant Res, 125, 275-281. KLUS, R. et BARZ, W. 1995. Formation of polyhydroxylated isoflavones from soybean seed isoflavone daidzein and glycitein by bacteria isolated from tempe. Arch Microbiol, 164, 428-434. KOK, L.; KREIJKAMP-KASPERS, S.; GROBBEE, D. E.; LAMPE, J. W.; VAN DER SCHOUW, Y. T. 2005. Soy isoflavones, body composition, and physical performance. Maturitas, 52, 102-110. KOSSLAK, R. M.; BOOKLAND, R.; BARKEI, J.; PAAREN, H. E.; APPELBAUM, E. R. 1987. Induction of Bradyrhizobium japonicum common nod genes by isoflavones isolated from Glycine max. Proc Natl Acad Sci U S A, 84, 7428-7132. KÖSTER, J. et BARZ, W. 1981. UDP-glucose:isoflavone 7-O-glucosyltransferase from roots of chick pea (Cicer arietinum L.). Arch Biochem Biophys, 212, 98-104. KRANZ, E.; VON WIEGEN P; QUADER, H.; LORZ, H. 1998. Endosperm development after fusion of isolated, single maize sperm and central cells in vitro. Plant Cell, 10, 511-24. KUDOU, S. ; SHIMOYAMADA, M. ; IMURA, T. ; UCHIDA, T. ; OKUBO, K. 1991. A new isoflavone glycoside in soybean seeds (Glycine max L. Merrill), glycitein 7-o-beta-d-(6''-o-acetyl)glucopyranoside. Agric Biol Chem, 55, 859-860. KUHNLE, G. G.; WARD, H. A.; VOGIATZOGLOU, A.; LUBEN, R. N.; MULLIGAN, A.; WAREHAM, N. J.; FOROUHI, N. G.; KHAW, K. T. 2011. Association between dietary phyto-oestrogens and bone density in men and postmenopausal women. Br J Nutr, 1-7. KUIPER, G. G.; LEMMEN, J. G.; CARLSSON, B.; CORTON, J. C.; SAFE, S. H.; VAN DER SAAG, P. T.; VAN DER BURG, B.; GUSTAFSSON, J. A. 1998. Interaction of estrogenic chemicals and phytoestrogens with estrogen receptor beta. Endocrinology, 139, 4252-4263. KUMAR, V. ; RANI, A. ; DIXIT, A. K. ; BHATNAGAR, D. ; CHAUHAN, G. S. 2009. Relative Changes in Tocopherols, Isoflavones, Total Phenolic Content, and Antioxidative Activity in Soybean Seeds at Different Reproductive Stages. J Agric Food Chem, 57, 2705-2710. 207 KUMAR, V.; RANI, A.; GOYAL, L.; DIXIT, A. K.; MANJAYA, J. G.; DEV, J.; SWAMY, M. 2010. Sucrose and raffinose family oligosaccharides (RFOs) in soybean seeds as influenced by genotype and growing location. J Agric Food Chem, 58, 5081-5085. KYTE, J.et DOOLITTLE, R.F. 1982. A simple method for displaying the hydropathic character of a protein. J Mol Biol 157, 105-132. L LABALETTE, F. ; BOURREL, C. ; JOUFFRET, P. ; LECOMTE, V. ; QUINSAC, A. ; LEDOUX, S. 2010. Panorama et futur de la filière du soja français. O.C.L., 17, 345-355. LAM, K. C.; IBRAHIM, R. K.; BEHDAD, B.; DAYANANDAN, S. 2007. Structure, function, and evolution of plant O-methyltransferases. Genome, 50, 1001-1013. LANG, K.; LINDEMANN, A.; HAUSER, F.; GÖTTFERT, M. 2008. The genistein stimulon of Bradyrhizobium japonicum. Mol Genet Genomics, 279, 203-211. LATUNDE-DADA, A. O.; CABELLO-HURTADO, F.; CZITTRICH, N.; DIDIERJEAN, L.; SCHOPFER, C.; HERTKORN, N.; WERCK-REICHHART, D.; EBEL, J. 2001. Flavonoid 6-hydroxylase from soybean (Glycine max L.), a novel plant P-450 monooxygenase. J Biol Chem, 276, 1688-1695. LE DEUNFF, Y. et RACHIDIAN, Z. 1988. Interruption of water delivery at physiological maturity is essential for seed development, germination and seedling growth in pea. J Exp Bot, 39, 1221-1230. LEE, D. E.; LEE, K. W.; JUNG, S. K.; LEE, E. J.; HWANG, J. A.; LIM, T. G.; KIM, B. Y.; BODE, A. M.; LEE, H. J.; DONG, Z. G. 2011. 6,7,4'-Trihydroxyisoflavone inhibits HCT-116 human colon cancer cell proliferation by targeting CDK1 and CDK2. Carcinogenesis, 32, 629-635. LEE, E. J.; KIM, S. Y.; HYUN, J. W.; MIN, S. W.; KIM, D. H.; KIM, H. S. 2010a. Glycitein inhibits glioma cell invasion through down-regulation of MMP-3 and MMP-9 gene expression. Chem Biol Interact, 185, 18-24. LEE, M. R.,;KIM, J. Y.; CHUN, J.; PARK, S.; KIM, H. J.; KIM, J. S.; JEONG, J. I.; KIM, J. H. 2010b. Induction of glyceollins by fungal infection in varieties of Korean soybean. J Microbiol Biotechnol, 20, 1226-1229. LEE, S.; YAN, W.; AHN, J.; CHUNG, I. 2003. Effects of year, site, genotype and their interactions on various soybean isoflavones. Field Crops Res, 81, 181-192. LEROUGE, P.; ROCHE, P. ; FAUCHER, C. ; MAILLET, F. ; TRUCHET, G. ; PROMÉ, J. C. ; DÉNARIÉ, J. 1990. Symbiotic host-specificity of Rhizobium meliloti is determined by a sulphated and acylated glucosamine oligosaccharide signal. Nature, 344, 781-784. LI, L., MODOLO, L. V. ; ESCAMILLA-TREVINO, L. L. ; ACHNINE, L. ; DIXON, R. A. ; WANG, X. 2007. Crystal structure of Medicago truncatula UGT85H2--insights into the structural basis of a multifunctional (iso)flavonoid glycosyltransferase. J Mol Biol, 370, 951-963. LI, X., DUAN, X.; JIANG, H.; SUN, Y.; TANG, Y.; YUAN, Z.; GUO, J.; LIANG, W.; CHEN, L.; YIN, J.; MA, H.; WANG, J.; ZHANG, D. 2006. Genome-wide analysis of basic/helix-loop-helix transcription factor family in rice and Arabidopsis. Plant Physiol, 141, 1167-1184. LI, X. J.; AN, P.; ENEJI, A. E.; HAMAMURA, K.; LUX, A.; INANAGA, S. 2005. Growth and yield responses of two soybean cultivars to defoliation and water stress. Biologia, 60, 467-472. LIANG, X. W. ; DRON, M. ; CRAMER, C. L. ; DIXON, R. A. ; LAMB, C. J. 1989. Differential regulation of phenylalanine ammonia-lyase genes during plant development and by environmental cues. J Biol Chem, 264, 14486-14492. LIBAULT, M.; JOSHI, T.; BENEDITO, V. A.; XU, D.; UDVARDI, M. K.; STACEY, G. 2009. Legume transcription factor genes: what makes legumes so special? Plant Physiol, 151, 991-1001. 208 LIU, C. J.; DEAVOURS, B. E.; RICHARD, S. B.; FERRER, J. L.; BLOUNT, J. W.; HUHMAN, D.; DIXON, R. A.; NOEL, J. P. 2006. Structural basis for dual functionality of isoflavonoid Omethyltransferases in the evolution of plant defense responses. Plant Cell, 18, 3656-3669. LIU, C. J. et DIXON, R. A. 2001. Elicitor-induced association of isoflavone O-methyltransferase with endomembranes prevents the formation and 7-O-methylation of daidzein during isoflavonoid phytoalexin biosynthesis. Plant Cell, 13, 2643-2658. LIU, G. Y. 2009. Isolation, sequence identification and tissue expression profile of two novel soybean (Glycine max) genes-vestitone reductase and chalcone reductase. Mol Biol Rep, 36, 1991-1994. LIU, X. X.; LI, S. H.; CHEN, J. Z.; SUN, K.; WANG, X. J.; WANG, X. G.; HUI, R. T. 2012. Effect of soy isoflavones on blood pressure: A meta-analysis of randomized controlled trials. Nutr Metab Cardiovasc Dis, 22, 463-470. LOF, M. et WEIDERPASS, E. 2006. Epidemiologic evidence suggests that dietary phytoestrogen intake is associated with reduced risk of breast, endometrial, and prostate cancers. Nutr Res, 26, 609-619. LONG, S. R. 1996. Rhizobium symbiosis: nod factors in perspective. Plant Cell, 8, 1885-1898. LOYALL, L.; UCHIDA, K.; BRAUN, S.; FURUYA, M.; FROHNMEYER, H. 2000. Glutathione and a UV light-induced glutathione S-transferase are involved in signaling to chalcone synthase in cell cultures. Plant Cell, 12, 1939-1950. LOZOVAYA, V.; LYGIN, A.; ULANOV, A.; NELSON, R.; DAYDÉ, J.; WIDHOHN, J. 2005. Effect of temperature and soil moisture status during seed development on soybean seed isoflavone concentration and composition. Crop Sci, 45, 1934-1940. LOZOVAYA, V. V.; LYGIN, A. V.; ZERNOVA, O. V.; LI, S.; HARTMAN, G. L.; WIDHOLM, J. M. 2004. Isoflavonoid accumulation in soybean hairy roots upon treatment with Fusarium solani. Plant Physiol Biochem, 42, 671-679. LYGIN, A. V.; HILL, C. B.; ZERNOVA, O. V.; CRULL, L.; WIDHOLM, J. M.; HARTMAN, G. L.; LOZOVAYA, V. V. 2010. Response of Soybean Pathogens to Glyceollin. Phytopathology, 100, 897903. M MACKOVA, Z.; KOBLOVSKA, R.; LAPCIK, O. 2006. Distribution of isoflavonoids in non-leguminous taxa - an update. Phytochemistry, 67, 849-855. MAGEE, P. J.; MCGLYNN, H.; ROWLAND, I. R. 2004. Differential effects of isoflavones and lignans on invasiveness of MDA-MB-231 breast cancer cells in vitro. Cancer Lett, 208, 35-41. MARTIN, D.; SONG, J.; MARK, C.; EYSTER, K. 2008. Understanding the cardiovascular actions of soy isoflavones: potential novel targets for antihypertensive drug development. Cardiovasc Hematol Disord Drug Targets, 8, 297-312. MASOUMI, H. ; MASOUMI, M. ; DARVISH, F. ; DANESHIAN, J. ; NOURMOHAMMADI, G. ; HABIBI, D. 2010. Change in several Antioxidant Enzymes Activity and Seed Yield by Water Deficit Stress in Soybean (Glycine max L ) Cultivars. Notulae Botanicae Horti Agrobotanici Cluj-Napoca, 38, 86-94. MATSUMURA, H.; WATANABE, S.; HARADA, K.; SENDA, M.; AKADA, S.; KAWASAKI, S.; DUBOUZET, E. G.; MINAKA, N.; TAKAHASHI, R. 2005. Molecular linkage mapping and phylogeny of the chalcone synthase multigene family in soybean. Theor Appl Genet, 110, 1203-1209. MEKSEM, K.; NJITI, V. N.; BANZ, W. J.; IQBAL, M. J.; KASSEM, M. M.; HYTEN, D. L.; YUANG, J.; WINTERS, T. A.; LIGHTFOOT, D. A. 2001. Genomic Regions That Underlie Soybean Seed Isoflavone Content. J Biomed Biotechnol, 1, 38-44. MESSINA, M. et HILAKIVI-CLARKE, L. 2009. Early intake appears to be the key to the proposed protective effects of soy intake against breast cancer. Nutr Cancer, 61, 792-798. 209 MESSINA, M.; WATANABE, S.; SETCHELL, K.D.R. 2009. Report on the 8th International Symposium on the Role of Soy in Health Promotion and Chronic Disease Prevention and Treatment. J.Nutr., 139, 796S-802S MESSINA, M. et WU, A. H. 2009. Perspectives on the soy-breast cancer relation. AmerJ Clin Nutr, 89, S1673-S1679. MILIĆ, V.; MRKOVACKI, N.; POPOVIĆ, M. 1996. Activity of nitrogen fixation and nitrogen assimilation enzymes in soybean plants inoculated with Bradyrhizobium japonicum strains. Acta Microbiol Immunol Hung, 43, 135-141. MIYAKE, K.; ITO, T.; SENDA, M.; ISHIKAWA, R.; HARADA, T.; NIIZEKI, M.; AKADA, S. 2003. Isolation of a subfamily of genes for R2R3-MYB transcription factors showing up-regulated expression under nitrogen nutrient-limited conditions. Plant Mol Biol, 53, 237-245. MIZUTANI, M.; OHTA, D.; SATO, R. 1997. Isolation of a cDNA and a genomic clone encoding cinnamate 4-hydroxylase from Arabidopsis and its expression manner in planta. Plant Physiol, 113, 755-763. MIZUTANI, M. et SATO, F. 2011. Unusual P450 reactions in plant secondary metabolism. Arch Biochemy Biophys, 507, 194-203. MODOLO, L. V.; BLOUNT, J. W.; ACHNINE, L.; NAOUMKINA, M. A.; WANG, X.; DIXON, R. A. 2007. A functional genomics approach to (iso)flavonoid glycosylation in the model legume Medicago truncatula. Plant Mol Biol, 64, 499-518. MODOLO, L. V. ; CUNHA, F. Q. ; BRAGA, M. R. ; SALGADO, I. 2002. Nitric oxide synthase-mediated phytoalexin accumulation in soybean cotyledons in response to the Diaporthe phaseolorum f. sp. meridionalis elicitor. Plant Physiol, 130, 1288-1297. MOHAMED, A. I.; MEBRAHTU, T.; RANGAPPA, M. 1991. Nutrient composition and anti-nutritional factors in selected vegetable soybean (Glycine max [L.] Merr.). Plant Foods Hum Nutr, 41, 89-100. MONJE, M. C. ; BERGER, M. ; FARINES, V. ; REYBIER, K. ; VERGER, A. ; DAYDÉ, J. ; THEODOROU, V. ; NEPVEU, F. 2006. Antioxidant capacity of cotyledons and germs of soybean in relation to their isoflavone content. Food Technol Biotechnol, 44, 493-498. MORRISON, M. J.; COBER, E. R.; SALEEM, M. F.; MCLAUGHLIN, N. B.; FREGEAU-REID, J.; MA, B. L.; WOODROW, L. 2010. Seasonal changes in temperature and precipitation influence isoflavone concentration in short-season soybean. Field Crops Research, 117, 113-121. N NAGARAJAN, S. 2010. Mechanisms of anti-atherosclerotic functions of soy-based diets. J Nutr Biochem, 21, 255-260. NAOUMKINA, M.; FARAG, M. A.; SUMNER, L. W.; TANG, Y.; LIU, C. J.; DIXON, R. A. 2007. Different mechanisms for phytoalexin induction by pathogen and wound signals in Medicago truncatula. Proc Natl Acad Sci U S A, 104, 17909-17915. NAOUMKINA, M. A.; ZHAO, Q.; GALLEGO-GIRALDO, L.; DAI, X.; ZHAO, P. X.; DIXON, R. A. 2010. Genome-wide analysis of phenylpropanoid defence pathways. Mol Plant Pathol, 11, 829-846. NAPOLES, M. C. ; GUEVARA, E. ; MONTERO, F. ; ROSSI, A. ; FERREIRA, A. 2009. Role of Bradyrhizobium japonicum induced by genistein on soybean stressed by water deficit. Spanish J Agric Res, 7, 665-671. NELSON, D. et WERCK-REICHHART, D. 2011. A P450-centric view of plant evolution. Plant J, 66, 194211. NELSON, D. R. 1999. Cytochrome P450 and the individuality of species. Arch Biochem Biophys, 369, 1-10. NELSON, D. R. 2009. The cytochrome p450 homepage. Hum Genomics, 4, 59-65. NELSON, D. R. 2011. Progress in tracing the evolutionary paths of cytochrome P450. Biochim Biophys Acta, 1814, 14-18. 210 NELSON, D. R.; KOYMANS, L.; KAMATAKI, T.; STEGEMAN, J. J.; FEYEREISEN, R.; WAXMAN, D. J.; WATERMAN, M. R.; GOTOH, O.; COON, M. J.; ESTABROOK, R. W.; GUNSALUS, I. C.; NEBERT, D. W. 1996. P450 superfamily: update on new sequences, gene mapping, accession numbers and nomenclature. Pharmacogenetics, 6, 1-42. NEUHAUS, G.; BOWLER, C.; HIRATSUKA, K.; YAMAGATA, H.; CHUA, N. H. 1997. Phytochromeregulated repression of gene expression requires calcium and cGMP. EMBO J, 16, 2554-2564. NEWTON, R. P. et SMITH, C. J. 2004. Cyclic nucleotides. Phytochemistry, 65, 2423-2437. NEY, B.; DUTHION, C.; FONTAINE, E. 1993. Timing of reproductive abortions in relation to cell division, water content, and growth of pea seeds. Crop Sci, 33, 267-270. NI, W. ; FAHRENDORF, T. ; BALLANCE, G. M. ; LAMB, C. J. ; DIXON, R. A. 1996. Stress responses in alfalfa (Medicago sativa L.). XX. Transcriptional activation of phenlpropanoid pathway genes in elicitor-induced cell suspension cultures. Plant Mol Biol, 30, 427-438. NOGUCHI, A.; SAITO, A.; HOMMA, Y.; NAKAO, M.; SASAKI, N.; NISHINO, T.; TAKAHASHI, S.; NAKAYAMA, T. 2007. A UDP-glucose:isoflavone 7-O-glucosyltransferase from the roots of soybean (Glycine max) seedlings. Purification, gene cloning, phylogenetics, and an implication for an alternative strategy of enzyme catalysis. J Biol Chem, 282, 23581-23590. O OLDROYD, G. E. et DOWNIE, J. A. 2008. Coordinating nodule morphogenesis with rhizobial infection in legumes. Annu Rev Plant Biol, 59, 519-546. OMURA, T. et SATO, R. 1964. The carbon monoxide-binding pigment of liver microsomes. I . Evidence for its hemoprotein nature. J Biol Chem, 239, 2370-2378. OPSAHL-FERSTAD, H. G.; LE DEUNFF, E.; DUMAS, C.; ROGOWSKY, P. M. 1997. ZmEsr, a novel endosperm-specific gene expressed in a restricted region around the maize embryo. Plant J, 12, 235246. P PAIVA, N. L. 2000. An introduction to the biosynthesis of chemicals used in plant-microbe communication. J Plant Growth Regulation, 19, 131-143. PANKHURST, C. E. et BIGGS, D. R. 1980. Sensitivity of Rhizobium to selected isoflavonoids. Can J Microbiol, 26, 542-545. PAOLOCCI, F. ; ROBBINS, M. P. ; PASSERI, V. ; HAUCK, B. ; MORRIS, P. ; RUBINI, A. ; ARCIONI, S. ; DAMIANI, F. 2011. The strawberry transcription factor FaMYB1 inhibits the biosynthesis of proanthocyanidins in Lotus corniculatus leaves. J Exp Bot, 62, 1189-1200. PEEL, G. J.; PANG, Y.; MODOLO, L. V.; DIXON, R. A. 2009. The LAP1 MYB transcription factor orchestrates anthocyanidin biosynthesis and glycosylation in Medicago. Plant J, 59, 136-149. PEREZGRAU, L. et GOLDBERG, R.B. 1989. Soybean seed protein genes are regulated spatially during embryogenesis. Plant Cell, 1, 1095-1109. PFAFFL, M. W.; TICHOPAD, A.; PRGOMET, C.; NEUVIANS, T. P. 2004. Determination of stable housekeeping genes, differentially regulated target genes and sample integrity: BestKeeper--Excelbased tool using pair-wise correlations. Biotechnol Lett, 26, 509-515. PFEIFFER, E.; GRAF, E.; GERSTNER, S.; METZLER, M. 2006. Stimulation of estradiol glucuronidation: a protective mechanism against estradiol-mediated carcinogenesis? Mol Nutr Food Res, 50, 385-389. 211 PIERREL, M. A. ; BATARD, Y. ; KAZMAIER, M. ; MIGNOTTE-VIEUX, C. ; DURST, F. ; WERCKREICHHART, D. 1994. Catalytic properties of the plant cytochrome P450 CYP73 expressed in yeast. Substrate specificity of a cinnamate hydroxylase. Eur J Biochem, 224, 835-844. POSMYK, M. M.; BAILLY, C.; SZAFRAŃSKA, K.; JANAS, K. M.; CORBINEAU, F. 2005. Antioxidant enzymes and isoflavonoids in chilled soybean (Glycine max (L.) Merr.) seedlings. J Plant Physiol, 162, 403-12. PREGELJ, L.; MCLANDERS, J. R.; GRESSHOFF, P. M.; SCHENK, P. M. 2011. Transcription profiling of the isoflavone phenylpropanoid pathway in soybean in response to Bradyrhizobium japonicum inoculation. Func Plant Biol, 38, 13-24. PRIMOMO, V. S.; POYSA, V.; ABLETT, G. R.; JACKSON, C. J.; GIJZEN, M. ; RAJCAN, I. 2005. Mapping QTL for individual and total isoflavone content in soybean seeds. Crop Sci, 45, 2454-2464. Q QIAN, W.; TAN, G.; LIU, H.; HE, S.; GAO, Y.; AN, C. 2007. Identification of a bHLH-type G-box binding factor and its regulation activity with G-box and Box I elements of the PsCHS1 promoter. Plant Cell Rep, 26, 85-93. QU, L. J. et ZHU, Y. X. 2006. Transcription factor families in Arabidopsis: major progress and outstanding issues for future research. Curr Opin Plant Biol, 9, 544-549. R RABEA, E. I.; BADAWY, M. E.; STEVENS, C. V.; SMAGGHE, G.; STEURBAUT, W. 2003. Chitosan as antimicrobial agent: applications and mode of action. Biomacromolecules, 4, 1457-1465. RALSTON, L.; SUBRAMANIAN, S.; MATSUNO, M.; YU, O. 2005. Partial reconstruction of flavonoid and isoflavonoid biosynthesis in yeast using soybean type I and type II chalcone isomerases. Plant Physiol, 137, 1375-1388. RASOLOHERY, C. A.; BERGER, M.; LYGIN, A. V.; LOZOVAYA, V. V.; NELSON, R. L.; DAYDÉ, J. 2008. Effect of temperature and water availability during late maturation of the soybean seed on germ and cotyledon isoflavone content and composition. J Sci Food Agric, 88, 218-228. RIECHMANN, J. L.; HEARD, J.; MARTIN, G.; REUBER, L.; JIANG, C.; KEDDIE, J.; ADAM, L.; PINEDA, O.; RATCLIFFE, O. J.; SAMAHA, R. R.; CREELMAN, R.; PILGRIM, M.; BROUN, P.; ZHANG, J. Z.; GHANDEHARI, D.; SHERMAN, B. K.; YU, G. 2000. Arabidopsis transcription factors: genome-wide comparative analysis among eukaryotes. Science, 290, 2105-2110. RIECHMANN, J. L. et RATCLIFFE, O. J. 2000. A genomic perspective on plant transcription factors. Curr Opin Plant Biol, 3, 423-434. RIEDEL, K. M.; LEE, J. H.; RENITA, M.; MARTIN, K. S.; SCHWARTZ, S. J.; VODOVOTZ, Y. 2007. Isoflavones profiles, phenol content, and antioxidant activity of soybean seeds as influenced by cultivar and growing location in Ohio. J. Sci. Food Agric., 87, 1197-1206. ROBERTS, S. G. 2000. Mechanisms of action of transcription activation and repression domains. Cell Mol Life Sci, 57, 1149-1160. ROLFE, B. G. 1988. Flavones and isoflavones as inducing substances of legume nodulation. Biofactors, 1, 310. ROMERO, I.; FUERTES, A.; BENITO, M. J.; MALPICA, J. M.; LEYVA, A. ; PAZ-ARES, J. 1998. More than 80 R2R3-MYB regulatory genes in the genome of Arabidopsis thaliana. Plant J, 14, 273-284. ROZEN, S. et SKALETSKY, H. 2000. Primer3 on the WWW for general users and for biologist programmers. Methods Mol Biol, 132, 365-386. 212 RUEFER, C.; MAUL, R.; DONAUER, E.; FABIAN, E.; KULLING, S. 2007. In vitro and in vivo metabolism of the soy isoflavone glycitein. Mol Nutr. Food Res. 51, 813-823. RUIJTER, J.; RAMAKERS, C.; HOOGAARS, W.; BAKKER, O.; VAN DEN HOFF, M.; KARLEN, Y; MOORMAN, A. 2009. Amplification efficiency: linking baseline and bias in the analysis of quantitative PCR data. Nucleic Acids Res, 37, e45 RUPASINGHE, H. P.; JACKSON, C. J.; POYSA, V.; DI BERARDO, C.; BEWLEY, J. D.; JENKINSON, J. 2003. Soyasapogenol A and B distribution in soybean (Glycine max L. Merr.) in relation to seed physiology, genetic variability, and growing location. J Agric Food Chem, 51, 5888-5894. RUSSELL, D. W. et CONN, E. E. 1967. The cinnamic acid 4-hydroxylase of pea seedlings. Arch Biochem Biophys, 122, 256-258. RYDER, T. B.; HEDRICK, S. A.; BELL, J. N.; LIANG, X. W.; CLOUSE, S. D.; LAMB, C. J. 1987. Organization and differential activation of a gene family encoding the plant defense enzyme chalcone synthase in Phaseolus vulgaris. Mol Gen Genet, 210, 219-233. S SAKAMOTO, T.; HORIGUCHI, H.; OGUMA, E.; KAYAMA, F. 2010. Effects of diverse dietary phytoestrogens on cell growth, cell cycle and apoptosis in estrogen-receptor-positive breast cancer cells. J Nutr Biochem, 21, 856-864. SAMBROOK, J. et FRITSCH E., T M. 1989. Molecular cloning: A laboratory manual, 2nd ed. Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press. SAMESHIMA-SAITO, R.; CHIBA, K.; HIRAYAMA, J.; ITAKURA, M.; MITSUI, H.; EDA, S.; MINAMISAWA, K. 2006. Symbiotic Bradyrhizobium japonicum reduces N2O surrounding the soybean root system via nitrous oxide reductase. Appl Environ Microbiol, 72, 2526-2532. SATHYAPALAN, T.; MANUCHEHRI, A. M.; THATCHER, N. J.; RIGBY, A. S.; CHAPMAN, T.; KILPATRICK, E. S.; ATKIN, S. L. 2011. The effect of soy phytoestrogen supplementation on thyroid status and cardiovascular risk markers in patients with subclinical hypothyroidism: a randomized, double-blind, crossover study. J Clin Endocrinol Metab, 96, 1442-1449. SATTIN, M.; MERLO, D.; MOSCA, G. 1987. Effect of applied nitrogen on soybean growth and yield. Eurosoya, 6, 15-21. SAWADA, Y.; KINOSHITA, K.; AKASHI, T.; AOKI, T.; AYABE, S. 2002. Key amino acid residues required for aryl migration catalysed by the cytochrome P450 2-hydroxyisoflavanone synthase. Plant J, 31, 555-564. SCHÄFER, E.; KUNKEL, T.; FROHNMEYER, H. 1997. Signal transduction in the phytocontrol of chalcone synthase gene expression. Plant Cell Environ, 20, 722-727. SCHMUTZ, J.; CANNON, S. B.; SCHLUETER, J.; MA, J.; MITROS, T.; NELSON, W.; HYTEN, D. L.; SONG, Q.; THELEN, J. J.; CHENG, J.; XU, D.; HELLSTEN, U.; MAY, G. D.; YU, Y.; SAKURAI, T.; UMEZAWA, T.; BHATTACHARYYA, M. K.; SANDHU, D.; VALLIYODAN, B.; LINDQUIST, E.; PETO, M.; GRANT, D.; SHU, S.; GOODSTEIN, D.; BARRY, K.; FUTRELLGRIGGS, M.; ABERNATHY, B.; DU, J.; TIAN, Z.; ZHU, L.; GILL, N.; JOSHI, T.; LIBAULT, M.; SETHURAMAN, A.; ZHANG, X. C.; SHINOZAKI, K.; NGUYEN, H. T.; WING, R. A.; CREGAN, P.; SPECHT, J.; GRIMWOOD, J.; ROKHSAR, D.; STACEY, G.; SHOEMAKER, R. C.; JACKSON, S. A. 2010. Genome sequence of the palaeopolyploid soybean. Nature, 463, 178-183. SCHOPFER, C. R. et EBEL, J. 1998. Identification of elicitor-induced cytochrome P450s of soybean (Glycine max L.) using differential display of mRNA. Mol Gen Genet, 258, 315-322. SCHRYVER, T. 2002. Increasing health benefits using soy germ. Cereal Foods World, 47, 185-188. SEGUIN, P. ; TREMBLAY, G. ; PAGEAU, D. ; LIU, W. 2010. Soybean tocopherol concentrations are affected by crop management. J Agric Food Chem, 58, 5495-5501. 213 SEGUIN, P.; ZHENG, W. J.; SMITH, D. L.; DENG, W. H. 2004. Isoflavone content of soybean cultivars grown in eastern Canada. J Sci Food Agric, 84, 1327-1332. SETCHELL, K. D. et CASSIDY, A. 1999. Dietary isoflavones: biological effects and relevance to human health. J Nutr, 129, 758S-767S. SHIMADA, N.; AOKI, T.; SATO, S.; NAKAMURA, Y.; TABATA, S.; AYABE, S. 2003. A cluster of genes encodes the two types of chalcone isomerase involved in the biosynthesis of general flavonoids and legume-specific 5-deoxy(iso)flavonoids in Lotus japonicus. Plant Physiol, 131, 941-951. SHIMAMURA, M.; AKASHI, T.; SAKURAI, N.; SUZUKI, H.; SAITO, K.; SHIBATA, D.; AYABE, S.; AOKI, T. 2007. 2-hydroxyisoflavanone dehydratase is a critical determinant of isoflavone productivity in hairy root cultures of Lotus japonicus. Plant Cell Physiol, 48, 1652-1657. SHIMIZU, T.; AKADA, S.; SENDA, M.; ISHIKAWA, R.; HARADA, T.; NIIZEKI, M.; DUBE, S. K. 1999. Enhanced expression and differential inducibility of soybean chalcone synthase genes by supplemental UV-B in dark-grown seedlings. Plant Mol Biol, 39, 785-795. SHIMIZU, T; FUJIBE, R. ; SENDA M. 2000. Molecular cloning and characterization of a subfamily of UVB responsive MYB genes from soybean. Breeding Sci, 50, 81-90. SMIT, G.; PUVANESARAJAH, V.; CARLSON, R. W.; BARBOUR, W. M.; STACEY, G. 1992. Bradyrhizobium japonicum nodD1 can be specifically induced by soybean flavonoids that do not induce the nodYABCSUIJ operon. J Biol Chem, 267, 310-318. SNYDER, H. E. et KWON, T. W. 1987. Morphology and composition. In soybean utilization. Ed. van Nostrand Reinhold Company New York, 19-70. SONG, T.T; HENDRISH S.; MURPHY, P.A. 1999. Estrogenic activity of glycitein, a soy isoflavone. J Agric Food Chem., 47, 1607-1610. STACEY, G.; VODKIN, L.; PARROTT, W. A.; SHOEMAKER, R. C. 2004. National Science FoundationSponsored Workshop Report. Draft Plan for Soybean Genomics. Plant Physiol, 135, 59-70. STEELE, C. L.; GIJZEN, M.; QUTOB, D.; DIXON, R. A. 1999. Molecular characterization of the enzyme catalyzing the aryl migration reaction of isoflavonoid biosynthesis in soybean. Arch Biochem Biophys, 367, 146-150. SUAREZ, F. L.; SPRINGFIELD, J.; FURNE, J. K.; LOHRMANN, T. T.; KERR, P. S.; LEVITT, M. D. 1999. Gas production in human ingesting a soybean flour derived from beans naturally low in oligosaccharides. Am J Clin Nutr, 69, 135-139. SUBRAMANIAN, S.; GRAHAM, M.Y.; YU, O.; GRAHAM, T.L. 2005. RNA interference of soybean isoflavone synthase genes leads to silencing in tissues distal to the transformation site and to enhanced susceptibility to Phytophthora sojae. Plant Physiol. 137, 1345-1353. SUBRAMANIAN, S.; HU, X.; LU, G. H.; ODELL, J. T.; YU, O. 2004. The promoters of two isoflavone synthase genes respond differentially to nodulation and defense signals in transgenic soybean roots. Plant Mol Biol, 54, 623-639. SUBRAMANIAN, S.; STACEY, G.; YU, O. 2006. Endogenous isoflavones are essential for the establishment of symbiosis between soybean and Bradyrhizobium japonicum. Plant J, 48, 261-273. SUBRAMANIAN, S.; STACEY, G.; YU, O. 2007. Distinct, crucial roles of flavonoids during legume nodulation. Trends Plant Sci, 12, 282-285. SUGIYAMA, A.; SHITAN, N.; YAZAKI, K. 2007. Involvement of a soybean ATP-binding cassette-type transporter in the secretion of genistein, a signal flavonoid in legume-Rhizobium symbiosis. Plant Physiol, 144, 2000-2008. SUITA, K.; KIRYU, T.; SAWADA, M.; MITSUI, M.; NAKAGAWA, M.; KANAMARU, K.; YAMAGATA, H. 2009. Cyclic GMP acts as a common regulator for the transcriptional activation of the flavonoid biosynthetic pathway in soybean. Planta, 229, 403-413. SUN, J. M. et DING, A. L. 1998. Light effect on the tissue contents and distribution of isoflavones in the developing seedling of soybean. Acta Bot Sinica, 40, 1015-1021. 214 SUTHERLAND, T. D.; BASSAM, B. J.; SCHULLER, L. J.; GRESSHOFF , P. M. 1990. Early nodulation signals of the wild type and symbiotic mutants of soybean (Glycine max). Mol Plant-Microbe Interact, 3, 122-128. SUZUKI, H.; NISHINO, T.; NAKAYAMA, T. 2007. cDNA cloning of a BAHD acyltransferase from soybean (Glycine max): Isoflavone 7-O-glucoside-6"-O-malonyltransferase. Phytochemistry, 68, 2035-2042. SUZUKI, H.; TAKAHASHI, S.; WATANABE, R.; FUKUSHIMA, Y.; FUJITA, N.; NOGUCHI, A.; YOKOYAMA, R.; NISHITANI, K.; NISHINO, T.; NAKAYAMA, T. 2006. An isoflavone conjugatehydrolyzing beta-glucosidase from the roots of soybean (Glycine max) seedlings: purification, gene cloning, phylogenetics, and cellular localization. J Biol Chem, 281, 30251-30259. T TAKAHASHI, R.; OHMORI, R.; KIYOSE, C.; MOMIYAMA, Y.; OHSUZU, F.; KONDO, K. 2005. Antioxidant activities of black and yellow soybeans against low density lipoprotein oxidation. J Agric Food Chem, 53, 4578-4582. TAYLOR, C.; LEVY, R.; ELLIOTT, J.; BURNETT, B. 2009. The effect of genistein aglycone on cancer and cancer risk: a review of in vitro, preclinical, and clinical studies. Nutr Rev, 67, 398-415. TEPAVCEVIĆ, V.; ATANACKOVIĆ, M.; MILADINOVIĆ, J.; MALENCIĆ, D.; POPOVIĆ, J.; CVEJIĆ, J. 2010. Isoflavone composition, total polyphenolic content, and antioxidant activity in soybeans of different origin. J Med Food, 13, 657-664. TIKKANEN, M. J.; WÄHÄLÄ, K.; OJALA, S.; VIHMA, V.; ADLERCREUTZ, H. 1998. Effect of soybean phytoestrogen intake on low density lipoprotein oxidation resistance. Proc Natl Acad Sci, 95, 31063110. TSAO, R.; PAPADOPOULOS, Y.; YANG, R.; YOUNG, J.; MCRAE, K. 2006. Isoflavone profiles of red clovers and their distribution in different parts harvested at different growing stages. J Agric and Food Chem, 54, 5797-5805. TSUKAMOTO, C.; SHIMADA, S.; IGITA, K.; KUDOU, S.; KOKUBUN, M.; OKUBO, K.; KITAMURA, K. 1995. Factors affecting isoflavone content in soybean seeds - Changes in isoflavones, saponins, and composition of fatty-acids at different temperatures during seed development. J Agric Food Chem, 43, 1184-1192. TURCK, D. 2007. Soy protein for infant feeding: what do we know? Curr Opin Clin Nutr Metab Care, 10, 360-365. TUTEJA, J. H.; CLOUGH, S. J.; CHAN, W. C.; VODKIN, L. O. 2004. Tissue-specific gene silencing mediated by a naturally occurring chalcone synthase gene cluster in Glycine max. Plant Cell, 16, 819835. TUTEJA, J. H. et VODKIN, L. O. 2008. Structural features of the endogenous CHS silencing and target loci in the soybean genome. Crop Sci, 48, S49-S68. TUTEJA, J. H. ; ZABALA, G. ; VARALA, K. ; HUDSON, M. ; VODKIN, L. O. 2009. Endogenous, TissueSpecific Short Interfering RNAs Silence the Chalcone Synthase Gene Family in Glycine max Seed Coats. Plant Cell, 21, 3063-3077. U ULLAH, M. F.; SHAMIM, U.; HANIF, S.; AZMI, A. S.; HADI, S. M. 2009. Cellular DNA breakage by soy isoflavone genistein and its methylated structural analogue biochanin A. Mol Nutr Food Res, 53, 1376-1385. 215 URLACHER, V. B. et EIBEN, S. 2006. Cytochrome P450 monooxygenases: perspectives for synthetic application. Trends Biotechnol, 24, 324-330. V VANHEES, K.; DE BOCK, L.; GODSCHALK, R. W.; VAN SCHOOTEN, F. J.; VAN WAALWIJK VAN DOORN-KHOSROVANI, S. B. 2011. Prenatal exposure to flavonoids: implication for cancer risk. Toxicol Sci, 120, 59-67. VEECH, J. A. 1982. Phytoalexins and their Role in the Resistance of Plants to Nematodes. J Nematol, 14, 29. VEITCH, N. 2009. Isoflavonoids of the leguminosae. Nat Prod Rep, 26, 776-802. VICAS, S. et SOCACIU, C. 2003. Soy phytochemicals: Chemical structures and their health benefits. Bul Univ Agric Sci Vet Med, 59, 223-229. W WANG, H. et MURPHY, P. 1994a. Isoflavone content in commercial soybean foods. J Agric Food Chem, 42, 1666-1673. WANG, H. J. et MURPHY, P. A. 1994b. Isoflavone composition of American and Japanese soybean in Iowa : effects of variety, crop year, and location. J Agric Food Chem, 42, 1674-1677. WANG, X. 2011. Structure, function, and engineering of enzymes in isoflavonoid biosynthesis. Funct Integr Genomics, 11, 13-22. WANG, Z. et CHEN, H. 2010. Genistein increases gene expression by demethylation of WNT5a promoter in colon cancer cell line SW1116. Anticancer Res, 30, 4537-4545. WEI, H. ; CAI, Q. ; RAHN, R. O. 1996. Inhibition of UV light- and Fenton reaction-induced oxidative DNA damage by the soybean isoflavone genistein. Carcinogenesis, 17, 73-77. WEISSHAAR, B. et JENKINS, G. I. 1998. Phenylpropanoid biosynthesis and its regulation. Curr Opin Plant Biol, 1, 251-257. WELLE, R. et GRISEBACH, H. 1988. Isolation of a novel NADPH-dependent reductase which coacts with chalcone synthase in the biosynthesis of 6'-deoxychalcone. FEBS Letters, 236. WELLE, R. et GRISEBACH, H. 1989. Phytoalexin synthesis in soybean cells: elicitor induction of reductase involved in biosynthesis of 6'-deoxychalcone. Arch Biochem Biophys, 272, 97-102. WERCK-REICHHART, D. et FEYEREISEN, R. 2000. Cytochromes P450: a success story. Genome Biol, 1, Reviews 3003. WHENT, M.; HAO, J.; SLAVIN, M.; ZHOU, M.; SONG, J.; KENWORTHY, W.; YU, L. L. 2009. Effect of genotype, environment, and their interaction on chemical composition and antioxidant properties of low-linolenic soybeans grown in Maryland. J Agric Food Chem, 57, 10163-10174. WINKEL-SHIRLEY, B. 1999. Evidence for enzymes complexes in the phenylpropanoid and flavonoid pathways. Physiol. Plant., 107, 142-149. WINKEL-SHIRLEY, B. 2001. Flavonoid biosynthesis. A colorful model for genetics, biochemistry, cell biology, and biotechnology. Plant Physiol, 126, 485-493. WINKEL, B. S. J. 2004. Metabolic channeling in plants. Ann Rev Plant Biol, 55, 85-107. WINZER, M.; RAUNER, M.; PIETSCHMANN, P. 2010. Glycitein decreases the generation of murine osteoclasts and increases apoptosis. Wien Med Wochenschr, 160, 446-451. WONG, W. W.; LEWIS, R. D.; STEINBERG, F. M.; MURRAY, M. J.; CRAMER, M. A.; AMATO, P.; YOUNG, R. L.; BARNES, S.; ELLIS, K. J.; SHYPAILO, R. J.; FRALEY, J. K.; KONZELMANN, K. 216 L.; FISCHER, J. G.; SMITH, E. O. 2009. Soy isoflavone supplementation and bone mineral density in menopausal women: a 2-y multicenter clinical trial. Am J Clin Nutr, 90, 1433-1439. WUTTKE, W.; RIMOLDI, G.; CHRISTOFFEL, J.; SEIDLOVA-WUTTKE D. 2006. Plant extracts for the treatment of menopausal women: Safe? Maturitas 55, S92-S100. X XU, Z.; WU, Q.; GODBER, J. 2002. Stabilities of daidzin, glycitin, genistin, and generation of derivatives during heating. J Agric Food Chem, 50, 7402-7406. Y YAN, G. R.; XIAO, C. L.; HE, G. W.; YIN, X. F.; CHEN, N. P.; CAO, Y.; HE, Q. Y. 2010. Global phosphoproteomic effects of natural tyrosine kinase inhibitor, genistein, on signaling pathways. Proteomics, 10, 976-986. YANG, W. J. ; WU, Y. M. ; TANG, Y. X. 2009. Expressing and functional analysis of GmMYBJ6 from soybean. Yi Chuan, 31, 645-653. YERRAMSETTY, V.; MATHIAS, K.; BUNZEL, M.; ISMAIL, B. 2011. Detection and structural characterization of thermally generated isoflavone malonylglucoside derivatives. J Agric Food Chem, 59, 174-183. YI, J., DERYNCK; M. R., CHEN, L.; DHAUBHADEL, S. 2010a. Differential expression of CHS7 and CHS8 genes in soybean. Planta, 231, 741-753. YI, J. X. ; DERYNCK , M. R. ; LI ; X. Y. ; TELMER, P. ; MARSOLAIS, F. ; DHAUBHADEL, S. 2010b. A single-repeat MYB transcription factor, GmMYB176, regulates CHS8 gene expression and affects isoflavonoid biosynthesis in soybean. Plant J, 62, 1019-1034. YIN, L. J. ; LI, L. T. ; LIU, H. ; SAITO, M. ; TATSUMI, E. 2005. Effects of fermentation temperature on the content and composition of isoflavones and beta-glucosidase activity in sufu. Biosci Biotechnol Biochem, 69, 267-272. YOSHIDA, H.; HIRAKAWA, Y.; MURAKAMI, C.; MIZUSHINA, Y.; YAMADE, T. 2003. Variation in the content of tocopherols and distribution of fatty acids within soya bean seeds (Glycine max L.). J Food Comp Anal, 16, 429-440. YU, O. et JEZ, J. M. 2008. Nature's assembly line: biosynthesis of simple phenylpropanoids and polyketides. Plant J, 54, 750-762. YU, O.; JUNG, W.; SHI, J.; CROES, R. A.; FADER, G. M.; MCGONIGLE, B.; ODELL, J. T. 2000. Production of the isoflavones genistein and daidzein in non-legume dicot and monocot tissues. Plant Physiol, 124, 781-794. YU, O. et McGONIGLE, B. 2005. Metabolic engineering of isoflavone biosynthesis. Adv Agron, 86, 147190. YU, O.; SHI, J.; HESSION, A. O.; MAXWELL, C. A.; MCGONIGLE, B.; ODELL, J. T. 2003. Metabolic engineering to increase isoflavone biosynthesis in soybean seed. Phytochemistry, 63, 753-763. YU, X.; ZHU, J.; MI, M.; CHEN, W.; PAN, Q.; WEI, M. 2012. Anti-angiogenic genistein inhibits VEGFinduced endothelial cell activation by decreasing PTK activity and MAPK activation. Med Oncol, 29, 349-357 YUE, X. H.; ABDALLAH, A. M.; XU, Z. M. 2010. Distribution of isoflavones and antioxydant activities of soybean cotyledon, coat and germ. J Food Process Preserv, 34, 795-806. 217 Z ZABALA, G.; ZOU, J. J.; TUTEJA, J.; GONZALEZ, D. O.; CLOUGH, S. J.; VODKIN, L. O. 2006. Transcriptome changes in the phenylpropanoid pathway of Glycine max in response to Pseudomonas syringae infection. BMC Plant Biology, 6. ZEEMAN, S. C.; KOSSMANN, J.; SMITH, A. M. 2010. Starch: its metabolism, evolution, and biotechnological modification in plants. Annu Rev Plant Biol, 61, 209-234. ZENG, G. L.; LI, D. M.; HAN, Y. P.; TENG, W. L.; WANG, J.; QIU, L. Q.; LI, W. B. 2009. Identification of QTL underlying isoflavone contents in soybean seeds among multiple environments. Theor Appl Genet, 118, 1455-1463. ZHANG, F. et SMITH, D. L. 1995. Preincubation of Bradyrhizobium japonicum with Genistein Accelerates Nodule Development of Soybean at Suboptimal Root Zone Temperatures. Plant Physiol, 108, 961968. ZHANG, J.; SUBRAMANIAN, S.; STACEY, G.; YU, O. 2009. Flavones and flavonols play distinct critical roles during nodulation of Medicago truncatula by Sinorhizobium meliloti. Plant J, 57, 171-183. ZHANG, Y.; WANG, G.; SONG, T.; MURPHY, P.; HENDRICH, S. 2001. Differences in disposition of the soybean isoflavones, glycitein, daidzein and genistein in humans with moderate fecal isoflavone degradation activity. J Nutr, 131, 147-148. ZHAO, J. et DIXON, R. A. 2009. MATE transporters facilitate vacuolar uptake of epicatechin 3'-Oglucoside for proanthocyanidin biosynthesis in Medicago truncatula and Arabidopsis. Plant Cell, 21, 2323-2340. ZHAO, J.; HUHMAN, D.; SHADLE, G.; HE, X. Z.; SUMNER, L. W.; TANG, Y.; DIXON, R. A. 2011. MATE2 mediates vacuolar sequestration of flavonoid glycosides and glycoside malonates in Medicago truncatula. Plant Cell, 23, 1536-1555. ZHOU, J. M.; SEO, Y. W. ; IBRAHIM, R. K. 2009. Biochemical characterization of a putative wheat caffeic acid O-methyltransferase. Plant Physiol Biochem, 47, 322-326. ZUBIETA, C.; HE, X. Z.; DIXON, R. A.; NOEL, J. P. 2001. Structures of two natural product methyltransferases reveal the basis for substrate specificity in plant O-methyltransferases. Nat Struct Biol, 8, 271-279. 218