système d'information et méta analyses pour …...Leaf T C 10 20 30 VPD KPa 0 2 4 -1,5 -0,5 -1 0 6...
Transcript of système d'information et méta analyses pour …...Leaf T C 10 20 30 VPD KPa 0 2 4 -1,5 -0,5 -1 0 6...
Des plateformes de phénotypage au champ : système d'information et méta analyses pour
l'analyse des réponses aux conditions environnementales François Tardieu, E Millet, S Alvarez Prado, Ll Cabrera-Bosquet, S Lacube, B Parent, C Welcker
Les plantes sont toujours en acclimatation, secondes-semaines
Light
VPD
Temperature
ET0
Days
Pourquoi de grands jeux de données hétérogènes ?
Light
VPD
Temperature
ET0
Days
Leaf T
°C
10
20
30
VP
D K
Pa
0
2
4
-1,5
-0,5
-1
0 6 12 0 18 Y
MP
a
Time of day
Pourquoi de grands jeux de données hétérogènes ?
Les plantes sont toujours en acclimatation, secondes-semaines
Leaf T
°C
10
20
30
VP
D K
Pa
0
2
4
-1,5
-0,5
-1
0 6 12 0 18 Y
MP
a
Time of day
Les plantes sont toujours en acclimatation, secondes-semaines
- les gènes ‘inductibles par la sécheresse’
s’allument et s’éteignent comme à la foire
- Les caractères physiologiques aussi
- Il faut caractériser à court pas de temps
… sans oublier le rendement
Pourquoi de grands jeux de données hétérogènes ?
Scenarios climatiques Semaine-mois
Cell. - organe Minute/jour
Plante - peuplement Minute-semaine
Niveau d’ organisation
Haut débit haute précision
Réseaux de champs
Haut débit, intégratif, (controlé ou champ)
Tardieu, Cabrera, Pridmore and Bennett 2017 Current Biol.
Une tension entre l’analyse de la variabilité génétique de
- “mécanismes” (organes, minutes)
- rendement (couvert, mois)
‘Comprendre’ ‘Disséquer’ ‘Prédire’
Pourquoi de grands jeux de données hétérogènes ?
Phénotypage multi échelle, mais connecté
Du “big data” en génétique ?
Réseaux de capteurs, grilles européennes d’environnement: On peut mesurer ou estimer les conditions environmentales dans
tous les champs d’agriculteurs
+ combiner des essais + bases de données + modélisation
Exemple:
GWAS dans 40 champs. Environnement + rendement
252 genotypes 750k marqueurs polymorphes Rendements de 5 à 12 T ha-1
16 champs X
2 années X
2 traitements
490 régions génomiques
associées au rendement,
peu en commun
Grain Yield (t ha-1)
Fre
quency
0
25
50
75
100
0
25
50
75
100
0 5 10 15
0
20
40
60
80 6
4
2
0
6
4
2
0
6
4
2
0 7 6 5 4 3 2 1 8 9 10
Humide, frais
Humide, chaud
Sec, chaud
Millet et al.2016 Plant Phys
Du “big data” en génétique ?
Allelic effect
on grain yield
(t ha-1)
WD
Hot day night
Hot day
Cool
Mild Severe deficit
Coll van Eeuwijk
Charcosset
Millet et al. 2016 Plant Phys
Du “big data” en génétique ?
Effets alleliques 1 QTL. chaque case, un scenario
16 champs X
2 années X
2 traitements
mild WD
Hot day Cool
Hot day night
Hot day
Cool
Hot day
Cool
mild Water deficit
Allelic effect
on grain yield
(t ha-1)
Coll van Eeuwijk
Charcosset QTL1 QTL2
QTL3 QTL4
QTL5 QTL6
Effets alleliques 6 QTL. chaque case, un scenario
WD
Du “big data” en génétique ?
Hot day night
Hot day night
Millet et al. 2016 Plant Phys
16 champs X
2 années X
2 traitements
Caractériser l’environnement de 10s champs : peu cher et indispensable
Des caractères de tolérance, mais différents en chaque champ (scenarios)
Ce n’est que le début (génotypage + environnementr + phénotypage
de milliers de champs?)
Du “big data” en génétique ?
16 champs X
2 années X
2 traitements
Parent et al 2018 PNAS
Est-ce que les rendements diminueront avec le changement climatique
si les agriculteurs adaptent la durée de cycle ?
Combiner quelques essais, des grilles environnementales
et la modélisation
Du “big data” en génétique ?
Une durée de cycle optimum est observée expérimentalement
Cycle duration
(max leaf number)
10 15 20 25
Yie
ld/y
ield
max
Parent et al 2018 PNAS
Ces essais ont dormi 10 ans dans notre base de donnée… (un mauvais panel pour la sécheresse, bon pour tester l’effet de la floraison
Expérimentation:
6 champs,
150 genotypes
Combiner quelques essais, des grilles environnementales
et la modélisation
Du “big data” en génétique ?
Modèle:
60 champs
30 ans
600 génotypes
Y
ield
/yie
ld m
ax
Cycle duration (max leaf number) Parent et al 2018 PNAS
Expérimentation:
6 champs,
150 genotypes
Une durée de cycle optimum est observée expérimentalement
Combiner quelques essais, des grilles environnementales
et la modélisation
Du “big data” en génétique ?
Bases de données
40 45 50 55
10
01
50
20
0
0
0
100
150
200
So
win
g o
r flo
we
rin
g d
ate
Latitude (°) 40 45 50 55
Simulations
sowing
Flowering
‘L’agriculteur est à l’optimum’
Rainfed
Actuel 1980-2010
2050 30 ans
RCP4.5
0 4 8 12 16
Yield (t ha-1)
yield climA W
Yield (t ha-1)
Climat 2050 avec les règles actuelles de choix de génotypes
Parent et al 2018 PNAS
Combiner quelques essais, des grilles environnementales
et la modélisation
Du “big data” en génétique ?
Rainfed
Whole Europe
No adapt. Cycle
adapted.
% c
ha
ng
e p
rod
uctio
n
Les rendements baissent à génotype constant
maintenus/ augmentent si les agriculteurs adaptent la floraison
Phénomique et modélisation, 100s genotypes
Il faut simuler le rendement de 100s génotypes
dans 100s scenarios
Prendre en compte l’environnement :
combiner avec la modélisation ?
Prédiction génomique: simulation du rendement,
Cabrera et al. 2016 New Phytologist
PhenoArch 1680 2300 plants
Phénomique et modélisation, 100s genotypes
Images Reconstruction 3D
Interception par des couverts virtuels
Paramètres: interception lumineuse et photosynthèse
Dissection génétique
Chen et al 2019 J Exp Bot
Phénomique et modélisation, 100s genotypes
0
5
10
15
0 20 40 60
Phenoarch Winter13 Phenoarch Spring13 Phenoarch Spring12
Reference
hybrid
Cabrera-Bosquet L. Alvarez Prado S.
Thermal time since emergence (d20°C)
Paramètres: progression du cycle
Leaf
rank
Phénomique et modélisation, 100s genotypes
0
5
10
15
0 20 40 60
Ner12 Ner13 Phenoarch Winter13 Phenoarch Spring13 Phenoarch Spring12
Reference
hybrid
Thermal time since emergence (d20°C)
Leaf
rank
Nérac
Gaillac
Karlsruhe
Cadriano
Campagnola
Martonvasar Debrecen
Murony
Craiova
Graneros
19
Paramètres: progression du cycle
Phénomique et modélisation, 100s genotypes
R²= 0.85***
CV= 13%
Plant gs (mmol m-2 s-1)
30 40 50 60 70 80 90
100
200
300
400
Well-watered
Water deficit
R²= 0.54**
Le
af
gs (
mm
ol m
-2 s
-1)
20 Alvarez Prado et al., 2018 Plant Cell Environment
Paramètres: contrôle stomatique
Phénomique et modélisation, 100s genotypes
[G, E]
[nG, E]
Training set (200 hyb)
Testing set (46 hyb)
0 50 100 1500
50
10
01
50
Observed gs
Pre
dic
ted
gs
Training set; R² = 0.86
New Genotypes; R² = 0.87
0
50
100
150
Spr16.WW Spr16.WD Spr13.WW Spr13.WD Spr12.WW Spr12.WD Win13.WW Win13.WD
Observed gs
Pre
dic
ted
gs
0 50 100 150
0
50
100
150
[nG, E]
[G, E]
r-coeff
0.57-0.92
0.19-0.75
Prédiction génomique
S. Alvarez Prado
Alvarez Prado et al., 2018 Plant Cell Environment
Paramètres: contrôle stomatique
Phénomique et modélisation, 100s genotypes
APSIM
Model parameters/Traits
Climatic and soil data from 15
field experiments
Nérac
Gaillac
Karlsruhe
Cadriano
Campagnola
Martonvasar
Debrecen
Murony
Craiova
Genomic prediction
Biomass
TE T RUE
Rint
LAI
Grain Number
Yield prediction
S. Alvarez
Prado Tardieu et al 2018, annual Rev Plant Biol
Phénomique et modélisation, 100s genotypes
Phenomic information system (PHIS)
Un système d’information pour organiser
les données multi échelle
Phenomic information system (PHIS)
Tracer tous les objets, tous les événements dans les essais ontologies
P. Neveu
Prefix m3p: <http://phenome-fppn.fr/m3p>
URI of plant<m3p:arch/2017/c17000118>
URI of pot:<m3p:arch/2013/pc13001542>
URI of cabin:<m3p:arch/2018/ac180015>
URI of camera:<m3p:arch/2018/ac180019>
URI of image:<m3p:arch/2017/ic17002295855>
URI of cart:<m3p:arch/2013/ct1300123>
Prefix diaphen: <http://phenome-fppn.fr/diaphen>
URI of plot<diaphen:2017/o1700029>
URI of plant:<diaphen:2017/17000147>
URI of camera:<diaphen:2018/ac180002>
URI of image:<diaphen:2017/ic14001480237>
(a) (b)
URI of leaf:<diaphen:2017/l17000590>
Champ et conditions controlées
Neveu et al 2018 New Phyt Ll Cabrera
Relier les objets, web sémantique
‘samples, belong to plants, leaves, genotypes, experiments...’
leaf885
Installation_1
hasEvent
variety_Aleaf884
plant736 moveTo328
leaf883
Exp2016-A
uses
sample333
sample332
sample331
#URIs of the different objects
‘Installation_1’= <http://www.nationalinfrastructure/Installation_1/>
‘Exp2016-A’=<http://www.nationalinfrastructure/Installation_1/Exp2016-A>
‘variety_A’= <http://www.nationalinfrastructure/g/A>
‘plant736’= <http://www.nationalinfrastructure/Installation_1/Exp2016-A/p0736>
‘leaf883’= <http://www.nationalinfrastructure/Installation_1/Exp2016-A/10883>
#RDF examples
#plant736 is of variety A is expressed in RDF as:
<http://www.nationalinfrastructure/Installation_1/Exp2016-A/p0736>
<http://www.nationalinfrastructure/vocabulary/2015#hasVariety>
<http://www.nationalinfrastructure/g/A>
#Informally this relationship can be expressed as:
<plant736> <hasVariety> <variety_A>
isPartOf hasVarietyisPartOf
participates_in
(a)
(b)Crée les métadonnées de facon parcimonieuses
Neveu et al 2018 New Phyt
Phenomic information system (PHIS)
(a)
(b)
(c)
(d)
(f)
(e)
Permet analyse conjointe de données champ et parcelles - Métadonnées (moyennes génotypiques)
- Moyennes génotypiques
- Modèles et scripts utilisés pour l’analyse
Neveu et al 2018 New Phyt
Phenomic information system (PHIS)
ELIXIR /EMPHASIS: Three needs “in series”
Following
experiments
Phenotypic
analysis
Data sharing
and Reuse
- Tracking - objects, events, images
- Following - plants, sensors, cameras
- Environmental conditions Mapping/time course
- Sensor calibration
- Data cleaning
- Calculated traits- Time courses- Spatial analysis- Ratios (growth per ...)
- Tools for data quality- Reproducible?- Cross scale ?- Modelling?
EMPHASIS Elixir
- Enable reproducible analyses (GxE, GWAS, Genomic
Prediction, Evolution)- Data integration
and linking- Data Publication- Data discovery- Pipeline Hosting
- From measurements to traits
- Tools for trait quality- heritability - genetic correlations
TRAITS
Conclusion
Phenomique/genomique rentrent dans le big data
Combinaisons d’essais, de bases de données et de modèles
(méta analyse, modèles sur grille)
Combinaisons de prédiction génomique et modélisation
prediction rendement 100s genotypes 100s sites
Génotypage moins cher + télédetection + réseaux capteurs
+ moyens de phenotypage
Probablement la voie de l’avenir
C Welcker Ll Cabrera
S. Alvarez Prado
Field experiments Genetic analyses
Moulon, A Charcosset S Nicolas
Acknowledgements
RAGT, Euralis MaisAdour
B. Parent E. Millet O. Turc
Platform experiments, modelling, GWAS
N. Ranc T. Presterl S Praud
Wageningen F van Eeuwijk Willem Kruijer
Information
system
P. Neveu Ll Cabrera