Analyse de données de séquençage deuxième...

41
Analyse de données de séquençage deuxième génération Par Alpha Boubacar Diallo, Ph.D. Chercheur Associé Institut Universitaire en Santé Mentale Douglas 1

Transcript of Analyse de données de séquençage deuxième...

Page 1: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Analyse de donnéesde séquençage deuxième génération

Par

Alpha Boubacar Diallo, Ph.D.Chercheur Associé

Institut Universitaire en SantéMentale Douglas

1

Page 2: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Institut de santé mentale Douglas

Faire avancer et partager les connaissances en santé mentaleOffrir des soins et des services de pointe

•266 lits

•100 000 visites en services externes

•1 de 2 centres de recherche en santé mentale les plus importants au Canada

•Plus de 60 chercheurs principaux de calibre international; 3 sont parmi les plus cités dans le monde

•300 étudiants

•1 banque de cerveaux unique au Canada avec 3 000 cerveaux

•le seul centre d’imagerie cérébrale (CIC) consacré à la recherche en santé mentale au Québec

•1 centre de neurophénotypage

•8 programmes cliniques, de la pédopsychiatrie à la gérontopsychiatrie

•environ 1 600 employés

http://www.douglas.qc.ca/section/qui-sommes-nous-345

2

Page 3: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Introduction

“Next Generation Sequencing technology have seen a major transformation in the way scientists extract genetic information from biological systems, revealing limitless insight about the genome, transcriptome, and epigenome of any species. This ability has catalyzed a number of important breakthroughs, advancing scientific fields from human disease research to agriculture and evolutionary science.

NGS data output has increased at a rate that outpaces Moore’s law, more than doubling each year since it was invented. In 2007, a single sequencing run could produce a maximum of around one gigabase (Gb) of data. By 2011, that rate has nearly reached a terabase (Tb) of data in a single sequencing run—nearly a 1000××××increase in four years.

With the ability to rapidly generate large volumes of sequencing data, NGS enables researchers to move quickly from an idea to full data sets in a matter of hours or days. Researchers can now sequence more than five human genomes in a single run, producing data in roughly one week, for a reagent cost of less than $5,000 per genome. By comparison, the first human genome required roughly 10 years to sequence using CE technology and an additional three years to finish the analysis. The completed project was published in 2003, just a few years before NGS was invented, and came with a price tag nearing 3 billion USD. ”

http://www.illumina.com/documents/products/Illumina_Sequencing_Introduction.pdf3

Page 4: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

4

• Bio-informatique réunit plusieurs domaines scientifiques: l’informatique, les mathématiques (statistiques) et l'ingénierie pour étudier et traiter des données ou informations biologiques.

• Les algorithmes et des techniques informatiques sont utilisés pour résoudre les problèmes rencontrés par les biologistes moléculaires (en utilisant de puissants ordinateurs ou des clusters).

http://www.discoverymedicine.com/Richard-Chahwan/2011/03/17/the-multidimensional-nature-of-

epigenetic-information-and-its-role-in-disease/

Définition

Page 5: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

5

Doug Broutlag, 2014

De l’ADN au génome humain

Page 6: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

6

La première technologie génomique à haut débit de séquençage d'ADN a étéautomatisée au début des années 1990.

En 1995, Venter et Hamilton ont utilisés «whole-genome shotgun sequencing » pour séquencer les génomes de deux bactéries (Mycoplasma et Haemophilus).

En Septembre 1999, Celera Genomics achevéle séquençage du génome de la drosophile .

La séquence des 3 milliards de paires de bases du génome humain a été réalisé àtravers une compétition entre le projet du génome humain et Celera Genomics.

http://ietltd.com/BIOTECHNOLOGY/ABI-Prism-3700/

With a gene map for a flu-causing bacterium.

Photograph: Ruth Frenson/AP

Séquençage de données à haut débit

Page 7: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

7

http://en.wikipedia.org/wiki/Three-domain_system

http://sulab.org/2013/06/sequenced-genomes-per-year/

Sources: National Human Genome Research Institute

Page 8: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

MethodSingle-molecule real-

time sequencing

(Pacific Bio)

Ion semiconductor

(Ion Torrent

sequencing)

Pyro-

sequencing

(454)

Sequencing by

synthesis (Illumina)

Sequencing by

ligation (SOLiD

sequencing)

Chain termination

(Sanger sequencing)

Read length 2900 bp average 200 bp 700 bp 50 to 250 bp 50+35 or 50+50 bp 400 to 900 bp

Accuracy

87% (read length

mode), 99%

(accuracy mode)

98% 99.9% 98% 99.9% 99.9%

Reads per run 35–75 thousand up to 5 million 1 million up to 3 billion 1.2 to 1.4 billion N/A

Time per run30 minutes to 2

hours 2 hours 24 hours

1 to 10 days,

depending upon

sequencer and

specified read length

1 to 2 weeks 20 minutes to 3 hours

Cost per 1 million

bases (in US $ )$2 $1 $10 $0.05 - $0.15 $0.13 $2400

Advantages

Longest read length.

Fast. Detects 4mC,

5mC, 6mA.

Less expensive

equipment. Fast.

Long read size.

Fast.

Potential for high

sequence yield,

depending upon

sequencer model

and desired

application.

Low cost per base.

Long individual reads.

Useful for many

applications.

Disadvantages

Low yield at high

accuracy. Equipment

can be very

expensive.

Homopolymer

errors.

Runs are

expensive.

Homopolymer

errors.

Equipment can be

very expensive.

Slower than other

methods.

More expensive and

impractical for larger

sequencing projects.

Comparaison des séquenceurs nouvelle génération

Page 9: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

• SUPERORDINATEUR LOCAL (THOR)

– server 20Tb, 32 cœurs, 64gigabytes de RAM

• CLUMEQ (Consortium Laval UQAM McGill and Eastern Quebec) superordinateur:

– Consortium de 11 Universités dans la province du

– Québec, Fait partie de la plateforme de COMPUTE CANADA

COLOSSE (CLUSTER PARALLEL)– 960 noeuds avec 8 coeurs chacun.– Total of 7680 coeurs.– 24/48 gigabytes of RAM (total 23 Tb).– Réseau: Infiniband QDR in blocks

GUILLIMIN (CLUSTER PARALLEL)– 1200 noeuds de calcul– Total of 14400 cœurs, @ 2.66 GHz.– 24/48 gigabytes of RAM (total 46 Tb).– Réseau: Infiniband QDR in blocks

9

Ressources informatiques

http://www.cfdlab.mcgill.ca/wordpress/supercomputing/

Page 10: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Projet addiction à la cocaïne

En collaboration avec Dr. D. Mash (Université de Miami)

– 58 donneurs

• 29 contrôles

• 29 patients accro à la cocaine

– Deux régions du cerveau

• Caudate Nucleus

• Nucleus Accumbens

– 116 échantillons de séquençage

Page 11: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Développée par Meissner et ses collègues (2011)

Méthode puissante qui permet le séquençage bisulfite des régions riches en CpG, où méthylation de l'ADN est le plus souvent variable et affecte la fonction des gènes.

Cette approche utilise une enzyme de restriction (MspI, qui reconnaît C / CGG) qui digère les motifs CpG.

•Le génome humain haploïde contient 3 milliards de bases (3x109).

•Il y’a 28 millions (2.8x107) CpGs dans le génome humain haploïde.

•Une bibliothèque de RRBS peut couvrir 1.260.000 fragments commençant par CGG ou TGG.

•Chaque fragment (40-220bp) contient 2.5X CpG en moyenne et l’ensemble fragments couvrent jusqu'à 12% ou 3,36 millions de CpG sur le génome humain. La plupart de ces CpG sont couverts dans les régions de CGIs et de promoteur.

Reduce Representation Bisulfite Sequencing (RRBS)

RRBS: A brief Guide to RRBS,

2012

Page 12: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Échelle: Études de méthylation de l'ADN sur le génome entier.

Coût: Il réduit les coûts de séquençage sensiblement par rapport WGBS tout en augmentant la profondeur de lecture dans des régions riches en CpG.

Reproductibilité: Comparaison des analyses d'échantillons montre les résultats hautement reproductibles; 85-95% de chevauchement entre plusieurs échantillons, ce qui permet des études comparatives.

Résolution d’un nucléotide: RRBS localise statut de méthylation des sites CpG individuels au sein de chaque fragment d'ADN, fournissant des données supérieures aux méthodes de profilage alternatives telles que MeDIP-Seq.

Couverture: RRBS a une très bonne couverture de plus de 3 millions de sites CpG àl'échelle du génome entier, 50-75% sont couverts par ≥5x de la couverture.

Taille de l'échantillon et la qualité: Analyses peuvent être accomplies avec l'ADN génomique limitée, même si elle est dégradée, ce qui permet à nos collaborateurs de se concentrer sur leurs échantillons de tissus humains précieux. Idéale pour la détection clinique.

Avantages du RRBS

Page 13: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

13

Protocole simplifié de séquençage bisulfite

http://en.wikipedia.org/wiki/Reduced_representation_bisulfite_sequencing

Page 14: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

14

MspI digestion

Phenol/chloroform extraction

End repair (Filling in)

A-tailing reaction

Phenol/chloroform extraction

Phenol/chloroform extraction

Adaptor ligation

QiaQuick PCR purification

PCR amplification and size selection

Indexing library

AmPure SPRI purification

Final indexed RRBS library

AmPure SPRI purification

Bisulfite Conversion

Genomic DNA isolation

Chen et al. 2014

Page 15: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

• Méthylation de l'ADN est l'une des plus importantes modifications épigénétiques impliqués dans le contrôle de l'expression génique.

• Séquençage bisulfite de l'ADN génomique est actuellement la seule méthode pour étudier des modèles de méthylation de l'ADN à la résolution d'un nucléotide simple.

• Séquençage de nouvelle génération (NGS) l'ADN bisulfité est la seule méthode pour étudier les profils de méthylation de l'ADN à l'échelle du génome entier.

• Méthodes de séquençage bisulfite:– Whole genome bisulfite sequencing (WGBS)– Reduced Representation Bisulfite Sequencing (RRBS)

• Applications:– WGBS pour l'analyse des methylomes humaines est coûteux et pas rentable lorsqu'il est utilisé

dans les études de plusieurs échantillons (inconvénients de WGBS: 40-50% de lectures faire contient même pas de C méthylé, le coût ..).

– RRBS est la méthode de résolution de nucléotide le plus efficace et la moins couteuse pour l'analyse de l'état de méthylation à l'échelle du génome entier à partir de plusieurs échantillons.

Important du séquençage bisulfite

Page 16: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Le pipeline d’analyse de données RRBS a 3 étapes principales:

• Contrôle de la qualité et filtre des données

• Alignement au génome de référence et extraction des niveaux de méthylation

• Analyse différentielle de la méthylation

Pipeline bisulfite

16

Page 17: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

ÉTAPE 1

Krueger et al. (2012)17

Page 18: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Nous avons utilisé le logiciel TrimGalore et la commande Linux « grep » pour cette étape:

TrimGalore est un script pour automatiser le filtre sur la qualité des données, la suppression des adapteurs liés aux séquences ainsi que le contrôle de qualité, avec quelques fonctionnalités supplémentaires pour éliminer les positions de méthylation biaisées.

TrimGalore effectue le contrôle de qualité et la suppression des adaptateurs en deux étapes. Une étape supplémentaire permet le retrait des deux bases supplémentaires qui contiennent une cytosine qui a été artificiellement introduite lors de l'étape « A-tailling » pendant la préparation des librairies.

La commande Linux « grep » recherche dans le fichier donné en entré toutes les lignes contenant un match au motif donné.

Contrôle de la qualité / Filtre des données (1)

18

Page 19: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

trim_galore --rrbs --stringency 1 --length 20 -q 30 --phred33 --suppress_warn -a AGATCGGAAGAGCACACGTCTGAACTCCAGTCA

This step removes the adapter sequence used to amplify the reads.

•--rrbs: Specifies that the input file was an MspI digested RRBS sample (recognition site: CCGG). Sequences which were adapter-trimmed will have a further 2 bp removed from their 3' end

•--stringency 1: Overlap with adapter sequence required to trim a sequence is 1

•--length 20: Discard reads that became shorter than 20 bases because of either quality or adapter trimming

•--q 30: Trim low-quality ends from reads in addition to adapter removal. For RRBS samples, quality trimming will be performed first

•--phred33: Instructs Cutadapt to use ASCII+33 quality scores as Phred scores (Sanger/Illumina 1.9+ encoding) for quality trimming

•-a: Adapter sequence to be trimmed is "AGATCGGAAGAGCACACGTCTGAACTCCAGTCA"

Contrôle de la qualité / Filtre des données (2)

19

Page 20: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

grep -B1 -A2 -E "^CGG|^TGG" input_file | grep -v "^--\$" > output_file

Avec cette ligne de commande, nous ne gardons que les lectures (ou séquences) qui commencent par les trois bases CGG ou TGG.

Les trois premières bases de (presque tous) les RRBS lit sont soit CGG ou TGG, en fonction de leur état de méthylation génomique.

Contrôle de la qualité / Filtre des données (3)

RRBS: A brief Guide to RRBS,

201220

Page 21: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

AVANT

APRÈS

21

Contrôle de la qualité / Filtre des données (4)

Page 22: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

ÉTAPE 2

Krueger et al. (2012)

Page 23: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Krueger et al. (2011)

Nous avons utilisé le programme Bismark(Krueger et al., 2011 et 2012) pour effectuer l’alignement des données de séquençage au génome humain.

Nous autorisons un maximum de deux erreurs (mismatches) lors de l’alignement,

Page 24: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Après l’alignement, nous utilisons Bis-SNP (Lui et al. 2012), un package basé sur GATK (Genome Analysis Toolkit) contrôler les SNP.

Extraction of the methylation levels :

Nous avons développé des scripts pour extraire les niveaux de méthylation en fonction de chaque cytosine en fonction des contextes à étudier.

Contexte CpG

Contexte CHH

Contexte CHG

Les fichiers de sorti de chaque contexte contient les informations suivantes:

• id

• chromosome

• start

• strand

• coverage

• frequency of C(s)

• frequency of T(s)

Alignement au génome humain

Page 25: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

25

• IGV: Integrative Genomics Viewer est un outil de visualisation haute performance créé par l'Institut Broad pour l'exploration interactive de grands ensembles de données intégrées (Helga et al.).

Visualisation avec IGV

http://www.broadinstitute.org/igv/

Page 26: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

26

Méthylation / Couverture

Page 27: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

We developed an R script for the methylation analysis:

•We include a single CpG analysis and a tiling, back-to-back windows analysis (eg. 50bp, 100bp, 500bp, …)

•We include a minimum coverage for the CpGs to be analyzed (eg. at least 5X coverage); (Boyle et al., 2012)

•We remove all CpGs with read counts above 99.9% of the coverage distribution (PCR amplification bias)

•We remove all the CpGs and tiling windows that are both fully (99-100%) methylated or fully non methylated (0-1%) in both case and control groups

•We analyze the positions (CpGs or tiling windows) covered in at least 25 subjects (out of 29) per group, (80% of the subjects); (Boyle et al., 2012)

•We use the Student's t-test method to assess statistical significance (assuming equal variances between distribution)

•We use the Benjamini-Hochberg method to control the false discovery rate, the expected proportion of false discoveries amongst the rejected hypotheses

Analyse différentielle de la méthylation

Page 28: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

28

• Validation en utilisant :• Imprinted regions (50% de méthylation): gene IGFR2.

• Régions faiblement méthylées: gènes ACTB, GAPDH.

• Analyse PCA

• Bisulfite conversion rate

RRBS: A brief Guide to RRBS, 2012

Validation des résultats

Page 29: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Résumé des résultats du séquençage (1)

Vaillancourt et al. 2014

Page 30: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Résumé des résultats du séquençage (2)

Vaillancourt et al. 2014

Page 31: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Résultats de l’analyse différentielle (1)

Vaillancourt et al. 2014

Page 32: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Résultats de l’analyse différentielle (2)

Vaillancourt et al. 2014

Page 33: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

RNA-Seq:Expression des gènes

Page 34: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

http://www.wafergen.com/illumina-reagent-kits/

Page 35: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le
Page 36: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Caudate

Page 37: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Nucleus Accubems

Page 38: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Doug Broutlag, 2014 : http://biochem218.stanford.edu/

Boyle, P., Clement, K., Gu, H., Smith, Z. D., Ziller, M., Fostel, J. L., Holmes, L., Meldrim, J., Kelley, F., Gnirke, A. & Meissner A. (2012), Gel-free multiplexed reduced representation bisulfite sequencing for large-scale DNA methylation profiling, Genome Biology 2012, 13:R92

Chen, Gary G.; Diallo, Alpha B.; Poujol, Raphaël; Nagy, Corina; Staffa, Alfredo; Vaillancourt, Kathryn; Lutz, Pierre-Eric; Ota, Vanessa; Mash, Deborah C.; Turecki, Gustavo; Ernst, Carl: BisQC: an operational pipeline for multiplexed bisulfite sequencing, BMC Genomics 2014, 15:290

Helga Thorvaldsdóttir, James T. Robinson, Jill P. Mesirov. Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics 2012.

Krueger, F. & Andrews, S. R. (2011), Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications, Bioinformatics, 2010, Oxford University Press, 27(11): 1571-1572.

Références (1)

Page 39: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

Krueger, F., Kreck, B., Franke, A. & Andrews S. R. (2012), DNA methylome analysis using short bisulfite sequencing data, Nature methods, 2012 Jan 30;9(2):145-51.

Liu, Y., Siegmund, K. D., Laird, P.W., Berman, B.P. (2012), Bis-SNP: Combined DNA methylation and SNP calling for Bisulfite-seq data, Genome Biology 2012, 13:R61

Kathryn Vaillancourt, Gang G Chen, Alpha Diallo, Raphael Poujol, Carl Ernst, Deborah C. Mash, Gustavo Turecki (2014): DNA Methylation in the Striatum of Individuals with Chronic Cocaine, Society for Neuroscience, 2014

Références (2)

Page 40: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

THANKS

Page 41: Analyse de données de séquençage deuxième générationmakarenkov_v/BIF7002/Presentation_Boubacar_2… · Researchers can now sequence more ... travers une compétition entre le

41

Séquenceurs nouvelle génération

http://www.jpathinformatics.org/viewimage.asp?img=JPatholInform_2012_3_1_40_103013_b2.jpg