Sélection de la langue

Recherche

Lignes directrices sur la présentation des données issues du séquençage du génome entier (SGE) au soutien de l'évaluation préalable à la mise en marché des aliments nouveaux destinés à la consommation humaine et animale et aux végétaux à caractères nouveaux

Objectif

Le but de ce document est de fournir des orientations à l'industrie sur l'utilisation du séquençage du génome entier (SGE) à l'appui de la génération de données pour les soumissions préalables à la mise en marché pour les plantes génétiquement modifiées. Les plateformes commerciales pour le séquençage génétique à haut débit ont été lancées au milieu des années 2000 et continuent à subir un développement rapide. Ces plateformes sont de plus en plus abordables et, avec plus d'une décennie d'expérience, elles sont également plus fiables et accessibles aux développeurs avec de différents niveaux de ressources. L'adoption du SGE a été répandue dans la recherche biologique, médicale et agricole, et plus récemment dans le diagnostic clinique et l'épidémiologie. Les organismes réglementaires au Canada et nos homologues internationaux ont reçus et continuent de recevoir des soumissions qui incluent des données de SGE. Compte tenu de la complexité de ces données, l'industrie a demandé des orientations qui leur permettront de produire des soumissions organisées d'une manière qui facilitera le processus d'évaluation réglementaire. L'utilisation de la technologie du SGE est facultative et les données générées à l'aide de méthodes de biologie moléculaire traditionnelles sont toujours acceptables.

Le 31 mai 2017, Santé Canada et l'Agence canadienne d'inspection des aliments (ACIA) ont publié une ébauche de lignes directrices sur le site Web de Santé Canada, demandant des commentaires sur ces lignes directrices à la communauté élargie des intervenants. Les commentaires ont été acceptés jusqu'à 12 h HNE le 30 juillet 2017. Ce document final comprend des modifications rédactionnelles mineures incorporées à la suite des commentaires reçus.

Les premières étapes de la rédaction des lignes directrices ont été dévelopées à la suite de discussions du Groupe de travail technique trilatéral (GTTT) du Canada, des États-Unis et du Mexique, et les perspectives des homologues réglementaires du Canada ont contribué à l'élaboration de ce document. Aux connaissances de Santé Canada et l'ACIA, ce document d'orientation est le premier à aborder la soumission des données de SGE pour l'évaluation préalable à la mise en marché des plantes génétiquement modifiées.

Préface

Les aliments nouveaux destinés à la consommation humaine et animale ainsi que les végétaux à caractères nouveaux (VCN) doivent faire l'objet d'une évaluation obligatoire préalable à la mise en marché. Des documents d'orientation publiésNote de bas de page 1 à l'intention des développeurs de ces produits dressent la liste des renseignements et des données nécessaires au moment d'un dépôt préalable à la mise en marché. Ils comprennent habituellement les données issues d'une caractérisation moléculaire complète. L'analyse moléculaire poursuit trois objectifs : (i) révéler les modifications apportées au génome de la lignée, (ii) en vérifier la stabilité et (iii) contribuer à la prédiction du mode d'action moléculaire ou biochimique ou, en d'autres mots, des mécanismes au moyen desquels les modifications génétiques donnent lieu aux phénotypes ou aux caractères nouveaux.

Les données produites au moyen des techniques moléculaires classiques, par exemple la méthode du transfert de Southern, le séquençage de Sanger et les essais fondés sur la réaction en chaîne de la polymérase (PCR), sont habituellement présentées par les requérants au soutien de leurs demandes préalables à la mise en marché. Ces données renseignent sur les résultats finaux de la caractérisation moléculaire dont les organismes de réglementation tiennent compte au moment de leur évaluation, notamment la caractérisation :

Considérées ensemble, les données moléculaires présentées dans le cadre d'une demande contribuent à la preuve aux fins de l'interprétation formelle de la nature et de la stabilité des modifications génétiques survenues dans la lignée.

Au cours des dernières années, une avancée technologique a eu lieu alors que nous avons assisté au développement du séquençage massivement parallèle, aussi appelé séquençage génétique à haut débit, séquençage de nouvelle génération (SNG) ou séquençage du génome entier (SGE). Dans le présent document d'orientation, l'abréviation SGE sera retenue. Plusieurs plateformes permettent la production rapide de grandes quantités de données sur les séquences d'ADN. Cette technologie hautement automatisée devient toujours plus accessible et abordable. Par conséquent, les requérants souhaiteront peut-être y recourir pour produire les données à l'appui de la caractérisation moléculaire de leurs produits.

Essentiellement, toutes les méthodes de SGE comportent la collecte de données sur la séquence du génome à grande échelleNote de bas de page 2 à une résolution d'un seul nucléotide, habituellement dans une collecte de fragments dont l'interprétation nécessite la curation et bien souvent, une analyse informatique sophistiquée. Les technologies de SGE et les méthodes d'analyse évoluent rapidement. Les requérants sont invités à consulter la documentation scientifique et les sites Web des fabricants de dispositifs pour obtenir de l'information au sujet des développements les plus récents. En ce qui a trait aux organismes de réglementation, plutôt que les données brutes, la démonstration de la qualité globale de la séquence, la description et la validation de l'analyse in silico (c'est-à-dire, informatique) et la présentation des données sont les plus précieuses lorsqu'il s'agit de mener l'évaluation. Comme pour toute soumission de données scientifiques préparée pour un examen préalable à la mise en marché, les organismes de réglementation se réservent le droit de demander les données brutes en cas de besoin.

En raison des changements rapides et continus dans le domaine du séquençage, il n'existe pas de procédures normalisées pour la production et l'analyse de données issues du SGE qui s'appliqueraient de manière universelle à l'échelle de toutes les plateformes et applications de ces techniques. Le besoin d'établir dans un document d'orientation les principes et les pratiques exemplaires dont les requérants doivent tenir compte au moment d'organiser et de présenter une analyse fondée sur le SGE comme volet d'un dépôt préalable à la mise en marché a été déterminé. L'objectif consiste à veiller à ce que les données issues du SGE présentées aux organismes de réglementation soient produites au moyen d'une analyse solidement étayée ainsi qu'à ce qu'il soit possible de démontrer qu'elles sont à tout le moins aussi robustes que les données moléculaires obtenues au moyen des méthodes traditionnelles de biologie moléculaire. Le présent document d'orientation décrit les attentes en matière de renseignements devant figurer dans une demande en matière de plan d'étude et de méthodes de SGE, de même que d'analyse et de présentation des données.

I. Les techniques de SGE par rapport aux techniques traditionnelles de biologie moléculaire

Dans la documentation, des exemples ont révélé combien les données issues du SGE peuvent être utiles pour la caractérisation de l'ADN inséré en remplacement des transferts de Southern (Kovalic et coll., 2012; Zastrow-Hayes et coll., 2015). Des observations indiquent aussi la possibilité de les appliquer aux lignées transgéniques ou cisgéniques. À l'égard de la caractérisation moléculaire de différents résultats finaux (par exemple, pour les produits de la mutagenèse et/ou de la sélection, ainsi qu'en règle générale aux fins des études portant sur l'hérédité du caractère), le recours aux méthodes classiques se montre plus approprié. Les données générées au moyen des méthodes moléculaires classiques demeurent acceptables dans le cadre des demandes préalables à la mise en marché. Les requérants ont la latitude de les présenter seules ou assorties de données issues du SGE aux fins de la caractérisation moléculaire, peu importe la méthode de mise au point utilisée pour produire la lignée.

Lorsque les requérants présentent des données issues de techniques moléculaires traditionnelles, les descriptions des méthodes et de l'analyse sont généralement simples. En effet, ces techniques sont utilisées à grande échelle et habituellement, l'interprétation des données est relativement simple. Quand il s'agit de SGE, chaque analyse peut être unique. De plus, la production de résultats interprétables des lectures de séquence nécessite fréquemment un traitement sur mesure et sophistiqué. Pour cette raison, dans le cadre d'une demande, toutes les manipulations appliquées aux données de la séquence doivent être expliquées, et l'élimination de toute séquence d'une analyse doit d'être justifiée.

La démonstration du fait que les données issues du séquençage déposées représentent fidèlement le génome de la lignée relève du requérant. Des mesures ainsi que des analyses et/ou des contrôles de la qualité appropriés devraient être présentés, de même qu'expliqués, dans le but d'inspirer confiance à l'organisme de réglementation quant à la rigueur avec laquelle la caractérisation du SGE a été réalisée. L'organisme en question doit pouvoir compter sur le fait que les résultats reflètent avec précision et complétude la structure du génome et les modifications qui y ont été apportées.

II. Plan d'étude et méthodologies de SGE

La stratégie globale de l'étude de SGE et la justification du choix de la méthode doivent être expliquées avec limpidité. Il convient également d'indiquer dans la demande quels sont les résultats finaux de la caractérisation moléculaire ciblés en recourant à la méthode sélectionnée.

Plusieurs plateformes de séquençage sont offertes, chacune offrant une gamme de modèles fréquemment actualisés. Outre les instruments, les trousses de préparation d'échantillons d'ADN et le logiciel intégré sont optimisés avec régularité. En règle générale, les technologies de SGE sont à la fois puissantes et polyvalentes. Cependant, chaque système a ses forces et ses limites, et certains sont mieux adaptés que d'autres à diverses situations de séquençage. La demande doit faire état de la marque et du modèle de l'instrument, de même que de la version du logiciel intégré.

Le requérant doit aussi décrire la façon dont l'échantillon d'ADN a été préparé en faisant état de la distribution des longueurs de fragment. S'il s'agit d'une trousse commerciale, ces renseignements peuvent être indiqués également, mais en mentionnant aussi toutes les limites de performance connues de la trousse en question ainsi que toutes les mesures prises, le cas échéant, pour les prendre en compte.

Dans le contexte du SGE, un biais peut survenir alors que la séquence cible (ou séquence d'intérêt) contient des régions quelconques (par exemple, des régions riches en GC ou en AT, de faible complexité ou répétitives) donnant lieu à des artéfacts de séquençage, ce qui entraîne soit leur représentation excessive, soit leur sous-représentation dans les données. S'il y a lieu, les requérants devraient indiquer toute étape prise avant le séquençage ou par la suite au cours de l'analyse afin de tenir compte des biais en question.

De la même façon, si le plan expérimental de SGE nécessite le recours à des témoins, des précisions devraient être communiquées. Le séquençage d'un génome de référence enrichi de la séquence cible, laquelle est analogue à un témoin positif utilisé dans une analyse par transfert de Southern pour montrer le caractère spécifique de la sonde, peut en être un exemple.

Dans l'ensemble, la demande doit comporter une description claire de l'objet et de la justification de l'étude de SGE. Comme matériel de soutien, il est possible de présenter les protocoles de laboratoire, par exemple, en annexe, et d'en faire référence dans la vue d'ensemble de la méthodologie.

III. Analyse des données issues du SGE

Selon le ou les résultats finaux de la caractérisation moléculaire que l'on cible, les lectures de séquence du SGE peuvent être traitées différemment. Au bout du compte, l'objectif de l'analyse des données consiste à produire des tableaux et des figures qui font état des principaux renseignements obtenus des données issues du séquençage, lesquelles soutiennent clairement les conclusions du requérant au sujet des résultats finaux de la caractérisation moléculaire. Les demandes doivent comprendre une description par étapes du pipeline d'analyse des données organisée de manière à faciliter l'interprétation des résultats soumis.

Les requérants sont encouragés à accompagner de schémas la description narrative du pipeline d'analyse des données. Lorsqu'il y a lieu, les aspects suivants doivent être abordés :

La profondeur, l'étendue et l'uniformité de la couverture constituent des facteurs clés à considérer aux fins de l'analyse et de l'interprétation des données. Aucun seuil n'est établi en matière de couverture, car cet aspect dépendra du cas particulier. À titre d'exemple, une couverture moyenne relativement faible peut suffire à démontrer qu'une séquence d'intérêt est présente dans le génome de la lignée. Afin de soutenir toute conclusion dépendant de l'échantillonnage du génome entier (c'est-à-dire, d'une étendue de couverture approchant les 100 pour cent), celle-ci doit être démontrée de manière empirique en recourant à des témoins ou à d'autres indicateurs. Les facteurs contribuant à atteindre l'étendue de couverture appropriée pour différentes applications sont examinés par Sims et coll., 2014. Dans toute étude de SGE, le requérant doit justifier le caractère adéquat de la couverture du génome par rapport à ses conclusions. Toute brèche en matière de couverture ou de régions présentant une couverture soit plus superficielle, soit plus approfondie par rapport à la moyenne devra faire l'objet d'une explication, sans quoi la caractérisation devra être poussée davantage.

IV. Présentation des données issues du SGE

Le choix de la façon de présenter les données issues du SGE en tableau ou en figure dépend des résultats finaux attendus de la caractérisation moléculaire. Kovalic et coll., 2012, et Zastrow-Hayes et coll., 2015, en présentent des exemples. Cependant, les requérants n'ont pas à se limiter à ces modèles. Le contenu narratif d'une demande doit expliquer les données et les justifications à l'appui des conclusions du requérant. En la matière, les renseignements pertinents sont les suivants :

Glossaire

Algorithme
Un processus de règles établies à suivre dans le calcul ou autres opérations de résolution de problème, particulièrement par un ordinateur.
Couverture
Le nombre de lectures de SGE représentant un nucléotide donné. La profondeur, l'étendue et l'uniformité de la couverture servent de mesures de la qualité des données sur la séquence.
Profondeur de couverture
Le nombre de reprises auquel chaque base de nucléotides donnée est lue pendant le processus de séquençage.
Étendue de la couverture
La fraction du génome couverte par les lectures au cours du processus de séquençage.
Uniformité de la couverture
L'intervalle de profondeurs de couverture d'un génome pour un test de séquençage.
Assemblage de novo
Une approche de l'assemblage des lectures de SGE au moyen de l'alignement des unités les unes avec les autres sans utiliser un génome de référence.
Jonction
Dans le génome d'une lignée transgénique, les jonctions correspondent aux sites d'insertion de cassettes. Les fragments d'ADN où se trouvent les jonctions, c'est-à-dire, la séquence contenant à la fois la cassette insérée et la séquence hôte endogène, peuvent être détectés au moyen de la méthode du transfert de Southern ou de l'analyse fondée sur le SGE.
Brèche
Dans le cadre de l'alignement des séquences, des espaces sont introduits afin de représenter les sites où une séquence contient davantage de nucléotides par rapport aux autres. Ces brèches indiquent qu'une insertion ou une délétion est survenue à un certain point où les séquences divergent.
Paramètres
Dans un programme informatique, les variables que l'utilisatrice ou l'utilisateur peut modifier pour influer sur la sortie des données.
Pipeline
Une collection de programmes et de scripts qui permettent aux données de circuler dans une direction contrôlée dans chaque programme jusqu'à la conclusion. Un pipeline peut être élaboré pour automatiser entièrement une série de programmes et de scripts en vue d'obtenir une réponse ou compléter une analyse.
Lectures
Les fragments d'une séquence d'ADN issus d'une expérience de SGE. La longueur des lectures dépend de la préparation initiale de la banque et de la plateforme de séquençage. La collection des séquences ainsi obtenue est habituellement de haute qualité, et le triage et l'analyse sont nécessaires pour permettre l'interprétation.
Référence
Une base de données des séquences des nucléotides du génome d'un organisme d'intérêt. Les génomes de référence sont organisés, généralement de très haute qualité et en majeure partie assemblés; dans l'assemblage, les brèches correspondent fréquemment à des régions hautement répétitives. Habituellement, il s'agit d'hybrides de plusieurs donneurs. Par conséquent, ils ne représentent pas une souche ou un individu unique.

Références

Kovalic, D. et coll. « The Use of Next Generation Sequencing and Junction Sequence Analysis Bioinformatics to Achieve Molecular Characterization of Crops Improved Through Modern Biotechnology », Plant Genome, 2012, vol. 5, no3, p.149-163, doi: 10.3835/plantgenome2012.10.0026.

Sims, D. et coll. « Sequencing depth of coverage: key considerations in genomic analysis », Nature Reviews Genetics, 2014, vol. 15, p. 121-132, doi:10.1038/nrg3642.

Zastrow-hayes, G. M. et coll. « Southern-by-Sequencing: A Robust Screening Approach for Molecular Characterization of Genetically Modified Crops », The Plant Genome, 2015, vol 8, no1, doi:10.3835/plantgenome2014.08.0037.

Date de modification :