Binary Alignment Map

Le format cartographie d'alignement binaire, binary alignment map (BAM) est constitué de données brutes complètes sur le séquençage génomique ; il s'agit de la représentation binaire compressée sans perte du format SAM. La compression utilisée est le format BGZF. Les fichiers BAM peuvent être générés directement par les programmes d'alignement ou par SAMtools. Les fichiers BAM possèdent la même structure que les fichiers SAM. Du fait de leur taille réduite, les fichiers BAM sont plus facilement lisibles par les programmes dédiés au séquençage à haut débit. Il existe par exemple des librairies pour lire les fichiers BAM en Python et en R. Les fichiers BAM triés peuvent être indexés au travers d'un fichier BAI accompagnant, qui sert de table des matières au fichier BAM et permet d’accéder directement des parties spécifiques du fichier concerné (par exemple, une coordonnée chromosomique particulière), ce qui accélère grandement l'accès aux données. Certains logiciels comme IGV, DeepTools et pyDNAse requièrent un index pour lire les fichiers BAM.

Le format cartographie d'alignement binaire, binary alignment map (BAM) est constitué de données brutes complètes sur le séquençage génomique[1] ; il s'agit de la représentation binaire compressée sans perte du format SAM[2],[3]. La compression utilisée est le format BGZF. Les fichiers BAM peuvent être générés directement par les programmes d'alignement ou par SAMtools[4].
Les fichiers BAM possèdent la même structure que les fichiers SAM. Du fait de leur taille réduite, les fichiers BAM sont plus facilement lisibles par les programmes dédiés au séquençage à haut débit. Il existe par exemple des librairies pour lire les fichiers BAM en Python et en R. [5],[6] Les fichiers BAM triés peuvent être indexés au travers d'un fichier BAI accompagnant, qui sert de table des matières au fichier BAM et permet d’accéder directement des parties spécifiques du fichier concerné (par exemple, une coordonnée chromosomique particulière), ce qui accélère grandement l'accès aux données. Certains logiciels comme IGV, DeepTools et pyDNAse requièrent un index pour lire les fichiers BAM.
Voir également
[modifier | modifier le code]- Format FASTQ
- Format SAM
- SAMtools
- Format CRAM
- Liste des formats de fichiers pour la biologie moléculaire
Références
[modifier | modifier le code]- ↑ « Carl Zimmer's Game of Genomes, Season 1: Episode 3, BAM Reveals All », STAT (consulté le 21 août 2016)
- ↑ Li, Heng, « The Sequence Alignment/Map format and SAMtools », Bioinformatics, vol. 25, 8 juin 2009, p. 2078–9 (PMID 19505943, PMCID 2723002, DOI 10.1093/bioinformatics/btp352, lire en ligne)
- ↑ « Binary Alignment Map », National Cancer Institute Wiki (consulté le 21 août 2016)
- ↑ « Formats de fichiers utilisés dans le NGS »
- ↑ (en) « pysam - An interface for reading and writing SAM files »
- ↑ « Rsamtools », sur kasperdanielhansen.github.io (consulté le 28 mars 2019)