Rechercher "convertir gbff en gff" Question: Converting Gbff To Gff3 Les gens qui sont perdus lorsqu'ils voient le contenu de ces discussions
Pour ceux qui veulent connaître des outils capables de convertir les données des sciences de la vie dans différents formats
Lorsque vous obtenez des données génomiques du NCBI --fasta fichier (.fasta)
Cependant, si vous souhaitez utiliser ces données comme génome de référence dans IGV, etc. L'IGV ne lira pas les informations sauf si le fichier d'annotation est **. Gff ** (gff3) ou **. Gtf ** (gff2). (L'explication du format de fichier est omise)
Gbff (fichier plat GenBank) et gff (format des fonctionnalités générales) Bref, puisqu'il s'agit d'un fichier d'annotation, peut-il être converti? Quand j'ai recherché "convertir gbff en gff", j'ai trouvé un enregistrement de ces discussions dans le passé. Il n'y a pas de solution spécifique.
Après avoir recherché diverses choses, j'ai réussi à trouver une méthode de conversion, je vais donc la présenter ici.
La clé de la solution résidait dans la discussion aux biostars introduite au début. Un script mystérieux appelé "bp_genbank2gff3.pl". Il semble qu'il puisse être utilisé avec bioperl, mais il semble qu'il y ait un bogue dans le contenu de la conversation. Peut-être qu'il existe un outil similaire à python? Je l'ai trouvé quand je l'ai recherché.
Q. Si vous utilisez ensembl, vous pouvez obtenir le fichier d'annotation sous forme de fichier gff (gtf), alors pourquoi ne pas avoir une telle difficulté en premier lieu? R. Je n'avais que des données sur ncbi, probablement parce que je voulais utiliser une créature mineure ...
** 1. Installez bioconvert **
pip install bioconvert
This method installs Bioconvert and its Python dependencies. Note, however, that bioconvert may use (depending on the conversion you want to use) external dependencies not available on Pypi. You will need to install those third-party dependencies yourself. An alternative is to install bioconvert using conda as explained here after. https://bioconvert.readthedocs.io/en/master/installation.html
Lors de l'installation avec pip, cela résout la dépendance du module python géré par PyPI, mais il semble que cela ne résout pas la dépendance du paquet tiers. ** En bref, l'installation avec pip limite la fonctionnalité. ** ** Il semble que l'utilisation de conda résoudra également les dépendances dans ce domaine, Ignorez cette fois car il suffit de convertir & gbff → gff3 sans utiliser conda.
** 2. Si l'installation échoue au milieu (probablement un échec d'installation de mappy), installez également le package python3-devel **
yum install python3-devel
** 3. Installez le biocode **
pip install biocode
bioconvert --help
Comme mentionné ci-dessus, la fonction est limitée et un avertissement indiquant que certaines méthodes ne sont pas disponibles s'affiche dans une ligne.
WARNING [bioconvert.core.base]: converter 'FASTQ2FASTA': method seqtk is not available
WARNING [bioconvert.core.base]: converter 'GENBANK2EMBL': method squizz is not available
WARNING [bioconvert.core.base]: converter 'GENBANK2FASTA': method squizz is not available
WARNING [bioconvert.core.base]: converter 'GZ2BZ2': method pigz_pbzip2 is not available
WARNING [bioconvert.core.base]: converter 'GZ2DSRC': method pigzdsrc is not available
genbank2gff3 genbank to-> gff3 (1 methods)
Aucun avertissement n'est affiché pour genbank2gff3 que vous souhaitez utiliser cette fois, vous pouvez donc être assuré. ~~ Soyez prêt pour que le journal se salisse à chaque fois que vous exécutez le script ~~
bioconvert genbank2gff3 foo.gbff foo.gff3
Peut être converti de foo.gbff à foo.gff3
Pendant la conversion
WARNING: The following feature was skipped:
type: assembly_gap
location: [96782:96838](+)
qualifiers:
Key: estimated_length, Value: ['56']
Key: gap_type, Value: ['within scaffold']
Key: linkage_evidence, Value: ['paired-ends']
Les informations que gff3 ne prend pas en charge, telles que, ne sont pas transférées dans le fichier gff3.
Voir le readme de bioconvert https://github.com/bioconvert/bioconvert
Recommended Posts