Seguimos profundizando en el NCBI. En este caso, buscamos algún servicio que nos permita determinar cuántos genomas completos de bacterias y eucariotas se han secuenciado hasta el momento, e investigaremos sobre qué información podemos extraer de los mismos.
Las principales bases de datos que encontraremos a este respecto son dos:
- Genome: contiene datos de secuencias y mapa de datos de genomas de más de 1000 especies o cepas. Aquí se representan tanto genomas ya completados como genomas en proceso de secuenciación. Los tres dominios principales (bacterias, arqueas y eukaryota) están representados, así como muchos virus, fagos, viroides, plásmidos y orgánulos.
- Genome project: recoge información completa y en fase de desarrollo a gran escala de proyectos de secuenciación, así como el montaje, anotaciones, etc. La base de datos está organizada como una visión en conjunto (información general) de organismos específicos, que permite la navegación y recuperación de proyectos para un organismo determinado.
En este caso, haremos uso de Genome. Podremos acceder bien a través de la página principal de NCBI o haciendo click aquí). Para ejemplificar una búsqueda, introduciremos "bacteria" en el buscador. De esta forma, accederemos a una página con todos los resultados de organismos cuyo genoma se encuentra completamente secuenciado o está en proceso (4114 en nuestro caso particular), acompañados de una breve descripción, el reino al que pertenecen, su número de cromosomas y plásmidos, así como un número de identificación.
Vamos a tomar como ejemplo el organismo modelo Echerichia coli para profundizar en la información que nos ofrece esta herramienta.
Clickando en su correspondiente enlace, nos aparecerá una nueva página mucho más específica, donde encontraremos mayor información sobre el organismo incluído su linaje completo. El aspecto que quizá pueda parecer más interesante es el esquema del genoma de la bacteria (basado un alineamiento local tipo BLAST). Este esquema incluye las distintas cepas empleadas en su secuenciación (de las que podremos obtener información más específica haciendo click en su código de accesión). También incluye otros bioproyectos en los que se encuentra implicados el organismo, una herramienta (BLAST genome), que nos permite comparar su genoma con el de otras especies mediante un alineamiento tipo BLAST así como un gran número de publicaciones y fuentes externas.
Este mismo procedimiento de búsqueda se seguirá para obtener este tipo de información de cualquier organismo que precisemos. Si tenéis alguna duda en el manejo de esta herramienta, siempre podéis acceder al menú help del NCBI, así como diversos tutoriales que se encuentran en su canal de youtube, ya mencionado en entradas anteriores.
Con esta entrada damos por terminada la introducción a la enorme variabilidad de información que podemos encontrar en la base de datos preteneciente al NCBI. Esta herramienta cuenta además con una guía explicativa de todas las Bases de datos accesibles desde el mismo, un excelente complemento a su canal de Youtube que merece la pena curiosear si no tenéis muy claro donde encontrar una información en concreto. ¡Buena suerte y seguir investigando!
No hay comentarios:
Publicar un comentario