domingo, 31 de marzo de 2013

Búsqueda en OMIM


En esta segunda entrada vamos a centrar nuestra atención en una base de datos de gran importancia en el ámbito biomédico. Se trata de Online Mendelian Inheritance in Man (OMIM)una herramienta que agrupa y cataloga todas las enfermedades humanas conocidas que incluyen algún factor genético, y que se encuentra disponible en el National Center for Biotechnology Information (NCBI).

Para ejemplificar una búsqueda en OMIM, hemos elegido la enfermedad de Alzheimer, un conocido y devastador trastorno neurodegenerativo que, desde hace unos años, no ha hecho más que incrementar su incidencia en la pobalción y, en consecuencia, la atención de la comunidad científica. 

En primer lugar, vamos a buscar en OMIM algunos genes que puedan estar relacionados con dicha enfermedad. Para ello, accedemos a OMIM e introducimos el nombre de la enfermedad en la barra de búsqueda. Nos aparecerá una interfaz, de la que caben destacar dos herramientas básicas, muy útiles si buscamos una información en concreto.
  • Con Search OMIM accedemos a un menú de búsqueda avanzada, donde podemos restringir nuestra búsqueda estableciendo una serie de filtros:



  • La opción Search Gene Map agrupa y lista los distintos genes implicados según su localización citogenética.
Si buscamos información general, basta con introducir el nombre de la enfermedad en la barra de búsqueda. Nos aparecerá una lista de genes, de los cuales podremos acceder a mayor información haciendo click en ellos. Tomaremos como ejemplo el primer gen que aparece en la lista:

En primer lugar se nos muestra su número de accesión precedido de un asterisco (*), indicativo de que la entrada corresponde a un gen. A continuación, aparece el nombre de la proteína que codifica dicho gen (presenilina 1) y el del propio gen (PSEN1). Seguidamente, se muestra el código de su localización citogénica, en este caso 14q24.2 (cromosoma 14, brazo largo, posición 24) y un cuadro que incluye las relaciones gen-fenotipo (entre las cuales podemos diferenciar las relacionadas con la enfermedad de Alzheimer) cada una acompañada de su correspondiente número de accesión (Phenotype MIM number). Se detalla que este primer gen está implicado en la aparición temprana del Alzheimer de tipo 3. Para obtener más información sobre estas entradas en particular, basta con hacer click en sus respectivos números de accesión. 

Tras el cuadro de relación gen-fenotipo descrito, se nos muestra información (texto) del gen seleccionado, estructurada en tres secciones principales.


1) Clonación: se recogen y detallan las técnicas que se han llevado a cabo para la clonación del gen, así como la información más relevante que se ha podido extraer de las mismas.

Si comenzamos a leer, observamos que en los primeros datos que se recogen (Sherrington et al., 1995) se descubrió, mediante la técnica linking mapping, una región que contenía el supuesto gen responsable de la aparición temprana del Alzheimer de tipo 3, ligada al cromosoma 14q24.3. En el mismo año, el Alzheimer's Disease Collaborative Group aisló clones completos, en forma de cDNA, de lo que denominaron PS1, que adquiriría una gran relevancia en las futuras investigaciones.

2) Estructura del gen: en esta sección se recogen los datos obtenidos referidos a aspectos estructurales del gen seleccionado.
En nuestro caso, el Alzheimer's Disease Collaborative Group concluyó que el marco de lectura abierto (ORF) de este gen estaba codificado por 10 exones. Asimismo, determianron que el gen PS2 (PSEN2; 600759), localizado en el cromosoma 1, presentaba una estructura muy similar a aquél.

Dos años más tarde, Rogaev et al., demostraron que el gen PSEN1 contaba con una longitud de, al menos, 60 kb y presentaba 13 exones, de los cuales los cuatro primeros contenía una secuencia no traducida, y los dos primeros representaban zonas alternativas de iniciación de la transcripción.

3) Función del gen: en esta última sección, quizá la mas interesante y esclarecedora, se detallan las técnicas y los resultados obtenidos, referidos al estudio de la función del gen.En nuestro caso particular, se incluye además información referente al PSEN2, por su alta similitud con PSEN1, en cuanto al papel que juega en el desarrollo de esta enfermedad. Algunos de los datos que podemos extraer de la vasta información que en esta sección se nos muestra es la siguiente:

Mediante hibridaciones in situ y análisis inmunoquímicos, entre otras técnicas, se determinó la localización intracelular preferente de PS1 y PS2, respectivos productos de expresión de los genes, y se dedujo su posible interacción en la organización de los cromosomas y la segregación.

Otros datos relevantes que se obtuvieron en investigaciones posteriores mostraban la relevancia del complejo que la PS1 formaba con la beta-catenina. La beta-catenina se reducía notablemente en los cerebros de pacientes con Alzheimer, con mutaciones en PS1. La pérdida de beta-catenina aumentaba la vulverabilidad a la apoptosis.

Para mayor información sobre esta base de datos, podéis acceder a la sección help que se encuentra en la página principal de OMIM, donde encontrareis manuales de ayuda (como FAQs) o acceder al canal de youtube del NCBI, que cuenta con tutoriales como éste para facilitar el manejo de bases de datos como la que acabamos de ver.

lunes, 25 de marzo de 2013

Bienvenida y comienzo

¡Bienvenidos a Bioscience Me!

Este blog surge para acercar al lector al ámbito de la Biociencia, con especial interés por la Bioinformática, una de las ramas que má relevancia está adquiriendo en los últimos años. Así pues, las primeras entradas de este blog estarán dirigidas al manejo de diferentes bases de datos, lo que nos permitirá extraer una gran cantidad de información sobre nuestra diana biológica de interés. Para ello, nuestro objetivo será resolver las tareas propuestas en clase de Biosíntesis de Macromoléculas. 

Sin nada más que añadir (por el momento)... ¡Comencemos!

En esta primera entrada nos vamos a introducir en el manejo del National Center for Biotechnology Information (NCBI), una de las más importantes Bases de Datos del ámbito Científico. Analizaremos algunas secuencias de ácido nucleico pertenecientes al fragmento 17 del cromosoma 4 de Arabidopsis thaliana (número de accesión AL161505.2) y las representaremos en un esquema gráfico. 

El número de accesión nos dirigirá directamente a las anotaciones de la secuencia correspondiente. Llegados a este punto, buscaremos los CDS (coding sequence).
Podremos encontrarnos dos casos distintos, que se ejemplifican a continuación:
  • Primer caso. CDS: join(21183..21320, 21398..21662, 21795..21897, 21973..22195)
El término join indica que el RNA maduro será resultado de la unión de los distintos exones que se incluyen a continuación en la secuencia, entre paréntesis y separados por comas.



Haciendo en click en gene, podremos visualizar la secuencia del gen completa: 


A continuación se muestra una forma esquemática de representar el proceso de transcripción de este gen:


  • Segundo caso. CDS: complement(join(29065..29454, 29519..29703, 30603..30969, 31062..31307, 31359..31484))
En este caso, el término complement nos indica que la cadena sentido es la complementaria a la que nos muestra la base de datos. Del mismo modo que en el ejemplo anterior, join indica que el RNA maduro será el resultado de la unión de los exones del gen, que se muestran entre paréntesis y separados por comas.


De nuevo, hacemos click en gene para visualizar la secuencia completa del gen:


Para finalizar, se esquematiza el proceso de transcripción de este gen: