miércoles, 14 de octubre de 2009

Precisando la tarea #1

Ir a Blast en Genbank. Hacer una búsqueda de proteínas ("protein blast"), usando como "proteína" de consulta el nombre del alumno, limitado a los aminoácidos estándar (ACDEFGHIKLMNPQRSTVWY); por ejemplo, yo buscaría ANDRESMREIRA.

Tomen nota de la base de datos que usan y de los parámetros de la búsqueda (abajo en "Algorithm parameters"), de modo que yo pueda luego repetir sus querys.

Para el mejor match obtenido por la búsqueda:

- Muestre el dotplot entre su nombre (en la forma que se usó en la búsqueda) y un segmento de la proteína encontrada, que incluya el match.
- Muestre el alineamiento entre su nombre y el segmento de la proteína.
- ¿Qué función cumple la proteína? ¿Se sabe con certeza (base experimental), o es una hipótesis?
- El organismo en que la encontró: ¿qué es? (clasificación, descripción, imagen si existe)
- ¿Dónde y cómo está codificada la proteína? (Indique la ubicación de la CDS -"coding sequence"- de DNA que codifica la proteína, y acaso está en la hebra primaria o secundaria, si es continua o tiene interrupciones, etc.; incluya el código de acceso o URL de la secuencia de DNA)
- ¿Qué origen tienen los datos? (¿fue proyecto de secuenciamiento masivo? ¿Paper específico sobre el gen? ¿Estudio filogenético?)

Considerando ahora además los 5 matches siguiente (por lo tanto, 6 secuencias encontradas),

- ¿En qué organismos están? ¿Son especies cercanas a las del primer match?
- Dibuje el "árbol familiar" que muestre las relaciones entre los 6 organismos, de acuerdo a la información en Genbank.

Enviar por mail hasta el lunes 19 de octubre.

6 comentarios:

  1. Profesor puede una proteína no tener publicados los CDS??

    ResponderEliminar
  2. Posible, aunque muy poco probable. Tendrían que haber secuenciado la proteína misma, sin conocer el gen, o bien ser una proteína 100% artificial. Revisa bien!

    ResponderEliminar
  3. Pero a diferencia de otros que estuve viendo, donde si aparece en la parte de features CDs, este solo tiene source, SecStr, region y cite.
    Quizas debo ver en otro lado ?

    http://www.ncbi.nlm.nih.gov/protein/2DB5_A?log$=seqview_status

    ResponderEliminar
  4. Me temo que efectivamente tuviste mala suerte, te salió una proteína de un experimento! No está producida por un gen, sino por "Cell-free protein synthesis", o sea, por un sistema de fabricación de proteínas en laboratorio (se explica, por ejemplo, en http://promega.wordpress.com/2009/03/16/cell-free-protein-synthesis/

    Como no quiero que te saltes la parte de la CDS, elige: puedes tomar el segundo o tercer match (alguno que tenga CDS!), o si no, explica lo de la síntesis sin célula (un párrafo sin demasiado detalle -pero también sin errores- estaría ok).

    ResponderEliminar
  5. Comentario al margen: ahora corregí la configuración, para permitir comentarios de cualquiera (no me había dado cuenta de que estaba configurado para exigir usuarios registrados).

    ResponderEliminar
  6. Profesor, debemos enviar la tarea al mail
    amoreira@inf.utfsm.cl

    o a otro ?
    Saludos

    ResponderEliminar