Lab 4

 

Accesso alle sequenze

1) usando la ricerca avanzata, identificare in UniProt le entries della mioglobina umana e di quella murina (cioè di Mus musculus);

2) procurarsi le sequenze delle proteine in formato fasta e dei loro mRNA (sempre utilizzando UniProt e le cross-referenze di RefSeq, i link all’mRNA hanno il nome che comincia con nm_identificativo, vedi lezione7);

3) salvare le 4 sequenze in file di tipo testo (ad esempio: myo_human_nucl.txt, myo_human_pep.txt e così via).

 

Confronto tra due sequenze
4) Collegarsi al sito dell'NCBI e trovare la pagina Global Align, il server dell’algoritmo di Needleman e Wunsch (programmazione dinamica);
5) leggere le spiegazioni nel website;
6) effettuare il confronto tra gli mRNA della mioglobina umana e murina utilizzando sia il copia/incolla, che l'upload dei files preparati al punto 3 (IMPORTANTE: ricordarsi di selezionare il programma per le sequenze nucleotidiche (linguetta “nucleotide” in alto a sinistra) o quello per le sequenze proteiche (linguetta “protein”);

7) una volta ottenuto l’output, selezionare in alto a destra il link “Back to traditional results page”;

8) lanciare il programma con parametri diversi, confrontando i diversi output che si ottengono;

9) effettuare poi il confronto delle sequenze proteiche della mioglobina umana e murina;
10) appuntarsi la percentuale di identità delle due sequenze confrontate, il punteggio dell'allineamento e il suo expectation value.

 

Confronto tra una sequenza e una banca dati di sequenze
11) Collegarsi a. sito dell'NCBI e trovare la pagina di blast (blastp) per sequeze proteiche; 
12) lanciare la proteina umana FHIT (cercare in UniProt le sequenze che abbiano gene name= FHIT e organism= Homo sapiens e selezionare l'entry curata manualmentecontro la banca dati SwissProt;
13) osservare con attenzione tutte le parti dell'output di blast (eventuali domini, output grafico, descrizioni delle proteine simili identificate, allineamenti a coppie, allineamento multiplo), sfruttando “Back to traditional results”; 
14) scegliere due allineamenti a basso e ad alto E-value (ad esempio: 8e-09 e 0.91);
15) per ognuno degli allineamenti scelti, annotare i nomi delle proteine, il punteggio di blast, la percentuale di identità;
16) rilanciare la ricerca variando i parametri dell’algoritmo (matrice di sostituzione o altro) e valutare la diversità degli output ottenuti.

 

fasta

17) Effettuare la stessa ricerca anche col programma fasta all'indirizzo: http://www.ebi.ac.uk/Tools/sss/fasta/ lanciando la sequenza di FHIT umana contro la sola banca dati SwissProt (attenzione a selezionare SOLO QUELLA, che dovrebbe essere quella di default);

18) la prima volta utilizzare i parametri di default;

19) analizzare l'output, seguendo il link ai singoli allineamenti, al visual output, alle functional predictions;

20) notare gli E-value di ogni match e le percentuali di identità degli allineamenti generati;

21) valutare "occhiometricamente" la differenza dei risultati ottenuti con blast;

22) ripetere la ricerca contro la banca dati UniProt Clusters 90% e Uniprot Clusters 50%;

23) ripetere qualche ricerca modificando i parametri di output (matrice di sostituzione, gap penalties).

 

Notare che è possibile deselezionare le singole entry elencate nell’output (cliccando su invert in alto a sinistra) e riselezionare poi singole entry di nostro interesse per l’eventuale risottomissione ad altri programmi (ad esempio Clustal Omega (scegliendoli dal menu Tools in basso a sinistra).

 

Il Laboratorio 4 per oggi finisce qui.

Per la prossima volta cominciate a guardare quello che segue:

 

La malattia di Charcot-Marie-Tooth (CMT) è una polineuropatia sensitivo-motoria dovuta all'alterazione dei geni, alcuni dei quali ancora non noti, responsabili della formazione e/o della funzionalità dell'assone o della mielina, costituenti dei nervi. Un gene sicuramente coinvolto nella patologia è il gene per la mitofusina 2.

 

Clustal Omega

24) Utilizzando blast sul sito nell'NCBI, identificare in UniProtKB le proteine ortologhe della mitofusina-2 umana in altri organismi;

25) selezionare 4 o 5 sequenze, scegliendole con un coverage adeguato (ad esempio > 80%) e non troppo simili alla proteina umana;

26) collegarsi al sito di Clustal Omega e inserire nella apposita text area le sequenze delle proteine selezionate in formato fasta;

27) sviscerare l'output di Clustal Omega:

 

   Alignments

-           esaminare l’allineamento ottenuto;

-           esaminare l’allineamento in colore;

   Results summary

-           esaminare la pagina;

-           visualizzare i files esposti;

-           provare a visualizzare l'output con Jalview;

   Guide tree

-           esaminare cladogramma

-           e filogramma

 

Approfondimento 

Per questa parte, si consiglia di tenere aperta una finestra del browser sulla sequenza della mitofusina 2 umana con gli aminoacidi ben identificabili in base al numero.

28) esaminare l'elenco di mutazioni associate a gravi patologie nella mitofusina 2 umana presente qui

29) valutare la conservazione dei residui associati a patologie nell'allineamento multiplo generato.