Lab 4
Accesso alle sequenze
1) usando la ricerca avanzata, identificare in UniProt le entries della mioglobina umana e di quella murina (cioè di Mus musculus);
2) procurarsi le sequenze delle proteine in formato fasta e dei loro mRNA (sempre utilizzando UniProt e le cross-referenze di RefSeq, i link all’mRNA hanno il nome che comincia con nm_identificativo, vedi lezione7);
3) salvare le 4 sequenze in file di tipo testo (ad esempio: myo_human_nucl.txt, myo_human_pep.txt e così via).
Confronto
tra due sequenze
4) Collegarsi al sito dell'NCBI e trovare la pagina Global Align, il server dell’algoritmo di Needleman
e Wunsch (programmazione dinamica);
5) leggere le spiegazioni nel website;
6) effettuare il confronto tra gli mRNA della
mioglobina umana e murina utilizzando sia il copia/incolla, che l'upload
dei files preparati al punto 3 (IMPORTANTE:
ricordarsi di selezionare il programma per le sequenze nucleotidiche
(linguetta “nucleotide” in alto a sinistra) o quello per le sequenze proteiche
(linguetta “protein”);
7) una
volta ottenuto l’output, selezionare in alto a destra il link “Back to traditional
results page”;
8) lanciare il programma con parametri diversi, confrontando i diversi output che si ottengono;
9)
effettuare poi il confronto delle sequenze proteiche della mioglobina umana e
murina;
10) appuntarsi la percentuale di identità delle due sequenze confrontate, il
punteggio dell'allineamento e il suo expectation
value.
Confronto
tra una sequenza e una banca dati di sequenze
11) Collegarsi a. sito dell'NCBI e trovare la pagina di blast (blastp) per sequeze proteiche;
12) lanciare la proteina umana FHIT (cercare in UniProt le sequenze che abbiano gene name= FHIT e organism= Homo
sapiens e selezionare l'entry curata manualmente) contro
la banca dati SwissProt;
13) osservare con attenzione tutte le parti dell'output di blast (eventuali domini, output grafico,
descrizioni delle proteine simili identificate, allineamenti a coppie,
allineamento multiplo), sfruttando “Back
to traditional results”;
14) scegliere due allineamenti a basso e ad alto E-value (ad
esempio: 8e-09 e 0.91);
15) per ognuno degli allineamenti scelti, annotare i nomi delle proteine, il
punteggio di blast, la percentuale di
identità;
16) rilanciare la ricerca variando i parametri dell’algoritmo (matrice di
sostituzione o altro) e valutare la diversità degli output ottenuti.
fasta
17) Effettuare la stessa ricerca anche col programma fasta all'indirizzo: http://www.ebi.ac.uk/Tools/sss/fasta/ lanciando la sequenza di FHIT umana contro la sola banca dati SwissProt (attenzione a selezionare SOLO QUELLA, che dovrebbe essere quella di default);
18) la prima volta utilizzare i parametri di default;
19) analizzare l'output, seguendo il link ai singoli allineamenti, al visual output, alle functional predictions;
20) notare gli E-value di ogni match e le percentuali di identità degli allineamenti generati;
21) valutare "occhiometricamente" la differenza dei risultati ottenuti con blast;
22) ripetere la ricerca contro la banca dati UniProt Clusters 90% e Uniprot Clusters 50%;
23) ripetere qualche ricerca modificando i parametri di output (matrice di sostituzione, gap penalties).
Notare che
è possibile deselezionare le singole entry elencate nell’output
(cliccando su invert in alto a sinistra) e riselezionare poi singole entry di nostro interesse
per l’eventuale risottomissione ad altri programmi
(ad esempio Clustal Omega (scegliendoli
dal menu Tools in basso a sinistra).
Il
Laboratorio 4 per oggi finisce qui.
Per la
prossima volta cominciate a guardare quello che segue:
La malattia di Charcot-Marie-Tooth (CMT) è una polineuropatia sensitivo-motoria dovuta all'alterazione dei geni, alcuni dei quali ancora non noti, responsabili della formazione e/o della funzionalità dell'assone o della mielina, costituenti dei nervi. Un gene sicuramente coinvolto nella patologia è il gene per la mitofusina 2.
Clustal Omega
24) Utilizzando blast sul sito nell'NCBI, identificare in UniProtKB le proteine ortologhe della mitofusina-2 umana in altri organismi;
25) selezionare 4 o 5 sequenze, scegliendole con un coverage adeguato (ad esempio > 80%) e non troppo simili alla proteina umana;
26) collegarsi al sito di Clustal Omega e inserire nella apposita text area le sequenze delle proteine selezionate in formato fasta;
27) sviscerare l'output di Clustal Omega:
Alignments
- esaminare l’allineamento ottenuto;
- esaminare l’allineamento in colore;
Results summary
- esaminare la pagina;
- visualizzare i files esposti;
- provare a visualizzare l'output con Jalview;
Guide tree
- esaminare cladogramma
- e filogramma
Approfondimento
Per questa parte, si consiglia di tenere aperta una finestra del browser sulla sequenza della mitofusina 2 umana con gli aminoacidi ben identificabili in base al numero.
28) esaminare l'elenco di mutazioni associate a gravi patologie nella mitofusina 2 umana presente qui
29) valutare la conservazione dei residui associati a patologie nell'allineamento multiplo generato.