Help ABI_chroma

ABI Chroma Align

BOZZA IN COSTRUZIONE

Con questo programma è possibile allineare una o più sequenze di cromatogrammi formato ABI (metodo Sanger)(max. 4) contro una sequenza di riferimento.
L'allineamento cromatogrammi e sequenze (formato testo), facilita il loro confronto . Il programma visualizza e mette in rilievo eventuali incongruenze.
Il programma risulta utile, in particolare, se si sequenzia un particolare gene (di cui si conosce la sequenza di riferimento) per verificare l'esistenza di eventuali mutazioni sia in omozigosi che in eterozigosi)
La visualizzazione grafica dei cromatogrammi, allineati alla sequenza di riferimento, facilita l'interpretazione di eventuali incertezze delle basi delle sequenze. Infatti, a volte dei rumori di fondo sono interpretati automaticamente dai cromatogrammi come polimorfismi eterozigoti. L'allinamento dei cromatogrammi con la possibilità di zummare in una particolare regione, permette, ad esempio, di verificare visivamente la bontà della predizione di particolari mutazioni.

File ABI

Si possonono inserire file di cromatogrammi in formato ABI.
Se si lavora con un client in locale, è possibile inserire fino a 4 cromatogrammi, altrimenti, per problemi di trasmissione dati, è possibile inserine solo due.
Non è possibile invece inserire nuovi cromatogrammi se si proviene da link di altri programmi, dove vengono automaticamente inseriti i file ABI.

La sequenza relativa al primo file immesso, rappresenta la sequenza leader e sarà considerata il seme per allineare tutte le altre sequenze ABI.
Le singole sequenze estratte dai file ABI, vengono unite a formare un'unica sequenza chiamata 'contig' che serve per il confronto con la sequenza di riferimento.

REFERENCE SEQUENCE

Si possono introdurre una o più sequenze di riferimento (in questo ultimo caso, le sequenze devono essere scritte nel formato FASTA). Il programma sceglierà automaticamente la seqeunza di riferimento che meglio si allinea con le sequenze dei cromatogrammi e la utilizzerà come sequenza di riferimento.
Questa modaltà 'multi sequenza' è stata creata per facilitare lavori ripetitivi su più geni differenti. In questo modo, è possibile creare un unico riferimento, formato da più sequenze di differenti geni.

Nella sequenza di riferimento possono essere introdotte basi polimorfiche (solitamente eterozigosi) utilizzando i caratteri IUPAC, facilitando così il confronto tra l'atteso e il predetto.

Automatic translation

Barrando la casella 'Automatic translation' sarà possibile ossevare direttamente nell'allineamento, l'effetto delle eventuali mutazioni nelle regioni codificanti e il cambiamento della sequenza proteica.
Per scegliere questa opzione, è necessario impostare nella reference una sola sequenza ed è necessario scriverla in un particolare modo:
- le regioni trascritte devono essere scritte in maiuscolo, mentre quelle non trascritte (es. introni) devono essere scritte in minuscolo.
- è necessario specificare, adoperando le parentesi quadre '[ ]' , l'inizio e la fine della traduzione. (solitamente, le regioni trascritte hanno anche le regioni 5' e 3' UTR che non sono codificanti).
Il programma fornirà uno 'warning' se il primo codone non risulta essere 'ATG' = Metionina oppure se l'ultimo codone non risulta essere un codone di STOP.
Verrò dato uno 'warning' anche se la regione codificante non è divisibile per tre. In questo caso la sequenza codificante verrà opportunamente accorciata.

Se non si inserisce la seqeunza completa di un gene, è necessario che la segnalazione dell'inizio della traduzione corrisponda con l'inizio di un codone, altrimenti si ottiene uno errato shift della traduzione.

E' facile ottenere il formato richiesto, utilizzando, ad esempio, UCSC Genome Browser.

Esempio
 
 tagtgaccTCAATGTTCGCAGTCGACA[ATGAGCAGAGTT
 GATGTACCGCACGGATGTGGGTCGCCACACaaccttatat
 ccttagcgcagcgcgaaacggcagcgnn...........
 .......AGATCCGGGTGCCCCACTATCACTGA]ACTGG

highlight
In questa riga vengono inseriti alcuni simboli per mettere in risalto i polimorfismi e/o discordanze tra la sequenza di riferimento e la sequenza del contig (che è l'unione delle singole sequenze dei cromatogrammi).

Simboli adoperati:
'*': Stesso polimorfismo in Reference e contig
'*': Differenti polimorfismo in Reference e contig
'§': polimorfismo solo su sequenza ABI, ma non in Reference
'?' basi di due o più Seq.uenzeABI differenti tra loro
'#' Basi non polimorfiche e differenti tra contog e Reference

highlight in translate
Nelle rige 'Translate Reference' e 'Translate contig' vengono sritti i simboli dei relativi aminoacidi tradotti dai codoni. Questi sono individuati mediante le indicazioni inserite nella sequenza di riferimento (vedi sopra).
Se viene incontrato un codone di stop, viene inserito il simbolo '-':
L'aminoacido viene scritto in rosso se quello tradotto dal contig è differente rispetto a quello rappresentato dal reference.
In presenza di polimorfismi, che determinano codoni che esprimono aminoacidi differenti, viene scritto il simbolo '#'