BOZZA IN COSTRUZIONE
Si possonono inserire file di cromatogrammi in formato ABI.
Se si lavora con un client in locale, è possibile inserire fino a 4 cromatogrammi, altrimenti, per problemi di trasmissione dati, è possibile inserine solo due.
Non è possibile invece inserire nuovi cromatogrammi se si proviene da link di altri programmi, dove vengono automaticamente inseriti i file ABI.
La sequenza relativa al primo file immesso, rappresenta la sequenza leader e sarà considerata il seme per allineare tutte le altre sequenze ABI.
Le singole sequenze estratte dai file ABI, vengono unite a formare un'unica sequenza chiamata 'contig' che serve per il confronto con la sequenza di riferimento.
Si possono introdurre una o più sequenze di riferimento (in questo ultimo caso, le sequenze devono essere scritte nel formato FASTA). Il programma sceglierà automaticamente la seqeunza di riferimento che meglio si allinea con le sequenze dei cromatogrammi e la utilizzerà come sequenza di riferimento.
Questa modaltà 'multi sequenza' è stata creata per facilitare lavori ripetitivi su più geni differenti. In questo modo, è possibile creare un unico riferimento, formato da più sequenze di differenti geni.
Nella sequenza di riferimento possono essere introdotte basi polimorfiche (solitamente eterozigosi) utilizzando i caratteri IUPAC, facilitando così il confronto tra l'atteso e il predetto.
Barrando la casella 'Automatic translation' sarà possibile ossevare direttamente nell'allineamento, l'effetto delle eventuali mutazioni nelle regioni codificanti e il cambiamento della sequenza proteica.
Per scegliere questa opzione, è necessario impostare nella reference una sola sequenza ed è necessario scriverla in un particolare modo:
- le regioni trascritte devono essere scritte in maiuscolo, mentre quelle non trascritte (es. introni) devono essere scritte in minuscolo.
- è necessario specificare, adoperando le parentesi quadre '[ ]' , l'inizio e la fine della traduzione. (solitamente, le regioni trascritte hanno anche le regioni 5' e 3' UTR che non sono codificanti).
Il programma fornirà uno 'warning' se il primo codone non risulta essere 'ATG' = Metionina oppure se l'ultimo codone non risulta essere un codone di STOP.
Verrò dato uno 'warning' anche se la regione codificante non è divisibile per tre. In questo caso la sequenza codificante verrà opportunamente accorciata.
Se non si inserisce la seqeunza completa di un gene, è necessario che la segnalazione dell'inizio della traduzione corrisponda con l'inizio di un codone, altrimenti si ottiene uno errato shift della traduzione.
E' facile ottenere il formato richiesto, utilizzando, ad esempio, UCSC Genome Browser.
Esempio
tagtgaccTCAATGTTCGCAGTCGACA[ATGAGCAGAGTT GATGTACCGCACGGATGTGGGTCGCCACACaaccttatat ccttagcgcagcgcgaaacggcagcgnn........... .......AGATCCGGGTGCCCCACTATCACTGA]ACTGG
highlight
In questa riga vengono inseriti alcuni simboli per mettere in risalto i polimorfismi e/o discordanze tra la sequenza di riferimento e la sequenza del contig (che è l'unione delle singole sequenze dei cromatogrammi).
Simboli adoperati:
'*': Stesso polimorfismo in Reference e contig
'*': Differenti polimorfismo in Reference e contig
'§': polimorfismo solo su sequenza ABI, ma non in Reference
'?' basi di due o più Seq.uenzeABI differenti tra loro
'#' Basi non polimorfiche e differenti tra contog e Reference
highlight in translate
Nelle rige 'Translate Reference' e 'Translate contig' vengono sritti i simboli dei relativi aminoacidi tradotti dai codoni. Questi sono individuati mediante le indicazioni inserite nella sequenza di riferimento (vedi sopra).
Se viene incontrato un codone di stop, viene inserito il simbolo '-':
L'aminoacido viene scritto in rosso se quello tradotto dal contig è differente rispetto a quello rappresentato dal reference.
In presenza di polimorfismi, che determinano codoni che esprimono aminoacidi differenti, viene scritto il simbolo '#'