Questo è il comando ginsi che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici workstation online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
mafft - Programma di allineamento multiplo per sequenze di aminoacidi o nucleotidi
SINOSSI
maff [Opzioni] ingresso [> produzione]
Linsi ingresso [> produzione]
ginsi ingresso [> produzione]
einsi ingresso [> produzione]
fftnsi ingresso [> produzione]
fftns ingresso [> produzione]
nwns ingresso [> produzione]
nwsi ingresso [> produzione]
profilo-mafft group1 group2 [> produzione]
ingresso, group1 ed group2 deve essere in formato FASTA.
DESCRIZIONE
MAFFT è un programma di allineamento di sequenze multiple per sistemi operativi di tipo Unix. Offre
una gamma di metodi di allineamento multipli.
Orientato alla precisione metodi:
· L-INS-i (probabilmente il più accurato; consigliato per <200 sequenze; raffinamento iterativo
metodo che incorpora informazioni di allineamento a coppie locali):
maff --coppia locale --maxiterato 1000 ingresso [> produzione]
Linsi ingresso [> produzione]
· G-INS-i (adatto per sequenze di lunghezza simile; consigliato per <200 sequenze;
metodo di raffinamento iterativo che incorpora informazioni di allineamento a coppie globali):
maff --coppia globale --maxiterato 1000 ingresso [> produzione]
ginsi ingresso [> produzione]
· E-INS-i (adatto per sequenze contenenti grandi regioni non allineabili; consigliato per
<200 sequenze):
maff --ep 0 --genaffiar --maxiterato 1000 ingresso [> produzione]
einsi ingresso [> produzione]
Per E-INS-i, il --ep 0 l'opzione è consigliata per consentire grandi spazi vuoti.
Orientato alla velocità metodi:
· FFT-NS-i (metodo di raffinamento iterativo; solo due cicli):
maff --rialbero 2 --maxiterato 2 ingresso [> produzione]
fftnsi ingresso [> produzione]
· FFT-NS-i (metodo di raffinamento iterativo; max. 1000 iterazioni):
maff --rialbero 2 --maxiterato 1000 ingresso [> produzione]
· FFT-NS-2 (veloce; metodo progressivo):
maff --rialbero 2 --maxiterato 0 ingresso [> produzione]
fftns ingresso [> produzione]
· FFT-NS-1 (molto veloce; consigliato per >2000 sequenze; metodo progressivo con un rough
albero guida):
maff --rialbero 1 --maxiterato 0 ingresso [> produzione]
· NW-NS-i (metodo di raffinamento iterativo senza approssimazione FFT; solo due cicli):
maff --rialbero 2 --maxiterato 2 --noff ingresso [> produzione]
nwsi ingresso [> produzione]
· NW-NS-2 (veloce; metodo progressivo senza l'approssimazione FFT):
maff --rialbero 2 --maxiterato 0 --noff ingresso [> produzione]
nwns ingresso [> produzione]
· NW-NS-PartTree-1 (consigliato per ~ 10,000 a ~ 50,000 sequenze; metodo progressivo
con l'algoritmo PartTree):
maff --rialbero 1 --maxiterato 0 --noff --parttree ingresso [> produzione]
Da gruppo a gruppo allineamenti
profilo-mafft group1 group2 [> produzione]
o:
maff --maxiterato 1000 --seme group1 --seme group2 /dev/null [> produzione]
VERSIONI
Algoritmo
--auto
Seleziona automaticamente una strategia appropriata da L-INS-i, FFT-NS-i e FFT-NS-2,
in base alla dimensione dei dati. Predefinito: spento (sempre FFT-NS-2)
--6merpair
La distanza è calcolata in base al numero di 6mer condivisi. Predefinito: attivo
--coppia globale
Tutti gli allineamenti a coppie sono calcolati con l'algoritmo di Needleman-Wunsch. Di più
accurato ma più lento di --6merpair. Adatto per un set di allineabili a livello globale
sequenze. Applicabile fino a ~200 sequenze. Una combinazione con --maxiterate 1000
è consigliato (G-INS-i). Predefinito: off (viene utilizzata la distanza 6mer)
--coppia locale
Tutti gli allineamenti a coppie sono calcolati con l'algoritmo di Smith-Waterman. Più accurato
ma più lento di --6merpair. Adatto per una serie di sequenze allineabili localmente.
Applicabile fino a ~200 sequenze. Una combinazione con --maxiterate 1000 è
consigliato (L-INS-i). Predefinito: off (viene utilizzata la distanza 6mer)
--genaffiar
Tutti gli allineamenti a coppie sono calcolati con un algoritmo locale con generalizzato
costo del gap affine (Altschul 1998). Più preciso ma più lento di --6merpair. Adatto
quando si prevedono grandi lacune interne. Applicabile fino a ~200 sequenze. UN
si consiglia la combinazione con --maxiterate 1000 (E-INS-i). Predefinito: spento (6mer
si usa la distanza)
--fastpair
Tutti gli allineamenti a coppie sono calcolati con FASTA (Pearson e Lipman 1988). FASTA è
necessario. Predefinito: off (viene utilizzata la distanza 6mer)
--peso numero
Fattore di ponderazione per il termine di consistenza calcolato da allineamenti a coppie. Valido
quando uno di --globalpair, --localpair, --genafpair, --fastapair o --blastpair è
selezionato. Predefinito: 2.7
--rialbero numero
L'albero guida è costruito numero volte nella fase progressiva. Valido con distanza di 6 metri.
Predefinito: 2
--maxiterato numero
numero vengono eseguiti cicli di raffinamento iterativo. Predefinito: 0
--fft
Utilizzare l'approssimazione FFT nell'allineamento da gruppo a gruppo. Predefinito: attivo
--noff
Non utilizzare l'approssimazione FFT nell'allineamento da gruppo a gruppo. Predefinito: spento
--nessun punteggio
Il punteggio di allineamento non viene verificato nella fase di perfezionamento iterativo. Predefinito: disattivato (punteggio
è spuntato)
--memsave
Utilizzare l'algoritmo di Myers-Miller (1988). Predefinito: attivato automaticamente quando il
la lunghezza dell'allineamento supera i 10,000 (aa/nt).
--parttree
Usa un metodo di costruzione veloce degli alberi (PartTree, Katoh e Toh 2007) con la distanza di 6 mer.
Consigliato per l'immissione di un numero elevato (> ~ 10,000) di sequenze. Predefinito: spento
--dpparttree
L'algoritmo PartTree viene utilizzato con distanze basate su DP. Leggermente più preciso e
più lento di --parttree. Consigliato per un numero elevato (> ~ 10,000) di sequenze sono
ingresso. Predefinito: spento
--fastaparttree
L'algoritmo PartTree viene utilizzato con distanze basate su FASTA. Leggermente più preciso
e più lento di --parttree. Consigliato per un numero elevato (> ~ 10,000) di sequenze
sono immessi. FASTA è richiesto. Predefinito: spento
--dimensione numero
Il numero di partizioni nell'algoritmo PartTree. Predefinito: 50
--dimensione del gruppo numero
Non aumentare l'allineamento di numero sequenze. Valido solo con il --*parttree
opzioni. Predefinito: il numero di sequenze di input
Parametro
--operazione numero
Penalità di apertura del gap all'allineamento da gruppo a gruppo. Predefinito: 1.53
--ep numero
Valore di offset, che funziona come la penalità per l'estensione del gap, per l'allineamento da gruppo a gruppo.
Predefinito: 0.123
--lop numero
Penalità di apertura del gap all'allineamento a coppie locale. Valido quando --localpair o
L'opzione --genafpair è selezionata. Predefinito: -2.00
--lep numero
Valore di offset all'allineamento locale delle coppie. Valido quando --localpair o --genafpair
l'opzione è selezionata. Predefinito: 0.1
--lex numero
Penalità all'estensione del gap all'allineamento a coppie locale. Valido quando --localpair o
L'opzione --genafpair è selezionata. Predefinito: -0.1
--LOPP numero
Penalità all'apertura del gap per saltare l'allineamento. Valido quando l'opzione --genafpair è
selezionato. Predefinito: -6.00
--LEXP numero
Penalità all'estensione del gap per saltare l'allineamento. Valido quando l'opzione --genafpair è
selezionato. Predefinito: 0.00
--bl numero
BLOSUM numero matrice (Henikoff e Henikoff 1992). numero=30, 45, 62 o 80.
Predefinito: 62
--jtt numero
JTT PAM numero (Jones et al. 1992) viene utilizzata la matrice. numero>0. Predefinito: BLOSUM62
--tm numero
Transmembrana PAM numero (Jones et al. 1994) viene utilizzata la matrice. numero>0. Predefinito:
BLOSUM62
--amatrix matricefile
Utilizzare una matrice di punteggio AA definita dall'utente. Il formato di matricefile è uguale a quello di
RAFFICA. Ignorato quando vengono immesse sequenze nucleotidiche. Predefinito: BLOSUM62
--fmodello
Incorporare le informazioni sulla composizione AA/nuc nella matrice di punteggio. Predefinito: spento
Uscita
--clustalout
Formato di output: formato cluster. Predefinito: spento (formato veloce)
--ordine di input
Ordine di uscita: lo stesso dell'input. Predefinito: attivo
--riordina
Ordine di uscita: allineato. Predefinito: spento (ordine di immissione)
--treeout
L'albero della guida viene emesso su ingressofile .albero. Predefinito: spento
--silenzioso
Non segnalare i progressi. Predefinito: spento
Ingresso
--nuc
Supponiamo che le sequenze siano nucleotidi. Predefinito: auto
--ammino
Supponiamo che le sequenze siano aminoacidi. Predefinito: auto
--seme allineamento1 [--seme allineamento2 --seme allineamento3 ...]
Allineamenti dei semi dati in allineamento_n (formato veloce) sono allineati con le sequenze in
ingresso. L'allineamento all'interno di ogni seme è preservato.
Usa ginsi online utilizzando i servizi onworks.net