Ito ang command na mafft-fftnsi na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
mafft - Multiple alignment program para sa amino acid o nucleotide sequence
SINOPSIS
mafft [pagpipilian] input [> output]
Linsi. input [> output]
ginsi input [> output]
einsi input [> output]
fftnsi input [> output]
fftns input [> output]
nwns input [> output]
nwnsi input [> output]
mafft-profile group1 group2 [> output]
input, group1 at group2 dapat nasa FASTA na format.
DESCRIPTION
MAFFT ay isang multiple sequence alignment program para sa unix-like na operating system. Nag-aalok ito
isang hanay ng maramihang paraan ng pag-align.
Nakatuon sa katumpakan paraan:
· L-INS-i (marahil pinakatumpak; inirerekomenda para sa <200 sequence; umuulit na pagpipino
pamamaraan na nagsasama ng lokal na impormasyon ng pairwise alignment):
mafft --localpair --maxiterate 1000 input [> output]
Linsi. input [> output]
· G-INS-i (angkop para sa mga pagkakasunud-sunod ng magkatulad na haba; inirerekomenda para sa <200 mga pagkakasunud-sunod;
iterative refinement method na nagsasama ng pandaigdigang pairwise alignment na impormasyon):
mafft --globalpair --maxiterate 1000 input [> output]
ginsi input [> output]
· E-INS-i (angkop para sa mga pagkakasunud-sunod na naglalaman ng malalaking hindi nakahanay na mga rehiyon; inirerekomenda para sa
<200 sequence):
mafft --ep 0 --genafpair --maxiterate 1000 input [> output]
einsi input [> output]
Para sa E-INS-i, ang --ep 0 ang opsyon ay inirerekomenda upang payagan ang malalaking gaps.
Bilis-oriented paraan:
· FFT-NS-i (paraan ng umuulit na refinement; dalawang cycle lang):
mafft --retree 2 --maxiterate 2 input [> output]
fftnsi input [> output]
· FFT-NS-i (paraan ng umuulit na refinement; max. 1000 na mga pag-ulit):
mafft --retree 2 --maxiterate 1000 input [> output]
· FFT-NS-2 (mabilis; progresibong paraan):
mafft --retree 2 --maxiterate 0 input [> output]
fftns input [> output]
· FFT-NS-1 (napakabilis; inirerekomenda para sa >2000 sequence; progresibong pamamaraan na may magaspang
puno ng gabay):
mafft --retree 1 --maxiterate 0 input [> output]
· NW-NS-i (paraan ng umuulit na refinement nang walang pagtatantya ng FFT; dalawang cycle lang):
mafft --retree 2 --maxiterate 2 --nofft input [> output]
nwnsi input [> output]
· NW-NS-2 (mabilis; progresibong pamamaraan nang walang pagtatantya ng FFT):
mafft --retree 2 --maxiterate 0 --nofft input [> output]
nwns input [> output]
· NW-NS-PartTree-1 (inirerekomenda para sa ~10,000 hanggang ~50,000 sequence; progresibong paraan
gamit ang PartTree algorithm):
mafft --retree 1 --maxiterate 0 --nofft --parttree input [> output]
Pangkat-pangkat mga pagkakahanay
mafft-profile group1 group2 [> output]
o:
mafft --maxiterate 1000 --binhi group1 --binhi group2 /dev/null [> output]
Opsyon
Algorithm
--auto
Awtomatikong pumipili ng naaangkop na diskarte mula sa L-INS-i, FFT-NS-i at FFT-NS-2,
ayon sa laki ng data. Default: naka-off (laging FFT-NS-2)
--6merpair
Ang distansya ay kinakalkula batay sa bilang ng mga nakabahaging 6mer. Default: naka-on
--globalpair
Ang lahat ng pairwise alignment ay kinukuwenta gamit ang Needleman-Wunsch algorithm. Higit pa
tumpak ngunit mas mabagal kaysa --6merpair. Angkop para sa isang set ng globally alignable
mga pagkakasunod-sunod. Naaangkop sa hanggang ~200 sequence. Isang kumbinasyon na may --maxiterate 1000
ay inirerekomenda (G-INS-i). Default: naka-off (6mer na distansya ang ginagamit)
--localpair
Ang lahat ng pairwise alignment ay kinukuwenta gamit ang Smith-Waterman algorithm. Mas sakto
ngunit mas mabagal kaysa --6merpair. Angkop para sa isang hanay ng mga lokal na alignable na pagkakasunud-sunod.
Naaangkop sa hanggang ~200 sequence. Ang kumbinasyon sa --maxiterate 1000 ay
inirerekomenda (L-INS-i). Default: naka-off (6mer na distansya ang ginagamit)
--genafpair
Ang lahat ng pairwise alignment ay kinukuwenta gamit ang isang lokal na algorithm na may pangkalahatan
affine gap cost (Altschul 1998). Mas tumpak ngunit mas mabagal kaysa sa --6merpair. Angkop
kapag inaasahan ang malalaking panloob na puwang. Naaangkop sa hanggang ~200 sequence. A
Ang kumbinasyon sa --maxiterate 1000 ay inirerekomenda (E-INS-i). Default: naka-off (6mer
ginagamit ang distansya)
--fastapair
Ang lahat ng pairwise alignment ay kinukuwenta gamit ang FASTA (Pearson at Lipman 1988). Ang FASTA ay
kailangan. Default: naka-off (6mer na distansya ang ginagamit)
--weighti numero
Weighting factor para sa consistency term na kinakalkula mula sa pairwise alignment. Wasto
kapag ang alinman sa --globalpair, --localpair, --genafpair, --fastapair o --blastpair ay
pinili. Default: 2.7
--retree numero
Ang puno ng gabay ay itinayo numero beses sa progresibong yugto. May bisa sa 6mer na distansya.
Default: 2
--maxiterate numero
numero ang mga siklo ng umuulit na pagpipino ay isinasagawa. Default: 0
--fft
Gumamit ng FFT approximation sa group-to-group alignment. Default: naka-on
--nofft
Huwag gumamit ng FFT approximation sa group-to-group alignment. Default: naka-off
--noscore
Ang marka ng pagkakahanay ay hindi sinusuri sa yugto ng umuulit na pagpipino. Default: naka-off (iskor
ay naka-check)
--memsave
Gamitin ang Myers-Miller (1988) algorithm. Default: awtomatikong naka-on kapag ang
ang haba ng pagkakahanay ay lumampas sa 10,000 (aa/nt).
--parttree
Gumamit ng mabilis na paraan ng pagbuo ng puno (PartTree, Katoh at Toh 2007) na may 6mer na distansya.
Inirerekomenda para sa isang malaking bilang (> ~10,000) ng mga sequence ay input. Default: naka-off
--dpparttree
Ang PartTree algorithm ay ginagamit sa mga distansya batay sa DP. Bahagyang mas tumpak at
mas mabagal kaysa --parttree. Inirerekomenda para sa isang malaking bilang (> ~10,000) ng mga sequence ay
input. Default: naka-off
--fastaparttree
Ang PartTree algorithm ay ginagamit sa mga distansya batay sa FASTA. Medyo mas tumpak
at mas mabagal kaysa --parttree. Inirerekomenda para sa isang malaking bilang (> ~10,000) ng mga sequence
ay input. Kinakailangan ang FASTA. Default: naka-off
--partsize numero
Ang bilang ng mga partisyon sa PartTree algorithm. Default: 50
--grupo numero
Huwag gawing mas malaki ang pagkakahanay kaysa numero mga pagkakasunod-sunod. May bisa lang sa --*parttree
mga pagpipilian. Default: ang bilang ng mga sequence ng input
Parametro
--op numero
Gap opening penalty sa group-to-group alignment. Default: 1.53
--ep numero
Offset na halaga, na gumagana tulad ng parusa sa extension ng gap, para sa pag-align ng grupo-sa-grupo.
Default: 0.123
--lop numero
Gap opening penalty sa lokal na pairwise alignment. Wasto kapag ang --localpair o
--genafpair na opsyon ay pinili. Default: -2.00
--lep numero
Offset na halaga sa lokal na pairwise alignment. Wasto kapag ang --localpair o --genafpair
ang pagpipilian ay pinili. Default: 0.1
--lexp numero
Parusa ng extension ng gap sa lokal na pairwise alignment. Wasto kapag ang --localpair o
--genafpair na opsyon ay pinili. Default: -0.1
--LOP numero
Gap opening penalty para laktawan ang alignment. Wasto kapag ang --genafpair na opsyon ay
pinili. Default: -6.00
--LEXP numero
Gap extension penalty para laktawan ang alignment. Wasto kapag ang --genafpair na opsyon ay
pinili. Default: 0.00
--bl numero
BLOSUM numero matrix (Henikoff at Henikoff 1992) ang ginagamit. numero=30, 45, 62 o 80.
Default: 62
--jtt numero
JTT PAM numero (Jones et al. 1992) ang ginamit na matrix. numero>0. Default: BLOSUM62
--tm numero
Transmembrane PAM numero (Jones et al. 1994) ang ginamit na matrix. numero>0. Default:
BLOSUM62
--aamatrix matrixfile
Gumamit ng AA scoring matrix na tinukoy ng user. Ang format ng matrixfile ay kapareho ng sa
SABOG. Binabalewala kapag ang mga nucleotide sequence ay input. Default: BLOSUM62
--fmodel
Isama ang impormasyon ng komposisyon ng AA/nuc sa scoring matrix. Default: naka-off
Pagbubuhos
--clustalout
Output format: clustal format. Default: naka-off (fasta format)
--inputorder
Output order: katulad ng input. Default: naka-on
--muling ayusin
Output order: nakahanay. Default: naka-off (inputorder)
--treeout
Ang puno ng gabay ay output sa input.tree file. Default: naka-off
--tahimik
Huwag mag-ulat ng pag-unlad. Default: naka-off
input
--nuc
Ipagpalagay na ang mga sequence ay nucleotide. Default: auto
--amino
Ipagpalagay na ang mga sequence ay amino acid. Default: auto
--binhi pagkakahanay1 [--binhi pagkakahanay2 --binhi pagkakahanay3 ...]
Mga pagkakahanay ng binhi na ibinigay sa pagkakahanay_n (fasta format) ay nakahanay sa mga sequence sa
input. Ang pagkakahanay sa loob ng bawat buto ay napanatili.
Gumamit ng mafft-fftnsi online gamit ang mga serbisyo ng onworks.net