Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen fasttreeMP komutudur.
Program:
ADI
fasttreeMP - nükleotit veya protein dizilerinin hizalamalarından filogenetik ağaçlar oluşturun
(openMP versiyonu)
TANIM
fasttreeMP, yaklaşık olarak maksimum olasılıklı filogenetik ağaçların hizalamalarından çıkarır
nükleotid veya protein dizileri. Milyonlarca diziye kadar hizalamaları yönetir
makul bir süre ve bellekte.
fasttreeMP, varsayılan ayarlarla PhyML 3'ten daha doğrudur ve çok daha doğrudur
geleneksel olarak büyük hizalamalar için kullanılan uzaklık matrisi yöntemlerinden farklıdır.
fasttreeMP, Jukes-Cantor veya genelleştirilmiş zamanla tersinir (GTR) nükleotit modellerini kullanır
evrimi ve amino asit evriminin JTT (Jones-Taylor-Thornton 1992) modeli. İle
siteler arasında değişen evrim oranlarını hesaba katarken, fasttreeMP için tek bir oran kullanır
her site ("CAT" yaklaşımı). Her bölmenin güvenilirliğini hızlı bir şekilde tahmin etmek için
ağaç, fasttreeMP, Shimodaira-Hasegawa testi ile yerel destek değerlerini hesaplar
(bunlar PhyML 3'ün "SH benzeri yerel destekleri" ile aynıdır).
SİNOPSİS
hızlı ağaç protein hizalaması > ağaç
hızlı ağaç -Nt nükleotid hizalaması > ağaç
hızlı ağaç -Nt -gtr < nükleotid hizalaması > ağaç
fasttreeMP, fasta veya phylip serpiştirilmiş formatlardaki hizalamaları kabul eder
ortak seçenekleri (zorunlu be önce the hiza dosya):
-sessiz raporlama bilgilerini bastırmak için
-hayır ilerleme göstergesini bastırmak için
log kayıt dosyası -- ara ağaçları, ayarları ve model ayrıntılarını kaydedin
-en hızlı -- komşu birleştirme aşamasını hızlandırın ve bellek kullanımını azaltın
(>50,000 dizi için önerilir)
-n çoklu hizalamayı analiz etmek için (yalnızca phylip formatı)
(seqboot ve CompareToBootstrap.pl ile küresel önyükleme için kullanın)
-destek yok destek değerlerini hesaplamamak
-intree newic_file başlangıç ağaç(lar)ını ayarlamak için
-intree1 tüm hizalamalar için bu başlangıç ağacını kullanmak için newic_file
(büyük hizalamalarda daha hızlı küresel önyükleme için)
-sözde pseudocounts kullanmak için (yüksek boşluklu diziler için önerilir)
-gtr -- genelleştirilmiş zamanla tersinir model (yalnızca nükleotid hizalamaları)
-sallamak -- Whelan-And-Goldman 2001 modeli (yalnızca amino asit hizalamaları)
-alıntı -- boşluklara ve diğer kısıtlı karakterlere izin ver (ancak ' karakterlerine değil)
çıktı ağacındaki sıra adları ve alıntı adları (yalnızca fasta girişi; fasttreeMP
bu ağaçları tekrar okuyamayacak
-noml maksimum olasılığı kapatmak için
-Hayır ben minimum evrimli NNI'leri ve SPR'leri kapatmak için
(ek ML NNI'leri çalıştırıyorsanız önerilir: -intree)
-Hayır ben -mlen ile -intree sabit bir topoloji için dal uzunluklarını optimize etmek
-kedi # sitelerin oran kategorilerinin sayısını belirtmek için (varsayılan 20)
or -nocat sabit oranlar kullanmak
-gama -- ağacı CAT yaklaşımı altında optimize ettikten sonra,
Gamma20 olasılığını optimize etmek için uzunlukları yeniden ölçeklendirin
-kısıtlamalar topoloji aramasını kısıtlamak için constraintAlignment
constraintAlignment, bölmeleri belirtmek için 1'ler veya 0'lar içermelidir
-uzman -- daha fazla seçenek görün
Ayrıntılı kullanım için hızlı ağaç 2.1.4 SSE3:
fasttreeMP [-nt] [-n 100] [-alıntı] [-sözde | -sözde 1.0]
[-önyükleme 1000 | -destek yok] [-intree başlangıç_ağaçları_dosyası | -intree1
start_tree_file] [-sessiz | -hayır] [-nni 10] [-spr 2] [-noml | -mlen | -mnni
10] [-mlacc 2] [-cat 20 | -hayır] [-gama] [-yavaş | -en hızlı] [-2. | -hayır2.]
[-slownni] [-seed 1253] [-üst | -notop] [-topm 1.0 [-kapat 0.75] [-yenile 0.8]]
[-matris Matrisi | -nomatriks] [-nj | -bionj] [-wag] [-nt] [-gtr] [-gtrrate ac ag at
cg ct gt] [-gtrfreq ACGT] [ -kısıtlamalar kısıtlama Hizalama [ -kısıtlamaAğırlığı
100.0 ] ] [-log günlük dosyası]
[ hizalama_dosyası ]
> newick_tree
or
fasttreeMP [-nt] [-matris Matrisi | -nomatriks] [-hamdist] -makematriks [hizalama]
[-n 100] > phylip_distance_matrix
fasttreeMP, fasta veya phylip serpiştirilmiş hizalamaları destekler Varsayılan olarak fasttreeMP
protein hizalamaları bekler, kullanın -Nt nükleotidler için fasttreeMP standart okur
hizalama dosyası verilmezse girin
Giriş / çıkış seçenekleri:
-n -- içinde birden fazla hizalamada okuyun. Yalnızca bu
phylip serpiştirilmiş formatla çalışır. Örneğin, çıktı ile kullanabilirsiniz.
phylip'in seqboot'undan. Eğer kullanırsan -n, fasttreeMP, satır başına 1 ağaç yazacak
standart çıktı.
-intree newicfile -- newicfile'den başlangıç ağacını okuyun.
Başlangıç ağaçlarındaki dal uzunlukları yok sayılır.
-intree ile -n her hizalama için ayrı bir başlangıç ağacı okuyacaktır.
-intree1 newicfile -- her hizalama için aynı başlangıç ağacını okuyun
-sessiz -- normal çalışma sırasında standart hataya yazmayın (ilerleme yok
gösterge, seçenek özeti yok, olabilirlik değeri yok vb.)
-hayır -- ilerleme göstergesini stderr'e yazmayın
log kayıt dosyası -- ayıklayabilmeniz için ara ağaçları kaydedin
ağaçlar ve çökerlerse uzun süredir devam eden işleri yeniden başlatın log ayrıca rapor eder
site başına oranlar (1 en yavaş kategori anlamına gelir)
-alıntı -- çıktıda sıra adlarını alıntılayın ve boşluklara, virgüllere izin verin,
parantezler ve içlerinde iki nokta üst üste, ancak ' karakterleri değil (yalnızca fasta dosyaları)
Mesafeler:
Varsayılan: Protein dizileri, log düzeltmeli mesafeler ve bir
BLOSUM45'ten türetilen amino asit farklılık matrisi
veya nükleotid dizileri için, Jukes-Cantor mesafeleri Farklı bir matris belirtmek için,
kullanım -matris DosyaÖn eki veya -nomatriks kullanım -hamdist günlük düzeltmeyi kapatmak için veya
Jukes-Cantor yerine %farklı kullanmak
-sözde [ağırlık] -- arasındaki mesafeleri tahmin etmek için sözde sayıları kullanın.
çok az örtüşen veya hiç örtüşmeyen diziler. (Varsayılan olarak kapalı.) Analiz ediliyorsa önerilir.
hizalama, çok az örtüşen veya hiç örtüşmeyen dizilere sahiptir. Ağırlık belirtilmemişse,
1.0
Topoloji arıtma:
Varsayılan olarak, fasttreeMP, ağacı 4*log2(N) tura kadar iyileştirmeye çalışır.
minimum evrim en yakın komşu değiş tokuşları (NNI), burada N sayısıdır
benzersiz diziler, 2 tur alt ağaç-budak-yeniden aşılama (SPR) hareketleri (ayrıca minimum evo.),
ve maksimum olasılıklı NNI'lerin 2*log(N) turuna kadar. Kullanmak -nni numarayı ayarlamak için
min. evo. NNI'ler ve -bahar SPR'lerin turlarını ayarlamak için. Kullanmak -noml çevirmek
hem min-evo NNI'leri hem de SPR'leri kapatın (iyileştirme için kullanışlıdır)
daha fazla NNI ile yaklaşık olarak maksimum olasılık ağacı)
kullanım -yay uzunluğu bir SPR hareketinin maksimum uzunluğunu ayarlayın (varsayılan 10) -mnni ayarlamak için
maksimum olasılıklı NNI Kullanım turlarının sayısı -mlacc 2 veya -mlacc 3 her zaman
her NNI'de 5 şubenin tümünü optimize edin,
ve 5 veya 2 turda 3 dalı optimize etmek
kullanım -mlen dal uzunluklarını ML NNI'ler olmadan optimize etmek için -mlen -Hayır ben ile -intree
sabit bir topolojide dal uzunluklarını optimize etmek için -slowni buluşsal yöntemleri kapatmak için
sabit alt ağaçlardan kaçınmak için (her ikisini de etkiler
ML ve ME NNI'leri)
Maksimum olasılık model seçenekleri:
-sallamak -- Jones-Taylor-Thorton 2001 modeli (varsayılan) yerine Whelan-And-Goldman 1992 modeli
(yalnızca aa)
-gtr -- (varsayılan) Jukes-Cantor (yalnızca nt) yerine genelleştirilmiş zaman tersinir
-kedi # -- sitelerin oran kategorilerinin sayısını belirtin (varsayılan 20)
-nocat -- CAT modeli yok (sadece 1 kategori)
-gama -- CAT modeli ile dal uzunluklarını optimize etmenin son turundan sonra,
ayrık gama modeli altında olasılığı aynı sayıda raporla
kategoriler. fasttreeMP aynı dal uzunluklarını kullanır ancak gama şeklini optimize eder
parametre ve uzunlukların ölçeği. Son ağaç yeniden ölçeklenmiş uzunluklara sahip olacaktır.
İle kullanılan log, bu ayrıca CONSEL ile kullanım için site başına olasılıklar oluşturur, bkz.
GammaLogToPaup.pl ve fasttreeMP web sitesindeki belgeler.
Destek değer seçenekleri:
Varsayılan olarak fasttreeMP, siteyi yeniden örnekleyerek yerel destek değerlerini hesaplar.
1,000 kez olasılık ve Shimodaira Hasegawa testi. belirtirseniz -Hayır benBu
bunun yerine minimum evrim önyükleme desteklerini hesaplayacaktır.
destek değerleri 0 ile 1 arasında değişen oranlardır
kullanım -destek yok destek değerlerini kapatmak veya -çizme Yalnızca 100 yeniden örnek kullanmak için 100
kullanım -tohum rastgele sayı üretecini başlatmak için
Arama için the en iyi katılmak:
Varsayılan olarak, fasttreeMP hızlı komşu birleştirmenin 'görünür kümesini' aşağıdakilerle birleştirir:
rahat komşu katılımında olduğu gibi yerel tepe tırmanışı
-yavaş -- kapsamlı arama (NJ veya BIONJ gibi, ancak farklı boşluk işleme)
-yavaş 8 protein için 1,250 saniye yerine yarım saat sürer
-en hızlı -- yalnızca görünür kümede arama yapın (her düğüm için en yüksek isabet)
Orijinal hızlı komşu birleştirmenin aksine, -en hızlı güncellemeler görünür(C) sonra
Join(AB,C)'den daha iyi ise, A ve B'ye katılmak, join(C,visible(C))'den daha iyidir -en hızlı Ayrıca
mesafeleri çok tembel bir şekilde günceller, -en hızlı setleri -2. üzerinde de kullanın
-en hızlı -hayır2. bundan kaçınmak için
En beğenilen Sezgisel:
Varsayılan olarak fasttreeMP, aramayı hızlandırmak için en çok tıklananlar listesini kullanır. -notop (Ya da -yavaş)
bu özelliği kapatmak için
ve tüm yaprakları birbiriyle ve tüm yeni birleştirilmiş düğümleri birbiriyle karşılaştırın
-topm 1.0 -- en çok tıklanan liste boyutunu parametre*sqrt(N) olarak ayarlayın
fasttreeMP, bir 'kapanış'ın 2*m'lik ilk vuruşlarından bir yaprağın en yüksek m vuruşunu tahmin eder
komşu, burada yakın d(tohum,kapat) olarak tanımlanır < 0.75 * d(tohum, sıralama isabeti
2*m) ve katılımlar ilerledikçe en çok izlenenleri günceller
-kapat 0.75 -- yakın buluşsal yöntemi değiştirin, daha düşük daha muhafazakardır
-refresh 0.8 -- birleştirilmiş bir düğümü diğer tüm düğümlerle karşılaştırın
en çok isabet alan liste, istenen uzunluğun %80'inden azsa veya en çok isabet alan kişinin yaşı
liste log2(m) veya daha büyük
-2. or -hayır2. 2. seviye en yüksek isabet buluşsal yöntemlerini açmak veya kapatmak için
Bu, bellek kullanımını ve çalışma süresini azaltır ancak bellekte marjinal azalmalara neden olabilir.
ağaç kalitesi. (Varsayılan olarak, -en hızlı açılır -2..)
Kaydol seçenekleri:
-nj: normal (ağırlıksız) komşu birleştirme (varsayılan)
-bionj: BIONJ'deki gibi ağırlıklı birleşimler
fasttreeMP ayrıca NNI'ler sırasında birleştirmelere ağırlık verecek
kısıtlı topoloji arama seçenekleri:
-kısıtlamalar hizalama dosyası -- 0, 1 ve - değerleriyle bir hizalama
Tüm dizilerin mevcut olması gerekmez. 0'lar ve 1'lerden oluşan bir sütun, kısıtlı bir
bölmek. Bazı kısıtlamalar ihlal edilmiş olabilir (bkz.
hata).
-kısıtlamaAğırlığı -- kısıtlamaların ne kadar güçlü bir şekilde ağırlıklandırılacağı. 1 değeri
bir kısıtlamayı ihlal etmek için ağaç uzunluğunda 1 ceza anlamına gelir Varsayılan: 100.0
Daha fazla bilgi için bkz: http://www.microbesonline.org/fasttree/
veya kaynak koddaki yorumlar
fasttreeMP protein_alignment > ağaç fasttreeMP -Nt nükleotid hizalaması > ağaç
hızlı ağaç -Nt -gtr < nükleotid hizalaması > ağaç
fasttreeMP, fasta veya phylip serpiştirilmiş formatlardaki hizalamaları kabul eder
ortak seçenekleri (zorunlu be önce the hiza dosya):
-sessiz raporlama bilgilerini bastırmak için
-hayır ilerleme göstergesini bastırmak için
log kayıt dosyası -- ara ağaçları, ayarları ve model ayrıntılarını kaydedin
-en hızlı -- komşu birleştirme aşamasını hızlandırın ve bellek kullanımını azaltın
(>50,000 dizi için önerilir)
-n çoklu hizalamayı analiz etmek için (yalnızca phylip formatı)
(seqboot ve CompareToBootstrap.pl ile küresel önyükleme için kullanın)
-destek yok destek değerlerini hesaplamamak
-intree newic_file başlangıç ağaç(lar)ını ayarlamak için
-intree1 tüm hizalamalar için bu başlangıç ağacını kullanmak için newic_file
(büyük hizalamalarda daha hızlı küresel önyükleme için)
-sözde pseudocounts kullanmak için (yüksek boşluklu diziler için önerilir)
-gtr -- genelleştirilmiş zamanla tersinir model (yalnızca nükleotid hizalamaları)
-sallamak -- Whelan-And-Goldman 2001 modeli (yalnızca amino asit hizalamaları)
-alıntı -- boşluklara ve diğer kısıtlı karakterlere izin ver (ancak ' karakterlerine değil)
çıktı ağacındaki sıra adları ve alıntı adları (yalnızca fasta girişi; fasttreeMP
bu ağaçları tekrar okuyamayacak
-noml maksimum olasılığı kapatmak için
-Hayır ben minimum evrimli NNI'leri ve SPR'leri kapatmak için
(ek ML NNI'leri çalıştırıyorsanız önerilir: -intree)
-Hayır ben -mlen ile -intree sabit bir topoloji için dal uzunluklarını optimize etmek
-kedi # sitelerin oran kategorilerinin sayısını belirtmek için (varsayılan 20)
or -nocat sabit oranlar kullanmak
-gama -- ağacı CAT yaklaşımı altında optimize ettikten sonra,
Gamma20 olasılığını optimize etmek için uzunlukları yeniden ölçeklendirin
-kısıtlamalar topoloji aramasını kısıtlamak için constraintAlignment
constraintAlignment, bölmeleri belirtmek için 1'ler veya 0'lar içermelidir
-uzman -- daha fazla seçenek görün
Daha fazla bilgi için bkz: http://www.microbesonline.org/fasttree/
onworks.net hizmetlerini kullanarak fasttreeMP'yi çevrimiçi kullanın