İngilizceFransızcaİspanyolca

Ad


OnWorks favicon'u

maq - Bulutta Çevrimiçi

Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden OnWorks ücretsiz barındırma sağlayıcısında maq çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen komut maq'tır.

Program:

ADI


Maq - Niteliklerle Haritalama ve Montaj

SİNOPSİS


mak komuta [seçenekleri] argümanlar

maq.pl komuta [seçenekleri] argümanlar

TANIM


Maq, bir sonraki tarafından oluşturulan kısa okumalardan haritalama düzenekleri oluşturan bir yazılımdır.
nesil sıralama makineleri. Özellikle Illumina-Solexa 1G Genetic için tasarlanmıştır.
Çözümleyici ve AB SOLiD verilerini işlemek için bir ön işlevselliğe sahiptir.

Maq ile şunları yapabilirsiniz:

· Illumina/SOLiD okumalarını referans genoma hızlı hizalama. Varsayılan seçeneklerle, bir
milyon çift okuma, daha az işlemle yaklaşık 10 CPU saatinde insan genomuna eşlenebilir.
1G bellekten daha fazla.

· Her bir okumanın hizalanmasının hata olasılığını doğru bir şekilde ölçün.

· Homozigot ve heterozigot polimorfizmler dahil olmak üzere konsensüs genotiplerini şu şekilde çağırın:
her bir tabana atanan bir Phred olasılık kalitesi.

· Eşleştirilmiş son okumalara sahip kısa indeller bulun.

· Büyük ölçekli genomik delesyonları ve translokasyonları eşleştirilmiş uç okumalarla doğru bir şekilde bulun.

· Okuma derinliğini kontrol ederek potansiyel CNV'leri keşfedin.

· Sıralayıcılardan gelen ham baz niteliklerinin doğruluğunu değerlendirin ve
sistematik hatalar

Ancak Maq, DEĞİL:

· Yapmak de yeni toplantı. (Maq, yalnızca okumaları bilinen bir
referans.)

· Harita şortları kendilerine karşı okur. (Maq, yalnızca okumalar arasında tam örtüşme bulabilir.)

· Kılcal okumaları veya 454 okumalarını referansa hizalayın. (Maq, okumaları şundan daha uzun hizalayamaz:
63 bp.)

MAQ KOMUTLAR


anahtar Komutları

fasta2bfa mak fasta2bfa in.ref.fasta çıkış.ref.bfa

FASTA formatındaki dizileri Maq'ın BFA (ikili FASTA) formatına dönüştürün.

hızlıq2bfq mak hızlıq2bfq [-n okumalar] in.read.fastq out.read.bfqout.prefix

FASTQ formatındaki okumaları Maq'ın BFQ (ikili FASTQ) formatına dönüştürün.

SEÇENEKLER:

-n INT dosya başına okuma sayısı [belirtilmemiş]

harita mak harita [-n nmis] [-a maxinler] [-c] [-1 len1] [-2 len2] [-d adapt3] [-m mutasyona uğramış]
[-u bağlanılmayan] [-e maksimum] [-M c⎪g] [-N] [-H her şey] [-C maxhit'ler] out.aln.harita
in.ref.bfa in.read1.bfq [in.read2.bfq] 2> dışarı.harita.log

Harita referans dizilerini okur.

SEÇENEKLER:

-n INT Her zaman bulunabilecek maksimum uyumsuzluk sayısı [2]

-a INT Doğru bir okuma çifti için maksimum dış mesafe [250]

-A INT İki RF ücretli okumanın maksimum dış mesafesi (devre dışı bırakmak için 0) [0]

-c Harita renk alanında okur (yalnızca SOLiD için)

-1 INT İlk okuma için okuma uzunluğu, otomatik [0] için 0

-2 INT İkinci okuma için okuma uzunluğu, otomatik [0] için 0

-m FLOAT Referans dizileri ve okumalar arasındaki mutasyon oranı [0.001]

-d DOSYA 3'-adaptör dizisinin tek bir satırını içeren bir dosya belirtin
[boş]

-u DOSYA Eşlenmemiş okumaları ve birden fazlasını içeren okumaları boşaltın nmis uyumsuzluklar
ayrı bir dosya [null]

-e INT Uyumsuz temel niteliklerin toplamı üzerindeki eşik [70]

-H DOSYA Birden çok/tüm 01-uyumsuzluk isabetini şuraya aktar: DOSYA [boş]

-C INT Çıktı için maksimum isabet sayısı. 512'den büyükse sınırsız. [250]

-M c⎪g metilasyon hizalama modu. Ön dizideki tüm C (veya G)
T (veya A) olarak değiştirildi. Bu seçenek yalnızca test içindir.

-N uyumsuzluk konumunu çıktı dosyasında sakla out.aln.harita. Bu ne zaman
seçenek kullanımdaysa, izin verilen maksimum okuma uzunluğu 55bp'dir.

NOT:

* Eşleştirilmiş son okumalar, her bir uç için bir tane olmak üzere iki dosyada hazırlanmalıdır.
okumalar aynı sırada sıralanır. Bu, ilk okumada k-th okunduğu anlamına gelir
dosya, ikinci dosyada okunan k-th ile eşleştirilir. karşılık gelen okuma
isimler, '/1' veya '/2' sonuna kadar aynı olmalıdır. Örneğin, böyle bir
bir çift okuma adına izin verilir: `EAS1_1_5_100_200/1' ve
"EAS1_1_5_100_200/2". Kuyruk `/[12]' genellikle tarafından oluşturulur
GAPipeline bir çiftte iki ucu ayırt etmek için.

* Çıktı sıkıştırılmış bir ikili dosyadır. Endianiteden etkilenir.

* Bu komutu çalıştırmanın en iyi yolu, yaklaşık 1 ila 3 milyon okuma sağlamaktır.
giriş. Daha fazla okuma daha fazla bellek tüketir.

* Seçenek -n hizalamanın hassasiyetini kontrol eder. Varsayılan olarak, bir isabet
en fazla 2 uyumsuzluk her zaman bulunabilir. Daha yüksek -n daha fazla isabet bulur ve ayrıca
haritalama niteliklerinin doğruluğunu artırır. Ancak, bu maliyetle yapılır
hız.

* Birçok yüksek kaliteli uyumsuzluğa sahip hizalamalar yanlış olarak atılmalıdır
hizalamalar veya olası kontaminasyonlar. Bu davranış seçenek tarafından kontrol edilir
-e. -e eşik yalnızca yaklaşık olarak hesaplanır çünkü temel nitelikler
hizalamanın belirli bir aşamasında 10'a bölünür. NS -Q seçeneği
birleştirmek komutu, eşiği tam olarak ayarlayın.

* Bir çift okumanın, ancak ve ancak aşağıdaki durumlarda doğru şekilde eşleştirildiği söylenir.
oryantasyon FR ve çiftin dış mesafesi daha büyük değil
maxinler. Minimum kesici uç boyutunda herhangi bir sınırlama yoktur. Bu ayar
Maq'da kullanılan eşleştirilmiş uç hizalama algoritması tarafından belirlenir. gerektiren
minimum uç boyutu, yüksek oranda bazı yanlış hizalamalara yol açacaktır.
abartılmış haritalama nitelikleri.

* Şu anda, Illumina/Solexa uzun ekleme kitaplığından okuma çiftleri RF okuma özelliğine sahiptir
oryantasyon. Maksimum kesici uç boyutu seçeneğe göre belirlenir -A. Ancak uzun-
ekleme kitaplığı ayrıca küçük bir kısa ekleme okuma bölümü ile karıştırılır
çiftleri. -a ayrıca doğru ayarlanmalıdır.

* Bazen 5'-uç veya hatta tüm 3'-adaptör dizisi sıralanabilir.
Sağlama -d adaptör kontaminasyonlarını ortadan kaldırmak için Maq'ı işler.

* Girdi olarak 2 milyon okuma verildiğinde, mak genellikle 800MB bellek alır.

harita birleştirme mak harita birleştirme out.aln.harita in.aln1.map in.aln2.map [...]

Toplu okuma hizalamalarını bir araya getirin.

NOT:

* Teoride, bu komut sınırsız sayıda hizalamayı birleştirebilir. Ancak,
mapmerge tüm girdileri aynı anda okuyacak,
işletim sistemi tarafından belirlenen maksimum açılış dosyası sayısı sınırı. Şu anda, bu
son kullanıcılar tarafından manuel olarak çözülmelidir.

* Emretmek harita birleştirme farklı okuma ile hizalama dosyalarını birleştirmek için kullanılabilir
uzunluklar. Sonraki tüm analizler artık sabit uzunluk varsaymıyor.

rmdup mak rmdup out.rmdup.harita in.ori.harita

Aynı dış koordinatlara sahip çiftleri kaldırın. Prensip olarak, ile çiftler
özdeş dış koordinatlar nadiren gerçekleşmelidir. Ancak, nedeniyle
örnek hazırlamada amplifikasyon, bu, aşağıdakilerden çok daha sık meydana gelir.
şans. Pratik analizler, kopyaların kaldırılmasının iyileştirmeye yardımcı olduğunu göstermektedir.
SNP çağrısının genel doğruluğu.

birleştirmek mak birleştirmek [-sp] [-m maksimumlar] [-Q maksimum] [-r ısıtmak] [-t orta] [-q minQ] [-N
nHap] dışarı.cns in.ref.bfa in.aln.harita 2> çıkış.cns.log

Okuma eşlemesinden fikir birliği dizilerini arayın.

SEÇENEKLER:

-t FLOAT Hata bağımlılık katsayısı [0.93]

-r FLOAT Tüm siteler arasında heterozigot oranı [0.001]

-s Tek uçlu eşleme kalitesini nihai eşleme kalitesi olarak alın;
aksi takdirde eşleştirilmiş uç eşleme kalitesi kullanılacaktır

-p Doğru çiftlerde eşlenmemiş eşleştirilmiş son okumaları atın

-m INT Bir okumanın şurada kullanılmasına izin verilen maksimum uyumsuzluk sayısı
fikir birliği çağrısı [7]

-Q INT Uyumsuz bazların izin verilen maksimum kalite değerleri toplamı [60]

-q INT Bir okumanın fikir birliği içinde kullanılmasına izin verilen minimum eşleme kalitesi
[0] aranıyor

-N INT Havuzdaki haplotip sayısı (>=2) [2]

NOT:

* Seçenek -Q uyumsuz temel niteliklerin maksimum toplamına bir sınır koyar.
Birçok yüksek kaliteli uyumsuzluk içeren okumalar atılmalıdır.

* Seçenek -N bir havuzdaki haplotiplerin sayısını ayarlar. için tasarlanmıştır
birden fazla suşu/kişiyi bir araya toplayarak örneklerin yeniden sıralanması. İçin
diploid genom yeniden dizileme, bu seçenek 2'ye eşittir.

glfgen mak glfgen [-sp] [-m maksimumlar] [-Q maksimum] [-r ısıtmak] [-t orta] [-q minQ] [-N
nHap] dışarı.cns in.ref.bfa in.aln.harita 2> çıkış.cns.log

Tüm genotipler için log olasılığını hesaplayın ve sonuçları GLF formatında saklayın
(Genotipleme Olabilirlik Formatı). Ayrıntılı bilgi için lütfen MAQ web sitesini kontrol edin
dosya formatı ve ilgili yardımcı programların açıklamaları.

indelpe mak indelpe in.ref.bfa in.aln.harita > dışarı.indelpe

Eşleştirilmiş son okumalardan tutarlı indelleri çağırın. Çıktı, TAB ile sınırlandırılmıştır.
kromozomdan oluşan her satır, başlangıç ​​konumu, indel tipi, sayı
indel boyunca okuma sayısı, indel boyutu ve eklenen/silinmiş nükleotidler
(iki nokta üst üste ile ayrılmış), ters iplikteki indel sayısı, indel sayısı
ileri iplikte, 5' dizilimin önünde, 3' dizilimin ardından
indel, indel olmadan hizalanmış okuma sayısı ve üç ek sütun
filtreler için.

3. sütunda, indel tipi, bir yıldız indel'in onaylandığını gösterir.
her iki diziden de okunan bir artı, indel'in en az iki okumayla çarpıldığı anlamına gelir
ama aynı iplikten, bir eksi, indel'in yalnızca bir okumada bulunduğunu gösterir,
ve bir nokta, indel'in başka bir indel'e çok yakın olduğu ve filtrelendiği anlamına gelir.

Kullanıcıların sayısını düzeltmek için maq.pl indelpe'den geçmeleri önerilir.
indels olmadan eşlenen okur. Daha fazla ayrıntı için bkz. maq.pl indelpe
Bölüm.

indelsoa mak indelsoa in.ref.bfa in.aln.harita > dışarı.indelsoa

Anormalliği tespit ederek potansiyel homozigot indelleri ve kırılma noktalarını çağırın.
indeller ve kırılma noktaları etrafında hizalama deseni. Çıktı da TAB
kromozomdan oluşan her satırla sınırlandırılmış, yaklaşık koordinat,
anormal bölgenin uzunluğu, pozisyon boyunca eşlenen okuma sayısı,
pozisyonun sol tarafındaki okuma sayısı ve üzerinde okuma sayısı
sağ taraf. Son sütun göz ardı edilebilir.

Çıktı birçok yanlış pozitif içeriyor. Önerilen bir filtre şunlar olabilir:

awk '$5+$6-$4 >= 3 && $4 <= 1' in.indelsoa

Bu komutun doğru bir indel dedektörü olmayı amaçlamadığını unutmayın, ancak
esas olarak ikame aramasında bazı yanlış pozitiflerden kaçınmaya yardımcı olur. İçinde
ek olarak, yalnızca verilen derin derinlikte iyi çalışır (örneğin ~40X); aksi halde
yanlış negatif oranı çok yüksek olacaktır.

oluşturulan dönüştürme

sol2sanger mak sol2sanger in.sol.fastq out.sanger.fastq

Solexa FASTQ'yu standart/Sanger FASTQ formatına dönüştürün.

bfq2fastq mak bfq2fastq in.read.bfq out.read.fastq

Maq'ın BFQ formatını standart FASTQ formatına dönüştürün.

mappass2maq mak mappass2maq in.mapass2.map out.maq.harita

Eski mapas2'nin harita formatını Maq'ın harita formatına dönüştürün. eski format yapar
okunan adları içermez.

Bilgi Ayıklanıyor

harita görünümü mak harita görünümü [-bN] in.aln.harita > out.aln.txt

Düz metin olarak okuma hizalamasını görüntüleyin. Smith- öncesinde hizalanmış okumalar için
Waterman hizalaması, her satır okuma adı, kromozom, konum,
iplik, bir çiftin dış koordinatlarından ekleme boyutu, eşleştirilmiş bayrak, eşleme
kalitesi, tek uçlu haritalama kalitesi, alternatif haritalama kalitesi,
en iyi vuruşun uyumsuzlukları, en iyinin uyumsuz temellerinin niteliklerinin toplamı
isabet, ilk 0bp'nin 24 uyumsuz isabet sayısı,
referanstaki ilk 24bp, okumanın uzunluğu, okuma sırası ve
kalite. Alternatif eşleme kalitesi, aşağıdaki durumlarda her zaman eşleme kalitesine eşittir:
okumalar eşleştirilmez. Okumalar eşleştirilirse, daha küçük eşlemeye eşittir
iki ucun kalitesi. Bu alternatif haritalama kalitesi aslında
anormal bir çiftin haritalama kalitesi.

Beşinci sütun, eşleştirilmiş bayrak, bitsel bir bayraktır. Düşük 4 biti
oryantasyon: 1 FF, 2 FR, 4 RF ve 8 RR anlamına gelir, burada FR anlamına gelir
daha küçük koordinatlı okumanın ileri iplikte olduğunu ve eşinin
ters iplik üzerinde. Doğru bir çift için yalnızca FR'ye izin verilir. Daha yüksek bitler
bu bayrağın daha fazla bilgi verir. Çift, eşleştirilmiş ucu karşılarsa
16 şartı aranacaktır. İki okuma farklı olarak eşlenirse
kromozom, 32 ayarlanacak. İki okumadan biri hiç eşlenemiyorsa,
64 kurulacaktır. Doğru bir çiftin bayrağı her zaman 18'e eşittir.

Daha sonra Smith-Waterman hizalaması ile hizalanan okumalar için, bayrak
her zaman 130. Bir satır, okunan ad, kromozom, konum, iplik, eklemeden oluşur
boyut, bayrak (her zaman 130), okunan indel'in konumu (indel yoksa 0),
indellerin uzunluğu (eklemeler için pozitif ve silmeler için negatif),
eşinin haritalama kalitesi, en iyi isabetin uyumsuzluk sayısı, toplam
en iyi vuruşun uyumsuz tabanlarının nitelikleri, iki sıfır, okunan uzunluk,
okuma sırası ve kalitesi. 130 işaretli bir okumanın eşi her zaman bir
bayrak 18.

Bayrak 192, okumanın eşlenmediğini ancak montaj ilişkisinin eşlendiğini gösterir. bunun için
bir okuma çifti, bir okuma 64'e ve diğerinde 192'ye sahiptir.

SEÇENEKLER:

-b okuma sırasını ve kalitesini görüntülemeyin

-N uyumsuzlukların meydana geldiği konumları görüntüler. Bu bayrak sadece çalışır
'maq map -N' tarafından oluşturulan bir .map dosyası ile.

harita kontrolü mak harita kontrolü [-s] [-m maksimumlar] [-q minQ] in.ref.bfa in.aln.harita > out.mapcheck

Kalite kontrolünü okuyun. Harita kontrolü, ilk önce, kompozisyonu ve derinliği bildirir.
referans. Bundan sonra bir form var. İlk sütun şunları gösterir:
okuma pozisyonunda. Nükleotidi gösteren dört sütunun ardından
kompozisyon, referans ve okumalar arasındaki ikame oranları verilecektir.
Bu oranlar ve aşağıdaki sütunlardaki sayılar 999'a ölçeklendirilmiş ve
en yakın tam sayıya yuvarlanır. Bir sonraki sütun grubu, aşağıdakilerin dağılımını gösterir:
10 kalite aralığında okumalar boyunca temel nitelikler. Kalitede bir düşüş
genellikle gözlemlenebilir, bu da okumanın sonundaki bazların daha az olduğu anlamına gelir
kesin. Son sütun grubu, ikamelerin fraksiyonunu sunar.
bazları bir kalite aralığında okuyun. Bu, temel kalitenin doğruluğunu ölçer
tahmin. İdeal olarak, 1'te 3'i görmeyi bekliyoruz? sütun, 10'de 2? kolon
ve 100'de 1? kolon.

SEÇENEKLER:

-s Tek uçlu eşleme kalitesini nihai eşleme kalitesi olarak alın

-m INT Bir okumanın sayılması için izin verilen maksimum yanlışlık sayısı [4]

-q INT Bir okumanın sayılması için izin verilen minimum eşleme kalitesi [30]

yığmak mak yığmak [-spvP] [-m maksimumlar] [-Q maksimum] [-q minQ] [-l site dosyası] in.ref.bfa
in.aln.harita > out.yığın

Hizalamayı bir 'yığma' metin biçiminde görüntüleyin. Her satır şunlardan oluşur:
kromozom, pozisyon, referans tabanı, derinlik ve bu okumalardaki bazlar
bu pozisyon. Eğer -v komut satırına, temel niteliklere ve eşlemeye eklenir
nitelikleri sırasıyla altıncı ve yedinci sütunlarda sunulacaktır.

Beşinci sütun her zaman `@' ile başlar. Bu sütunda, aynı tabanları okuyun
referansa virgül `,' veya nokta `.' ile gösterilir ve tabanları farklı okunur
harflerle referanstan. Virgül veya büyük harf, tabanın
üzerinde bir nokta veya küçük harf varken, ileri iplik üzerinde hizalanmış bir okumadan gelir.
ters iplik.

Bu komut, kendi SNP arayanlarını geliştirmek isteyen kullanıcılar içindir.

SEÇENEKLER:

-s Tek uçlu eşleme kalitesini nihai eşleme kalitesi olarak alın

-p Doğru çiftler olarak eşlenmemiş eşleştirilmiş son okumaları atın

-v Temel nitelikler ve haritalama dahil olmak üzere ayrıntılı bilgi çıktısı
nitelikleri

-m INT Bir okumanın kullanılması için izin verilen maksimum uyumsuzluk sayısı [7]

-Q INT Uyumsuzlukların izin verilen maksimum kalite değeri sayısı [60]

-q INT Bir okumanın kullanılması için izin verilen minimum eşleme kalitesi [0]

-l DOSYA Yığınların yazdırılacağı siteleri içeren dosya. Bunda
dosya ilk sütun referansın adlarını verir ve ikinci sütun
koordinatlar. Ek sütunlar yoksayılacak. [boş]

-P ayrıca okumadaki temel konumu da çıkar

cns2fq mak cns2fq [-Q minMapQ] [-n minNeiQ] [-d minDerinlik] [-D Maksimum derinlik] in.cns >
out.cns.fastq

Konsensüs dizilerini FASTQ formatında ayıklayın. Dizi çizgilerinde, bazlar
küçük harfle, esasen tekrarlar veya yeterli kapsama sahip değiller; bazlar
büyük harflerle SNP'lerin güvenilir bir şekilde çağrılabileceği bölgeleri belirtin. İçinde
kaliteli çizgiler, ASCII eksi 33 bir karakterin PHRED kalitesini verir.

SEÇENEKLER:

-Q INT Minimum haritalama kalitesi [40]

-d INT Minimum okuma derinliği [3]

-n INT Minimum komşu kalite [20]

-D INT Maksimum okuma dpeth. >=255 sınırsız. [255]

cns2snp mak cns2snp in.cns > dışarı.snp

SNP sitelerini ayıklayın. Her çizgi kromozom, konum, referans tabanı,
fikir birliği tabanı, Phred benzeri fikir birliği kalitesi, okuma derinliği, ortalama sayı
bu konumu kapsayan okumaların sayısı, okumaların en yüksek haritalama kalitesi
pozisyonu kapsayan, 3bp kanattaki minimum konsensüs kalitesi
sitenin her iki tarafındaki bölgeler (toplamda 6bp), ikinci en iyi arama, log
ikinci en iyi ve üçüncü en iyi çağrının ve üçüncü en iyi çağrının olasılık oranı
aramak.

5. sütun, bir SNP'nin güvenilirliğini değerlendirirken temel kriterdir.
Ancak bu kalite yalnızca site bağımsızlığı varsayılarak hesaplandığından,
daha doğru SNP çağrıları almak için diğer sütunları da dikkate almalıdır. Senaryo
komut `maq.pl SNP filtresi' bunun için tasarlanmıştır (aşağıya bakın).

7. sütun, sitenin tekrarlayan bir bölgeye girip girmediğini gösterir. Eğer hayırsa
siteyi kapsayan okuma, yüksek haritalama kalitesiyle haritalanabilir, yan
bölge muhtemelen tekrar ediyor veya iyi okumalar yok. Böyle bir sitede bir SNP
genellikle güvenilir değildir.

8. sütun kabaca komşu bölgenin kopya numarasını verir.
referans genomu. Çoğu durumda, bu sayı 1.00'a yaklaşır, bu da şu anlama gelir:
bölge hakkında benzersizdir. Bazen sıfır olmayan bir okuma derinliği görebilirsiniz, ancak
7. sütun. Bu, konumu kapsayan tüm okumaların
en az iki uyumsuzluk. Maq, yalnızca 0- ve 1-uyumsuzluk isabetlerinin sayısını sayar.
referans. Bunun nedeni karmaşık bir teknik sorundur.

9. sütun komşu kaliteyi verir. Bu sütunda filtreleme de
güvenilir SNP'ler elde etmek için gereklidir. Bu fikir NQS'den ilham almıştır, ancak NQS
başlangıçta fikir birliği yerine tek bir okuma için tasarlanmıştır.

cns2 görünümü mak cns2 görünümü in.cns > dış görünüm

Tüm sitelerde ayrıntılı bilgi göster. Çıktı formatı aynı
cns2snp rapor.

cns2ref mak cns2ref in.cns > çıkış.ref.fasta

Referans dizisini çıkarın.

cns2win mak cns2win [-w büyük beden] [-c chr] [-b başlamak] [-e son] [-q minQ] in.cns >
dışarı.kazan

Bir işleme penceresinde ortalama bilgileri ayıklayın. Çıktı SEKME ile sınırlandırılmıştır,
referans adı, 1,000,000'a bölünen koordinat, SNP oranı,
het hızı, ham okuma derinliği, yaklaşık olarak benzersiz bölgelerdeki okuma derinliği,
penceredeki ortalama okuma sayısı ve GC yüzdesi.

SEÇENEKLER:

-w INT Bir pencerenin boyutu [1000]

-c STR Hedeflenen referans dizisi; aksi takdirde tüm referanslar kullanılacaktır
[boş]

-b INT Başlangıç ​​konumu, 0 kısıtlamasız [0]

-e INT Sınırsız [0] için bitiş konumu, 0

-q INT Kullanılacak sitelerin minimum fikir birliği kalitesi [0]

Simulation İlgili bağlantılar

sahte mak sahte [-r mutasyona uğramış] [-R indelfrac] in.ref.fasta > out.fakeref.fasta 2>
out.fake.snp

Rastgele ikameleri ve referansları girin. Değişiklikler ve
tek baz çifti indeller eklenebilir.

SEÇENEKLER:

-r FLOAT Mutasyon oranı [0.001]

-R FLOAT İndel olacak mutasyonların oranı [0.1]

simülasyon mak simülasyon out.simupars.dat in.read.fastq

Okuma simülasyonu için parametreleri tahmin edin/eğitin.

benzetmek mak benzetmek [-d boyutunda] [-s std sapma] [-N nOkumalar] [-1 okumaLen1] [-2 okumaLen2] [-r
MutRate] [-R indelFrac] [-h] out.read1.fastq out.read2.fastq in.ref.fasta
in.simupars.dat

Eşleştirilmiş son okumaları simüle edin. Dosya in.simupars.dat okuma uzunluklarını belirler ve
kaliteli dağıtım. Şundan üretilir simülasyonveya adresinden indirilebilir.
Maq web sitesi. Çıktı okuma dosyalarında, bir okuma adı referanstan oluşur.
sıra adı ve benzetilmiş okuma çiftinin dış koordinatları. Tarafından
, varsayılan benzetmek okumaların oluşturulan bir diploid diziden geldiğini varsayar
için bir baz çifti indel dahil olmak üzere iki farklı mutasyon seti ekleyerek
in.ref.fasta.

SEÇENEKLER:

-d INT kesici uç boyutlarının dış mesafesinin ortalaması [170]

-s INT kesici uç boyutlarının standart sapması [20]

-N INT oluşturulacak okuma çiftlerinin sayısı [1000000]

-1 INT ilk okumanın uzunluğu [ayarlanan in.simupars.dat]

-2 INT ikinci okumanın uzunluğu [ayarlanan in.simupars.dat]

-r FLOAT mutasyon oranı [0.001]

-R FLOAT 1bp indeksin kesri [0.1]

-h tüm mutasyonları ekle in.ref.fasta ve tekten okumalar oluşturun
mutasyona uğramış dizi (haploid mod)

NOT:

* Bu komuttan üretilen okumalar bağımsızdır, bu da
hakikat. Uyum değerlendirmesi bundan daha az etkilenirken,
SNP çağrısı dikkatle yapılmalıdır. Hata bağımlılığı şunlardan biri olabilir:
yanlış SNP çağrılarının başlıca nedenleri.

simüstat mak simüstat in.simu-aln.map > dışarı.simusat

Simüle edilmiş okumalardan eşleme niteliklerini değerlendirin.

Sağlam İlgili bağlantılar

fasta2csfa mak fasta2csfa in.nucl-ref.fasta > dışarı.renk-ref.fasta

Nükleotid FASTA'yı renk kodlu FASTA'ya dönüştürün. bayrak -c sonra uygulanmalı
için harita emretmek. Çıktıda, 'A' harfi renk 0, 'C' 1, 'G' anlamına gelir.
2 için ve `T' 3 için Çıkıştaki her dizi girişten 1bp daha kısadır.

csmap2nt mak csmap2nt dışarı.nt.harita in.ref.nt.bfa in.cs.map

Renk hizalamasını nükleotit hizalamasına dönüştürün. Girdi in.ref.nt.bfa olduğunu
nükleotid ikili FASTA referans dosyası. Orijinal dosyaya karşılık gelmelidir
renk referansının dönüştürüldüğü. Nükleotid konsensüs çağrılabilir
sonuçtaki hizalamadan.

Çeşitli/Gelişmiş Komutları

alt harita mak alt harita [-q minMapQ] [-Q maxSumErr] [-m maksimumMM] [-p] harita dışı haritada

Kötü hizalamaları filtrele haritada. Komut satırı seçenekleri şurada açıklanmıştır:
`birleştirmek' emretmek.

eland2maq mak eland2maq [-q yetersiz] harita dışı listede ülke içi

Eland hizalamasını maq'ın .map formatına dönüştürün. Dosya listede oluşur
eland hizalama dosyasının yedinci sütununda görünen sıra adları
ülke içi ve maq hizalamasında görmeyi beklediğiniz isim. Aşağıdaki bir
örnek:

cX.fa chrX
c1.fa chr1
c2.fa chr2

Eland kullanarak okumaları birkaç grupta hizalıyorsanız,
aynısını kullan listede dönüşüm için. Ek olarak, maq tüm dosyaları yükleyecektir.
hizalar ve bunları bellekte sıralar. Birkaç eland'ı birleştirdiyseniz
çıktıları büyük bir dosyaya dönüştürürseniz, onu daha küçük dosyalara ayırmalısınız.
maq'ın tüm makine belleğinizi yemesini önleyin.

Bu komut aslında Maqview'de Eland hizalamasını göstermeyi amaçlamaktadır. kalite olmadığı için
bilgi mevcutsa, elde edilen maq hizalama dosyası kullanılmamalıdır.
konsensüs genotiplerini çağırmak için.

ihracat2maq mak ihracat2maq [-1 okuma1len] [-2 okuma2len] [-a maksdist] [-n] harita dışı listede
ihracat

Illumina'nın Dışa Aktarma biçimini Maq'a dönüştürün .harita biçim. Dışa aktarma biçimi yeni bir
Eşlemeyi de hesaplayan SolexaPipeline-0.3.0'dan beri hizalama formatı
mak gibi nitelikler. Ortaya çıkan dosya, fikir birliği genotiplerini çağırmak için kullanılabilir.
çünkü maq'ın bunu doğru bir şekilde yapması için gerekli bilgilerin çoğu mevcut.

SEÇENEKLER:

-1 INT İlk okumanın uzunluğu [0]

-2 INT İkinci okumanın uzunluğu [0]

-a INT Doğru bir okuma çifti için maksimum dış mesafe [250]

-n Filtrelenmiş okumaları koru

MAQ-PERL KOMUTLAR


gösteri maq.pl gösteri [-h] [-s] [-N nPair'ler] [-d çıkışDir] in.fasta in.simudat

kullanımını göstermek mak ve eşlik eden komut dosyaları. Bu komut
bir FASTA dosyasından okumaları simüle edin in.fasta. Dizi uzunluğu ve nitelikleri
tarafından belirlenir in.simudat hangisinden üretilir mak simülasyon veya olabilir
Maq web sitesinden indirildi. Simüle edilmiş okumalar daha sonra
maq.pl kolay koşu. Hizalama doğruluğu şu şekilde değerlendirilir: mak simüstat,
konsensüs doğruluğu mak simüleve SNP doğruluğu maq_eval.pl.

Varsayılan olarak, eşleştirilmiş son okumalar simüle edilecek ve bir diploid sekans
her iki haploid türüne mutasyonlar eklenerek girdiden üretilir. ek
boyut ve mutasyon oranı tarafından kontrol edilir mak benzetmek.

SEÇENEKLER:

-h diploid dizi yerine haploid diziyi simüle edin

-s okumaları hizalamak için eşleştirilmiş uç modu yerine tek uç modunu kullanın

-N INT simüle edilecek okuma çiftlerinin sayısı [1000000]

-d DIR çıktı dizini [maqdemo]

NOT:

* Çıktı dosyaları maq_eval.pl belgelenmemiş, ancak yapabilirsiniz
bu dosyalardan bazılarında iyi bir tahmin.

* Bu komut sadece maq paketinin kullanımını gösterir. Gerçekte doğruluk
veriler neredeyse her zaman saf simülasyondan gördüğünüzden daha düşüktür.

kolay koşu maq.pl kolay koşu [-1 okuma1Len] [-d out.dir] [-n nOkumalar] [-A 3 adaptör] [-e minDep]
[-q minCnsQ] [-p] [-2 okuma2Len] [-a maksimum giriş] [-S] [-N] in.ref.fasta in1.fastq
[in2.fastq]

Küçük genomlar için boru hattını analiz eder. Easyrun komutu, analizlerin çoğunu çalıştırır
Uygulanan mak. Varsayılan olarak, kolay koşu tüm giriş okuma dizilerini varsayar
dosyalar tek uçlu ve bağımsızdır; ne zaman -p belirtilir, iki okuma sırası
dosyalar gereklidir, her uç için bir tane.

Birkaç dosya oluşturulacak out.dir, aşağıdaki dosyalar arasında
anahtar çıktısı:

cns.final.snp düşük kaliteli olanlar filtrelenmiş son SNP aramaları

cns.fq FASTQ formatında konsensüs dizileri ve nitelikleri

SEÇENEKLER:

-d DIR çıktı dizini [easyrun]

-n INT bir dizi hizalamada okuma/çift sayısı [2000000]

-S kısa indellerin bölünmüş okuma analizini uygulayın (belki çok yavaş)

-N INT havuzdaki haplotip/soy sayısı (>=2) [2]

-A DOSYA 3'-adaptör için dosya. Dosya tek bir sıra satırı içermelidir
[boş]

-1 INT ilk okumanın uzunluğu, otomatik [0] için 0

-e INT bir SNP çağırmak için gereken minimum okuma derinliği (SNPfilter için) [3]

-q INT SNP'ler için minimum konsensüs kalitesi cns.final.snp [30]

-p eşleştirilmiş uç hizalama moduna geç

-2 INT ikinci okumanın uzunluğu ne zaman -p uygulanır [0]

-a INT maksimum kesici uç boyutu -p uygulanır [250]

NOTLAR:

* Havuzlanmış örneklerde SNP çağrısı için, kullanıcılar doğru ` ayarlamalıdır.-N' birlikte
`-E 0

* Girdi dosyası maq'ın ikili formatı olabilir. maq.pl otomatik olarak algılayacak
dosya biçimi.

SNP filtresi maq.pl SNP filtresi [-d minDep] [-D maksimumDep] [-Q maxMapQ] [-q minCnsQ] [-w
indelWinSize] [-n minNeiQ] [-F in.indelpe] [-f in.indelsoa] [-s minPuan] [-m
maxAcross] [-a] [-N maxWinSNP] [-W densWinSize] in.cns2snp.snp >
out.filtrelenmiş.snp

Birkaç okumanın kapsadığı SNP'leri hariç tutun (belirtilen -d), çok fazla
okur (belirtilen -D), yakın (belirtilen -w) potansiyel bir indel'e, düşen
olası bir tekrar eden bölgede (belirtilen -Q) veya düşük kaliteli
komşu üsler (belirtilen -n). eğer maxWinSNP herhangi birinde veya daha fazla SNP görünüyor
densWinSize penceresinde, bunlar da birlikte filtrelenecektir.

SEÇENEKLER:

-d INT SNP çağırmak için gereken minimum okuma derinliği [3]

-D INT SNP çağırmak için gereken maksimum okuma derinliği (<255, aksi takdirde yoksayılır)
[256]

-Q INT SNP'yi kapsayan okumaların gerekli maksimum eşleme kalitesi [40]

-q INT Minimum fikir birliği kalitesi [20]

-n INT Minimum bitişik fikir birliği kalitesi [20]

-w INT Potansiyel indellerin etrafındaki pencerenin boyutu. yakın olan SNP'ler
indels bastırılacak [3]

-F DOSYA The indelpe çıktı [boş]

-f DOSYA The indelsoa çıktı [boş]

-s INT Kabul edilecek bir soa-indel için minimum puan [3]

-m INT Soa-indel'de eşlenebilecek maksimum okuma sayısı [1]

-a Tek uçlu hizalama için alternatif filtre

indelpe maq.pl indelpe in.indelpe > dışarı.indelpe

Homopolimer yolları için indel olmadan eşlenen okuma sayısını düzeltin. Bu
komutu 4., 10. ve son üç sütunu değiştirin in.indelpe ve
sonucu çıktı olarak dışarı.indelpe. Düzeltmeden sonra aşağıdaki awk
komut varsayılan homozigot indelleri verir:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4>=0.75'

ve aşağıdakiler heterozigotları verir:

awk '($3=="*"⎪⎪$3=="+") && $6+$7>=3 && ($6+$7)/$4<0.75'

Bu Unutmayın ki indelpe komutu yalnızca birkaç buluşsal kuralı uygular.
Saf olmayan homopolimer çalışmaları veya di-nükleotit/üçlü için doğru değildir
tekrarlar. Sonuç olarak, iki awk komutu yalnızca yaklaşık hom/het değerini verir.
indeller.

ÖRNEKLER


· Kolay çalıştırma komut dosyası:
maq.pl easyrun -d easyrun ref.fasta part1.fastq part2.fastq

· Easyrun'un arkasındaki temel komutlar:
maq fasta2bfa ref.fasta ref.bfa;
maq fastq2bfq bölüm1.fastq bölüm1.bfq;
maq fastq2bfq bölüm2.fastq bölüm2.bfq;
maq haritası part1.map ref.bfa part1.bfq;
maq haritası part2.map ref.bfa part2.bfq;
maq harita birleştirme aln.harita bölüm1.harita bölüm2.harita;
maq birleştirme cns.cns ref.bfa aln.map;

onworks.net hizmetlerini kullanarak maq'ı çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

  • 1
    Phaser
    Phaser
    Phaser hızlı, ücretsiz ve eğlenceli bir açık
    sunan kaynak HTML5 oyun çerçevesi
    WebGL ve Canvas oluşturma
    masaüstü ve mobil web tarayıcıları. Oyunlar
    ortak olabilir...
    Phaser'ı indirin
  • 2
    VASAL Motor
    VASAL Motor
    VASSAL, oluşturmak için bir oyun motorudur.
    geleneksel tahtanın elektronik versiyonları
    ve kart oyunları. için destek sağlar
    oyun parçası oluşturma ve etkileşim,
    ve ...
    VASSAL Motorunu İndirin
  • 3
    OpenPDF - iText çatalı
    OpenPDF - iText çatalı
    OpenPDF oluşturmak için bir Java kütüphanesidir.
    ve PDF dosyalarını bir LGPL ile düzenlemek ve
    MPL açık kaynak lisansı. OpenPDF
    LGPL/MPL iText'in açık kaynaklı halefi,
    var ...
    OpenPDF'i İndirin - iText Çatalı
  • 4
    SAGA CBS
    SAGA CBS
    SAGA - Otomatik Sistem
    Yerbilimsel Analizler - Bir Coğrafidir
    Bilgi Sistemi (GIS) yazılımı ile
    coğrafi veriler için muazzam yetenekler
    işleme ve ana...
    SAGA GIS'i indirin
  • 5
    Java/JTOpen için Araç Kutusu
    Java/JTOpen için Araç Kutusu
    IBM Toolbox for Java / JTOpen, bir
    destekleyen Java sınıfları kütüphanesi
    istemci/sunucu ve internet programlama
    modelleri OS/400 çalıştıran bir sisteme,
    i5/OS veya...
    Java/JTOpen için Toolbox'ı indirin
  • 6
    d3.js
    d3.js
    D3.js (veya Veriye Dayalı Belgeler için D3)
    sağlayan bir JavaScript kitaplığıdır.
    dinamik, etkileşimli veriler üretmek için
    web tarayıcılarında görselleştirmeler. D3 ile
    sen...
    D3.js'yi indirin
  • Daha fazla »

Linux komutları

Ad