GoGPT Best VPN GoSearch

OnWorks favicon'u

sim4 - Bulutta Çevrimiçi

OnWorks ücretsiz barındırma sağlayıcısında sim4'ü Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen sim4 komutudur.

Program:

ADI


sim4 - eksprese edilmiş bir DNA dizisini genomik bir diziyle hizalayın

SİNOPSİS


sim4 sıra dosyası1 sıra dosyası2 {[WXKCRDAPNB]=değer}

AÇIKLAMA


sim4 eksprese edilmiş bir DNA dizisini (EST, cDNA, mRNA) hizalamak için benzerliğe dayalı bir araçtır
gen için bir genomik dizi ile. İki giriş yapıldığında bitiş eşleşmelerini de algılar.
diziler bir uçta örtüşür (yani, bir dizinin başlangıcı dizinin sonuyla örtüşür)
başka). Eğer sıra dosyası2 dizilerin bir veritabanıdır, dizideki dizi sıra dosyası1 hizalanacak
dizilerin her biri ile sıra dosyası2.

sim4 İlk önce temel eşleştirme bloklarını belirlemek için patlamaya dayalı bir teknik kullanır
"ekson çekirdeklerini" temsil eder. Bu ilk aşamada, olası tüm tam eşleşmeleri algılar.
iki dizi arasında W-mers (yani, W boyutundaki DNA sözcükleri) içerir ve bunları aşağıdakilere kadar genişletir:
maksimum puanlama boşluksuz segmentler. İkinci aşamada, ekson çekirdekleri uzatılır.
açgözlü hizalama algoritmaları ve buluşsal yöntemler kullanan bitişik henüz eşsiz parçalar
ek yeri tanıma sinyallerine uyan konfigürasyonları desteklemek için kullanılır (GT-
AG, CT-AC). Gerekirse, işlem daha az katı parametrelerle tekrarlanır.
eşsiz parçalar

Varsayılan olarak, sim4 her iki diziyi de arar ve sayı ile ölçülen en iyi eşleşmeyi bildirir
hizalamada bulunan eşleşen nükleotidlerin sayısı. R komut satırı seçeneği,
aramayı yalnızca bir yönle (iplik) sınırlandırın.

Şu anda, A seçeneği tarafından kontrol edilen beş ana hizalama görüntüleme seçeneği desteklenmektedir.
Varsayılan olarak (A=0), yalnızca intronların uç noktaları, genel benzerliği ve oryantasyonu
rapor edilir. Bir ok işareti (`->' veya `<-'), intronun ('+' veya
`-' dizisi), intronu çevreleyen sinyaller ile üç veya daha fazla konum eşleşmesi olduğunda
GT-AG veya CT-AC bağlantı tanıma sinyalleri. Aynı sayıda eşleşme olduğunda
her iki yön için de bulunursa, intron belirsiz olarak rapor edilir ve şu şekilde temsil edilir:
`-'. '==' işareti, bir cDNA fragmanının hizalanmasından başlayarak
o pozisyon. Alternatif biçimler (lav bloğu biçimi, metin, PipMaker türü "ekson dosyası" veya
bu seçeneklerin belirli kombinasyonları) farklı bir değer belirtilerek talep edilebilir.
A için

P seçeneği sıfır olmayan bir değerle belirtilirse, sim4 herhangi bir 3'-uç poli-A'yı kaldıracak
hizalamada algıladığı kuyruklar.

Bazen, sim4 çok büyük intronlarla çevrili olduğunda bir iç eksonu kaçırabilir,
tipik olarak 100 Kb'den uzun. Bundan şüphelenildiğinde, sıfırlamak için H seçeneği kullanılabilir.
intron boşluğu cezasını telafi etmek için ekzonların ağırlığı.

Sıralama verilerinde belirsizlik kodlarına varsayılan olarak izin verilir, ancak sim4 onlara davranmaz
diferansiyel olarak. İstenirse, B komutu seçeneği, kabul edilebilir komut setini sınırlayabilir.
sadece A,C,G,T,N ve X'e karakterler.

sim4 cDNA'yı ("kısa") ayırt etmek için giriş dizilerinin uzunluklarını karşılaştırır
ve karşılaştırmadaki genomik ('uzun') bileşenler. Ne zaman sıra dosyası2 bir koleksiyon içerir
dizilerin, dosyadaki ilk giriş bunun türünü belirlemek için kullanılacak ve
sonraki tüm karşılaştırmalar.

Aşağıdaki açıklamada, MSP terimi bir Maksimal Sparça Phava, yani bir çift
ile patlama benzeri prosedür sırasında elde edilen iki dizideki oldukça benzer fragmanlar
kibrit ve belki de birkaç uyumsuzluktan kaynaklanan bir W-mer vuruşunu uzatmak.

SEÇENEKLER


Algoritma parametreleri (aşağıdaki ilk iki bölüme dahil edilmiştir) zaten
ayarlıdır ve normalde kullanıcı tarafından ayar gerektirmez.

Patlama benzeri prosedürün içindeki parametreler:

W Algoritmanın ilk aşamasında patlama vuruşları için kelime boyutunu ayarlar. Varsayılan
değer 12'dir, ancak daha sıkı bir arama için artırılabilir veya
daha zayıf eşleşmeler bulun.

X Patlama benzeri aşamada sözcük uzantılarını sonlandırmak için sınırları kontrol eder.
algoritma. Varsayılan değer 12'dir.

K Temel 'ekson çekirdeklerini' belirlerken MSP puanları için eşiği ayarlar,
Algoritmanın ilk aşamasında. (Bu seçenek belirtilmemişse,
eşik istatistiksel kullanılarak dizilerin uzunluklarından hesaplanır
kriterleri.) Örneğin, birkaç aralıktaki genomik diziler için iyi bir değer
yüz Kb 16'dır. Ancak, sahte eşleşmelerden kaçınmak için daha büyük bir değer gerekebilir
daha uzun diziler için

C Henüz eşleşmeyen parçaları hizalarken MSP puanları için eşiği ayarlar,
Algoritmanın ikinci aşamasında. Varsayılan olarak, sabitin küçüğü
12 ve istatistik tabanlı bir eşik seçilir.

Ek algoritma parametreleri:

D Bir eksondaki ardışık MSP'ler içindeki "diyagonal" mesafenin sınırını ayarlar. NS
varsayılan değer 10'tir.

Bağlam parametreleri:

R Aramanın yönünü belirtir. R=0 ise, yalnızca "+" (doğrudan) dizi
arandı. R=1 ise, sadece "-" (ters tümleyen) eşleşmeleri aranır. Varsayılan olarak
(R=2), sim4 her iki diziyi de arar ve en iyi eşleşmeyi rapor eder.
hizalamadaki eşleşen çiftlerin sayısı.

A Çıktının biçimini belirtir: yalnızca ekson uç noktaları (A=0), ekson uç noktaları ve
için belirtildiğinde, genomik dizideki kodlama bölgesinin (CDS) sınırları
giriş mRNA'sı (A=5), hizalama metni (A=1), lav bloğu biçiminde hizalama (A=2) veya
hem ekson uç noktaları hem de hizalama metni (A=3 veya A=4). Bir ters tamamlayıcı eşleşmesi varsa
bulunursa, A=0,1,2,3,5 uzun olanın "+" dizisindeki konumunu verecektir.
dizisi ve daha kısa dizinin "-" dizisi. A=4 konumunu
birinci dizinin "+" dizisi (seqfile1) ve ikinci dizinin "-" dizisi
dizi (seqfile2), hangi dizinin daha uzun olduğuna bakılmaksızın. A=5 seçeneği olabilir
CDS'nin uç noktalarını belirtmek için S komut satırı seçeneğiyle birlikte kullanılır.
mRNA'yı oluşturur ve PipMaker'ın gerektirdiği 'ekson dosyası' formatında çıktı üretir.

P Programın hizalamanın parçasını rapor edip etmeyeceğini belirtir
poli-A kuyruğunu içeren (eğer bulunursa). Varsayılan olarak (P=0) hizalama görüntülenir
hesaplandığı gibi, ancak sıfır olmayan bir değer belirtmek, poli-A'yı kaldırmak için sim4'ü talep edecektir.
kuyruklar. Bu özellik etkinleştirildiğinde, tüm görüntüleme seçenekleri ek lav üretir.
hizalama başlıkları

H Çok büyük intronları telafi etmek için MSP'lerin ağırlığını sıfırlar. Varsayılan değer
H=500, ancak 100 Kb'den büyük bazı intronlar daha yüksek değerler gerektirebilir, tipik olarak
1000 ile 2500 arasında. Bu seçenek, genellikle vakalarda dikkatli kullanılmalıdır.
cDNA'nın eşleşmeyen bir iç kısmı, bir kayıp eksonu gizleyebilir.
çok büyük intron Sahte üretebilecekleri EST'ler için önerilmez.
ekzonlar.

N Ekleme tarafından yönlendirilen küçük marjinal ekzonlar (N=1) için ek bir arama talep eder.
site tanıma sinyalleri Bu seçenek, yüksek doğrulukta bir eşleşme olduğunda kullanılabilir.
beklenen. Varsayılan değer N=0'dır ve ek arama yapılmaz.

B Giriş dizilerinde izin verilen karakter kümesini kontrol eder. Varsayılan olarak (B=1),
belirsizlik karakterlerine (ABCDGHKMNRSTVWXY) izin verilir. B=0 belirtildiğinde,
kabul edilebilir karakterler yalnızca A,C,G,T,N ve X ile sınırlıdır.

S Kullanıcının giriş mRNA'sındaki CDS'nin uç noktalarını belirtmesine izin verir.
sözdizimi: S=n1..n2. Bu seçenek yalnızca A=5 bayrağıyla kullanılabilir.
PipMaker tarafından istenen biçimde çıktı. Alternatif olarak, CDS koordinatları
mRNA dizisinin FastA başlığında bir CDS=n1..n2 yapısında görünür. Ne zaman
ikinci dosya bir mRNA veritabanıdır, CDS için komut satırı belirtimi
yalnızca dosyadaki ilk sıraya uygulanır.

ÖRNEKLER


sim4 est genomik

sim4 genomik estdb

sim4 est genomik A=1 P=1

sim4 tahmin1 tahmin2 R=1

sim4 mRNA genomik A=5 S=123..1020

sim4 mouse_cDNA human_genomic K=15 C=11 A=3 W=10

YAZARLAR


sim4 Liliana Florea tarafından yazılmıştır.[e-posta korumalı]> ve Scott Schwartz.

Bu kılavuz sayfası Nelson A. de Oliveira tarafından yazılmıştır.[e-posta korumalı]>, dayalı olarak
adresindeki çevrimiçi belgeler http://globin.cse.psu.edu/html/docs/sim4.html, Debian için
proje (ancak başkaları tarafından kullanılabilir).

Wed, 03 Ağustos 2005 18: 40: 58-0300 SIM4(1)

onworks.net hizmetlerini kullanarak sim4'ü çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

Linux komutları

Ad




×
reklâm
❤️Buradan alışveriş yapın, rezervasyon yapın veya satın alın; ücretsizdir, hizmetlerin ücretsiz kalmasına yardımcı olur.