GoGPT Best VPN GoSearch

OnWorks favicon'u

tigr-long-orfs - Bulutta Çevrimiçi

Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden OnWorks ücretsiz barındırma sağlayıcısında tigr-long-orfs'u çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen tigr-long-orfs komutudur.

Program:

ADI


long-orfs — ICCM'deki olasılık modelini kullanarak genom dosyasındaki potansiyel genleri bulun/puanlayın.
dosya

SİNOPSİS


tigr-uzun-org'lar [genom dosyası seçenekler]

AÇIKLAMA


Long-orfs programı bir dizi dosyası alır (FASTA formatında) ve tüm uzun dosyaların bir listesini çıkarır.
çok fazla örtüşmeyen "potansiyel genler" var. "Potansiyel gen" derken şunu kastediyorum:
Bir orf'un ilk başlangıç ​​kodonundan sondaki durdurma kodonuna kadar olan kısmı.

Çıktının ilk birkaç satırı programdaki çeşitli parametrelerin ayarlarını belirtir:

Minimum gen uzunluğu, bir gen olarak kabul edilen en küçük parçanın uzunluğudur.
uzunluk, başlangıç ​​kodonunun ilk bazından *önceki* son bazına kadar ölçülür.
kodonu durdur. Bu değer programı -g seçeneğiyle çalıştırırken belirtilebilir.
Varsayılan olarak program artık (Nisan 2003) bunun için en uygun uzunluğu hesaplayacaktır.
"optimal"in en fazla sayıda uzun ORF üreten değer olduğu parametre,
böylece eğitim için kullanılan veri miktarı artar.

Minimum örtüşme uzunluğu, 2 gen arasındaki örtüşen baz sayısına ilişkin bir alt sınırdır
bu bir sorun olarak değerlendiriliyor. Bundan daha kısa örtüşmeler dikkate alınmaz.

Minimum örtüşme yüzdesi, taban örtüşme sayısına ilişkin başka bir alt sınırdır;
bir sorun olarak değerlendirildi. *Her iki genin de bu yüzdesinden daha kısa örtüşmeler göz ardı edilir.

Çıktının bir sonraki kısmı potansiyel genlerin bir listesidir:

Sütun 1 referans amaçlı bir kimlik numarasıdır. Başlayarak sırayla atanır.
1 ila tüm uzun potansiyel genlerle. Örtüşen genler ortadan kaldırılırsa,
sayılar ortaya çıkacak. Kimlik öneki ID_PREFIX sabitinde belirtilir.

Sütun 2, orftaki ilk başlangıç ​​kodonunun ilk bazının konumudur. Şu anda
Başlangıç ​​kodonları olarak atg ve gtg'yi kullanıyorum. Bu, Is_Start() işlevinde kolaylıkla değiştirilebilir.

Sütun 3, durdurma kodonundan *önceki* son bazın konumudur. Durdurma kodonları taa'dır.
etiket ve tga. Ters okuma çerçevelerindeki orf'ların başlangıç ​​konumlarının olduğunu unutmayın.
son konumdan daha yüksektir. Orf'ların listelenme sırası artan sıradadır
Max {OrfStart, End} ile, yani orf'lar hariç orf'taki en yüksek numaralı konum
bu dizinin sonunu "sarar".

Kimlik numarasına sahip iki gen en azından yeterli miktarda örtüştüğünde (tarafından belirlendiği üzere)
Min_Olap ve Min_Olap_Percent), bunlar elenir ve çıktıda görünmez.

Programın son çıktısı (görünmemesi için standart hata dosyasına gönderilir)
çıktı bir dosyaya yönlendirildiğinde) bulunan en uzun orf'un uzunluğudur.

Farklı Başlatma ve Durdurma Kodonlarının Belirlenmesi:

Farklı başlatma ve durdurma kodon kümelerini belirtmek için gene.h dosyasını değiştirin.
Özellikle işlevler:

Is_Forward_Start Is_Reverse_Start Is_Start Is_Forward_Stop Is_Reverse_Stop
Is_Stop

kodonları başlatmak ve durdurmak için neyin kullanıldığını belirlemek için kullanılır.

Is_Start ve Is_Stop hangi kalıpların kullanıldığını belirlemek için basit dize karşılaştırmaları yapar.
Yeni bir model eklemek için bunun karşılaştırmasını eklemeniz yeterlidir. Bir modeli kaldırmak için yorum yapın veya
bunun için karşılaştırmayı silin.

Diğer dört işlev, başlatma ve durdurma düzenlerini belirlemek için bit karşılaştırmasını kullanır. Onlar
bir kodonu, her baz için 12 bit, her biri için bir bit olmak üzere 4 bitlik bir model olarak temsil eder
T, G, C veya A tabanlarının olası değeri. Böylece 0010 0101 1100 bit modeli
[C] [A veya G] [G veya T] temel modelini temsil eder. Bit işlemleri yaparak (& | ~) ve
karşılaştırmalar, belirsiz okumalar içeren daha karmaşık modeller test edilebilir
verimli bir şekilde. Basit desenler mevcut koddaki gibi test edilebilir.

Örneğin, CAT'ye ek bir başlangıç ​​kodonu eklemek için 3 değişiklik gerekir: 1. || satırı
(Codon & 0x218) == 0x218 = 0010 olduğundan kodon Is_Forward_Start'a eklenmelidir.
0001 1000 CAT'yi temsil eder. 2. Çizgi || (Kodon & 0x184) == Kodon eklenmelidir
Is_Reverse_Start, 0x184 = 0001 1000 0100 olduğundan ATG'yi temsil eder, bu da bunun tersidir.
CAT'in tamamlayıcısı. Alternatif olarak #define sabiti ATG_MASK kullanılabilir. 3.
satır || strncmp (S, "cat", 3) == 0 Is_Start'a eklenmelidir.

SEÇENEKLER


-g n Minimum gen uzunluğunu n olarak ayarlayın. Varsayılan, optimum değeri hesaplamaktır
otomatik olarak. Ne yaptığınızı bilmiyorsanız bunu değiştirmeyin.

-l Genomu doğrusal (dairesel değil) olarak kabul edin, yani genlerin "sarılmasına" izin vermeyin
genomun sonu civarında. Bu seçenek hem glimmer hem de uzun orflarda işe yarar.
. Varsayılan davranış, genomu dairesel olarak kabul etmektir.

-o n Maksimum örtüşme uzunluğunu n olarak ayarlayın. Bundan daha kısa örtüşmelere izin verilir.
(Varsayılan 0 bp'dir.)

-p n Maksimum örtüşme yüzdesini %n olarak ayarlayın. Bu yüzdeden daha kısa örtüşmeler
*her iki* dize de dikkate alınmaz. (Varsayılan %10'dur.)

Onworks.net hizmetlerini kullanarak tigr-long-orfs'u çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

Linux komutları

Ad




×
reklâm
❤️Buradan alışveriş yapın, rezervasyon yapın veya satın alın; ücretsizdir, hizmetlerin ücretsiz kalmasına yardımcı olur.