Amazon Best VPN GoSearch

Favicon OnWorks

tigr-long-orfs - Dalam Talian di Awan

Jalankan tigr-long-orfs dalam penyedia pengehosan percuma OnWorks melalui Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS

Ini ialah arahan tigr-long-orfs yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS

JADUAL:

NAMA


long-orfs — Cari/Skor gen berpotensi dalam fail genom menggunakan model kebarangkalian dalam icm-
fail

SINOPSIS


tigr-long-orgs [fail genom pilihan]

DESCRIPTION


Program long-orfs mengambil fail jujukan (dalam format FASTA) dan mengeluarkan senarai semua yang panjang
"gen berpotensi" di dalamnya yang tidak bertindih terlalu banyak. Dengan "gen berpotensi" yang saya maksudkan
bahagian orf daripada kodon mula pertama hingga kodon henti pada penghujung.

Beberapa baris pertama output menentukan tetapan pelbagai parameter dalam program:

Panjang gen minimum ialah panjang serpihan terkecil yang dianggap sebagai gen. The
panjang diukur dari pangkal pertama kodon mula hingga pangkal terakhir *sebelum*
hentikan kodon. Nilai ini boleh ditentukan semasa menjalankan program dengan pilihan -g.
Secara lalai, program sekarang (April 2003) akan mengira panjang optimum untuk ini
parameter, dengan "optimum" ialah nilai yang menghasilkan bilangan ORF panjang yang paling banyak,
sekali gus meningkatkan jumlah data yang digunakan untuk latihan.

Panjang pertindihan minimum ialah batas bawah pada bilangan asas bertindih antara 2 gen
itu dianggap masalah. Pertindihan yang lebih pendek daripada ini diabaikan.

Peratus pertindihan minimum ialah satu lagi sempadan bawah pada bilangan pertindihan asas iaitu
dianggap masalah. Pertindihan yang lebih pendek daripada peratusan *kedua-dua* gen ini diabaikan.

Bahagian keluaran seterusnya ialah senarai gen berpotensi:

Lajur 1 ialah nombor ID untuk tujuan rujukan. Ia ditetapkan secara berurutan bermula
dengan 1 hingga semua gen berpotensi panjang. Jika gen bertindih dihapuskan, jurang dalam
nombor akan berlaku. Awalan ID ditentukan dalam ID_PREFIX pemalar.

Lajur 2 ialah kedudukan asas pertama kodon permulaan pertama dalam orf. Pada masa ini
Saya menggunakan atg, dan gtg sebagai kodon permulaan. Ini mudah diubah dalam fungsi Is_Start () .

Lajur 3 ialah kedudukan pangkalan terakhir *sebelum* kodon hentian. Kodon henti adalah taa,
tag, dan tga. Ambil perhatian bahawa untuk orf dalam bingkai bacaan terbalik mempunyai kedudukan permulaannya
lebih tinggi daripada kedudukan akhir. Urutan di mana orf disenaraikan adalah dalam susunan yang semakin meningkat
oleh Max {OrfStart, End}, iaitu, kedudukan bernombor tertinggi dalam orf, kecuali untuk orf
bahawa "membungkus" penghujung urutan.

Apabila dua gen dengan nombor ID bertindih dengan sekurang-kurangnya jumlah yang mencukupi (seperti yang ditentukan oleh
Min_Olap dan Min_Olap_Percent ), ia dihapuskan dan tidak muncul dalam output.

Output akhir program (dihantar ke fail ralat standard supaya ia tidak muncul
apabila output diubah hala ke fail) ialah panjang orf terpanjang ditemui.

Menentukan Kodon Mula dan Henti Berbeza:

Untuk menentukan set kodon mula dan henti yang berbeza, ubah suai gen fail.h .
Secara khusus, fungsi:

Is_Forward_Start Is_Reverse_Start Is_Start Is_Forward_Stop Is_Reverse_Stop
Is_Stop

digunakan untuk menentukan apa yang digunakan untuk kodon mula dan berhenti.

Is_Start dan Is_Stop melakukan perbandingan rentetan mudah untuk menentukan corak yang digunakan.
Untuk menambah corak baharu, cuma tambahkan perbandingan untuknya. Untuk mengalih keluar corak, ulas keluar atau
padamkan perbandingan untuknya.

Empat fungsi lain menggunakan sedikit perbandingan untuk menentukan corak mula dan berhenti. mereka
mewakili kodon sebagai corak 12-bit, dengan 4 bit untuk setiap pangkalan, satu bit untuk setiap satu
kemungkinan nilai asas, T, G, C atau A. Oleh itu corak bit 0010 0101 1100
mewakili corak asas [C] [A atau G] [G atau T]. Dengan melakukan operasi bit (& | ~) dan
perbandingan, corak yang lebih rumit yang melibatkan bacaan samar-samar boleh diuji
dengan cekap. Corak mudah boleh diuji seperti dalam kod semasa.

Contohnya, untuk memasukkan kodon permulaan tambahan CAT memerlukan 3 perubahan: 1. Baris ||
(Kodon & 0x218) == Kodon hendaklah dimasukkan ke dalam Is_Forward_Start , memandangkan 0x218 = 0010
0001 1000 mewakili CAT. 2. Barisan || (Kodon & 0x184) == Kodon hendaklah dimasukkan ke dalam
Is_Reverse_Start , kerana 0x184 = 0001 1000 0100 mewakili ATG, iaitu sebaliknya-
pelengkap CAT. Secara bergantian, ATG_MASK pemalar #define boleh digunakan. 3. Yang
baris || strncmp (S, "cat", 3) == 0 hendaklah dimasukkan ke dalam Is_Start .

PILIHAN


-g n Tetapkan panjang gen minimum kepada n. Lalai adalah untuk mengira nilai optimum
secara automatik. Jangan ubah ini melainkan anda tahu apa yang anda lakukan.

-l Anggap genom sebagai linear (bukan bulat), iaitu, jangan benarkan gen "membungkus
sekitar" hujung genom. Pilihan ini berfungsi pada kedua-dua glimmer dan long-orfs
. Tingkah laku lalai adalah menganggap genom sebagai bulat.

-o n Tetapkan panjang pertindihan maksimum kepada n. Bertindih lebih pendek daripada ini dibenarkan.
(Lalai ialah 0 bp.)

-p n Tetapkan peratusan pertindihan maksimum kepada n%. Bertindih lebih pendek daripada peratusan ini
*kedua-dua* rentetan diabaikan. (Lalai ialah 10%.)

Gunakan tigr-long-orfs dalam talian menggunakan perkhidmatan onworks.net


Pelayan & Stesen Kerja Percuma

Muat turun apl Windows & Linux

Arahan Linux

Ad




×
Pengiklanan
❤ ️Beli, tempah atau beli di sini — tanpa kos, membantu memastikan perkhidmatan percuma.