Ini ialah command filter.pl yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
filter.pl - menapis output daripada murasaki berdasarkan pelbagai penapis
SINOPSIS
filter.pl [pilihan] [fail keluaran]
PILIHAN
Pilihan penapisan:
Penapisan boleh dilakukan pada "panjang", "hits", "tfidf", atau "skor".
Anda boleh menapis sama ada dengan menetapkan sama ada "min" atau "maks".
Contohnya: "--minlength 50" menapis keluar mana-mana sauh dengan purata
panjang lebih pendek daripada 50. (purata panjang digunakan kerana sauh
mungkin saiz yang berbeza pada urutan yang berbeza).
Penapis juga boleh menggunakan purata(x), sisihan piawai,
varians(v), atau kiraan sauh(a) dalam ungkapan untuk menetapkan penapis.
Contohnya: "--minscore=2x" menetapkan ambang skor minimum kepada
dua kali ganda markah purata. "--minlength=x+s/2" menetapkan panjang minimum
ambang kepada purata panjang ditambah separuh sisihan piawai.
Pengubahsuaian input:
"--widen=500" => memanjangkan setiap sauh 500 tapak di kedua-dua arah
"--randomwiden=500" => memanjangkan setiap sauh 500 tapak _secara rawak_
(iaitu: untuk membandingkan dengan --luaskan)
Pilihan keluaran:
"--statdump" => buang semua statistik yang tersedia ke dalam 1 fail dengan baris pengepala
"--dumpstats tfidf,length" => membuang statistik tfidf dan panjang untuk memisahkan fail
satu baris setiap sauh
"--dumpstats" => menganggap "--dumpstats semua"
Pilihan plot:
filter.pl boleh memplot mana-mana atau semua statistik yang dikumpul dengan menggunakan
pilihan "--plot".
Contoh:
"--plot hits,length" => plot kedua-dua hits dan panjang
"--plot" => menganggap "--plot all"
"--plotopts" membenarkan tetapan pelbagai gnuplot dan pilihan plot khas.
Statistik yang berbeza boleh disasarkan secara berasingan dengan memberi awalan tetapan
nama dengan statistik pilihan anda diikuti dengan "."
Sebagai contoh:
"--plotopts hits,length.flatx" => melumpuhkan skala log pada paksi x
daripada plot hits dan panjang sahaja
"--plotopts with=points" => menggunakan mata dan bukannya bar pada semua plot
"--plotop = " => boleh digunakan untuk menetapkan sewenang-wenangnya
pilihan gnuplot dalam bentuk "set "
"--bins" boleh digunakan untuk menentukan bilangan tong.
"--nobins" mematikan binning dan memplot histogram mentah (kemungkinan beralun).
"--showall=crop" menghantar semua data ke gnuplot walaupun pada plot skala log (oleh
lalai untuk nilai plot skala log <=1 di hujung paling kanan ialah
dipotong kerana ia tidak muncul dalam gnuplot (1 ialah garis dasar)
tetapi ia menjejaskan julat yang boleh dilihat, dan dengan itu menyebabkan beberapa kerengsaan.
"--showall=scale" ditetapkan secara manual kepada julat X dan Y kepada julat julat
data (jadi 1 jelas berbeza daripada 0).
"--showwall= " melumpuhkan penskalaan/pemotongan
Arahan Gnuplot untuk menjana plot juga dibuang ke
. .plot dan boleh dijalankan secara interaktif dalam gnuplot dengan menaip: load
" . .plot"
Pilihan Statistik:
"--all/--quick" => pengiraan sisihan piawai memerlukan satu saat
melalui data, dan kerana plot histogram secara amnya banyak
lebih berguna daripada statistik sisihan piawai (terutama mempertimbangkan
bukan semua statistik ini mungkin gaussian), jadi melainkan salah satu daripada anda
kekangan memerlukan sisihan piawai, pengiraan ini dilangkau.
Ia boleh dipaksa dengan menggunakan --semua. (--cepat ialah lalai)
"--nodetails" => melumpuhkan pembinaan semula indeks istilah (akan ini
lumpuhkan statistik tfidf).
"--tags" => membolehkan pembacaan anotasi.
Ini menghasilkan statistik "baik, rindu, shuffle" (yang juga boleh diplot)
dan maklumat kekhususan/sensitiviti
"--notags" => melumpuhkan pembacaan anotasi (secara lalai)
Statistik COG/KOG:
Pada mana-mana nilai:
"--kogfile=path/to/kog" => membolehkan penjajaran berasaskan kog
"--kogmap 3=hsa" => memaksa urutan 3 (nota: urutan 0 diindeks) ke
ditugaskan kepada kog "hsa". Jika nama fail termasuk salah satu daripada
singkatan spesies kog, ia diandaikan milik kog itu.
Menyahpepijat:
"--linear" => memaksa imbasan linear untuk CDS dan bukannya carian binari
(jika ini mengembalikan hasil yang berbeza, ini bermakna sesuatu yang sangat tidak kena)
[fail keluaran]:
Jika nama fail input adalah dalam bentuk .anchors.details, kemudian
[fail output] lalai kepada .ditapis.
Secara kebetulan, jika anda tidak menyediakan a Fail .anchors.details, mungkin tidak
kerja pula...
DESCRIPTION
Tapis penjajaran murasaki berdasarkan pelbagai statistik. Pelbagai statistik boleh diplot
menggunakan --plot. Data anotasi diproses daripada fail input menggunakan BioPerl.
Data ROC boleh dikira menggunakan data KOG (yang lebih dipercayai daripada hanya gen
nama). Untuk berbuat demikian, anda perlu menentukan fail data KOG yang boleh dimuat turun daripada COG
pangkalan data di: http://www.ncbi.nlm.nih.gov/COG/ Anda akan mencari sama ada fail "whog".
untuk COG atau fail "kog" di sebelah KOG. Penamaan lokus KOG kadangkala berbeza dengan GBK
fail ke fail, dan nama lokus kadangkala tiada, jadi penilaian berasaskan KOG kini
usaha terbaik (huruf besar diabaikan, locii yang tidak muncul dalam anotasi ialah
diabaikan dan pengakhiran _x khusus domain diabaikan).
Gunakan filter.pl dalam talian menggunakan perkhidmatan onworks.net
