Ini adalah format ulang perintah yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
sreformat - mengonversi file urutan ke format berbeda
RINGKASAN
memformat ulang [pilihan] format file seq
DESKRIPSI
memformat ulang membaca file urutan file seq dalam format apa pun yang didukung, format ulang menjadi format baru
format yang ditentukan oleh format, kemudian mencetak teks yang diformat ulang.
Format input yang didukung termasuk (tetapi tidak terbatas pada) format FASTA yang tidak selaras,
Genbank, EMBL, SWISS-PROT, PIR, dan GCG, dan format yang selaras Stockholm, Clustal, GCG
MSF, dan Philip.
Kode format file output unaligned yang tersedia termasuk: puasa (format FASTA); lambang
(format EMBL/SWISSPROT); genbank (Format Genbank); gcg (format urutan tunggal GCG);
gcgdata (format database flatfile GCG); pir (format file datar PIR/CODATA); mentah (mentah
urutan, tidak ada informasi lain).
Kode format file output selaras yang tersedia termasuk: Stockholm (format PFAM/Stockholm);
msf (format MSF GCG); a2m (format FASTA selaras); FILIP (format PHYLIP Felsenstein);
dan kelompok (Format klaster V/W/X); dan seleks (diberi keterangan SELEX/HMMER/Pfam lama
format penyelarasan);
Semua kode diinterpretasikan secara case-insensitive (mis. MSF, Msf, atau msf semuanya berfungsi).
File format yang tidak selaras tidak dapat diformat ulang ke format yang selaras. Namun, format selaras
dapat diformat ulang ke format yang tidak selaras -- karakter celah dihilangkan begitu saja.
Program ini awalnya bernama memformat ulang, tapi nama itu bentrok dengan program GCG
nama yang sama.
PILIHAN
-d DNA; ubah U menjadi T, untuk memastikan urutan asam nukleat ditampilkan sebagai DNA bukan
RNA. Lihat -R.
-h Cetak bantuan singkat; termasuk nomor versi dan ringkasan semua opsi, termasuk
pilihan ahli.
-l Huruf kecil; mengubah semua residu urutan ke huruf kecil. Lihat -kamu.
-n Untuk sekuens DNA/RNA, ubah karakter apa pun yang bukan RNA/DNA yang tidak ambigu (mis
ACGTU/acgtu) ke N. Digunakan untuk mengubah kode ambiguitas IUPAC menjadi N, untuk perangkat lunak
yang tidak dapat menangani semua kode IUPAC (beberapa kode lipat RNA publik, misalnya). Jika
file adalah perataan, karakter celah juga dibiarkan tidak berubah. Jika barisan adalah
bukan urutan asam nukleat, opsi ini akan merusak data dengan cara yang dapat diprediksi
mode.
-r RNA; konversikan T ke U, untuk memastikan urutan asam nukleat ditampilkan sebagai RNA bukan
DNA. Lihat -D.
-u Huruf besar; mengkonversi semua residu urutan ke huruf besar. Lihat -l.
-x Untuk sekuens DNA, ubah karakter non-IUPAC (seperti X) menjadi N. Ini untuk
kompatibilitas dengan orang-orang jahat yang bersikeras menggunakan X alih-alih IUPAC
karakter ambiguitas N. (X untuk ambiguitas dalam residu asam amino).
Peringatan: seperti -n opsi, kode tidak memeriksa apakah Anda benar-benar memberikannya
DNA. Secara harfiah hanya mengubah simbol DNA non-IUPAC menjadi N. Jadi jika Anda
secara tidak sengaja memberinya urutan protein, ia akan dengan senang hati mengubah sebagian besar setiap amino
residu asam menjadi N.
EXPERT PILIHAN
--gapsim
Ubah semua karakter celah menjadi . Digunakan untuk menyiapkan file penyelarasan untuk program
dengan persyaratan ketat untuk simbol celah. Hanya masuk akal jika masukannya file seq is
sebuah keselarasan.
--informasi
Tentukan bahwa file urutan dalam format , daripada mengizinkan program
untuk mendeteksi format file secara otomatis. Contoh umum termasuk Genbank, EMBL, GCG, PIR,
Stockholm, Clustal, MSF, atau PHYLIP; lihat dokumentasi tercetak untuk lengkapnya
daftar nama format yang diterima.
--mingap
If file seq adalah perataan, hapus kolom apa pun yang berisi karakter celah 100%,
meminimalkan panjang keseluruhan alinyemen. (Sering berguna jika Anda telah mengekstrak
subset dari urutan selaras dari keselarasan yang lebih besar.)
--tidak ada celah
Hapus semua kolom sejajar yang berisi simbol celah sama sekali. Berguna sebagai pendahuluan
ke analisis filogenetik, di mana Anda hanya ingin menganalisis kolom yang berisi 100%
residu, jadi Anda ingin menghapus kolom dengan celah di dalamnya. Hanya masuk akal
jika file tersebut adalah file pelurusan.
--pfam Hanya untuk format keluaran penyelarasan SELEX, letakkan seluruh penyelarasan dalam satu blok
(jangan bungkus menjadi beberapa blok). Ini dekat dengan format yang digunakan secara internal oleh
Pfam di Stockholm dan Cambridge.
--sama Cobalah untuk mengonversi karakter celah ke gaya UC Santa Cruz SAM, di mana file . berarti celah
kolom sisipan, dan a - berarti penghapusan dalam kolom konsensus/kecocokan. Ini hanya
berfungsi untuk mengonversi format file yang disejajarkan, dan hanya jika penyelarasan sudah
mematuhi konvensi SAM huruf besar untuk residu dalam konsensus/pertandingan
kolom, dan huruf kecil untuk residu di kolom sisipan. Ini benar, misalnya,
dari semua keberpihakan yang dihasilkan oleh versi lama HMMER. (HMMER2 menghasilkan keberpihakan
yang mematuhi konvensi SAM bahkan dalam pilihan karakter celah.) Opsi ini adalah
ditambahkan untuk memungkinkan penyelarasan Pfam diformat ulang menjadi sesuatu yang lebih cocok untuk
profil konstruksi HMM menggunakan perangkat lunak UCSC SAM.
--samfrac
Coba ubah karakter celah penyelarasan dan kotak residu ke UC Santa Cruz SAM
gaya, dimana a. berarti celah di kolom sisipan dan a - berarti penghapusan di a
kolom konsensus/kecocokan, dan huruf besar berarti residu kecocokan/konsensus dan lebih rendah
case berarti residu yang dimasukkan. Ini hanya akan berfungsi untuk mengonversi file yang disejajarkan
format, tetapi tidak seperti --sama opsi, itu akan berfungsi terlepas dari apakah file
mematuhi konvensi residu huruf besar/kecil. Sebagai gantinya, kolom apa pun yang berisi
lebih dari pecahan karakter celah ditafsirkan sebagai kolom sisipan, dan
semua kolom lainnya ditafsirkan sebagai kolom yang cocok. Opsi ini ditambahkan untuk mengizinkan
Keberpihakan Pfam akan diformat ulang menjadi sesuatu yang lebih cocok untuk profil HMM
konstruksi menggunakan perangkat lunak UCSC SAM.
--wussify
Mengonversi string anotasi struktur sekunder RNA (baik konsensus maupun individual)
dari format "KHS" lama, ><, ke notasi WUSS baru, <>. Jika notasi sudah
dalam format WUSS, opsi ini akan mengacaukannya, tanpa peringatan. Hanya SELEX dan
File format Stockholm memiliki markup struktur sekunder saat ini.
--dewuss
Konversi string anotasi struktur sekunder RNA dari notasi WUSS baru, <>,
kembali ke format KHS yang lama, ><. Jika anotasi sudah dalam KHS, opsi ini
akan merusaknya, tanpa peringatan. Hanya file berformat SELEX dan Stockholm yang memiliki
markup struktur sekunder.
Gunakan format ulang online menggunakan layanan onworks.net