GoGPT Best VPN GoSearch

favorit OnWorks

thisus - Online di Awan

Jalankan thisus di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

Ini adalah perintah Theseus yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


ini kita - Kemungkinan maksimum, beberapa superposisi simultan dengan statistik
analisis

RINGKASAN


ini kita [pilihan] file pdb1 [file pdb2 ...]

dan

thisus_align [opsi] -f file pdb1 [file pdb2 ...]

DESKRIPSI


Theseus melapiskan satu set struktur makromolekul secara bersamaan menggunakan metode
kemungkinan maksimum (ML), daripada kriteria kuadrat-terkecil konvensional. Theseus
mengasumsikan bahwa struktur terdistribusi menurut matriks distribusi Gaussian
dan bahwa nilai eigen dari matriks kovarians atom terdistribusi secara hierarkis
menurut distribusi gamma terbalik. Model superposisi ML ini menghasilkan banyak
hasil yang lebih akurat dengan menurunkan bobot daerah variabel dari struktur dan
dengan mengoreksi korelasi antar atom.

Theseus beroperasi dalam dua mode utama: (1) mode untuk melapiskan struktur dengan identik
urutan dan (2) mode untuk struktur dengan urutan berbeda tetapi struktur serupa:

(1) Mode untuk superposisi makromolekul dengan urutan dan angka yang identik
residu, misalnya, beberapa model dalam keluarga NMR atau beberapa struktur
dari bentuk kristal yang berbeda dari protein yang sama.

Dalam mode ini, Theseus akan membaca setiap model di setiap file pada baris perintah dan
superposisi mereka.

Contoh:

ini kita 1s40.pdb

Dalam contoh di atas, 1s40.pdb adalah file pdb dari 10 model NMR.

(2) Mode ``penyelarasan'' untuk superposisi struktur dengan urutan berbeda,
misalnya, beberapa struktur protein sitokrom c dari spesies yang berbeda
atau beberapa struktur lisozim putih telur ayam yang bermutasi.

Mode ini mengharuskan pengguna untuk menyediakan file penyelarasan urutan struktur
sedang disuperposisikan (lihat opsi -A dan ``FORMAT FILE'' di bawah). Selain itu, itu
mungkin diperlukan untuk menyediakan mapfile yang memberitahu ini kita file struktur PDB mana
sesuai dengan urutan mana dalam penyelarasan (lihat opsi -M dan `` FORMAT FILE ''
di bawah). Mapfile tidak diperlukan jika nama urutan dan pdb yang sesuai
nama file identik. Dalam mode ini, jika ada beberapa model struktural di
file PDB, ini kita hanya membaca model pertama di setiap file pada baris perintah. Di dalam
kata lain, ini kita memperlakukan file pada baris perintah seolah-olah hanya ada satu
struktur per file.

Contoh 1:

ini kita -A cytc.aln -M cytc.filemap d1cih__.pdb d1csu__.pdb d1kyow_.pdb

Dalam contoh di atas, d1cih__.pdb, d1csu__.pdb, dan d1kyow_.pdb adalah file pdb dari
domain sitokrom c dari database SCOP.

Contoh 2:

thisus_align -f d1cih__.pdb d1csu__.pdb d1kyow_.pdb

Dalam contoh ini, the thisus_align script dipanggil untuk melakukan kerja keras untuk Anda.
Ini akan menghitung perataan urutan dan kemudian superpose berdasarkan perataan itu.
Naskah thisus_align mengambil opsi yang sama dengan ini kita program. Catatan,
beberapa baris pertama skrip ini harus dimodifikasi untuk sistem Anda, karena ini memanggil an
program penyelarasan beberapa urutan eksternal untuk melakukan penyelarasan. Lihat
contoh/ direktori untuk lebih jelasnya, termasuk file contoh.

PILIHAN


Algoritma Pilihan default in {tanda kurung}:
--amber
Lakukan pemrosesan khusus untuk file PDB berformat AMBER8

Kebanyakan orang tidak perlu menggunakan opsi panjang ini, kecuali Anda sedang memproses MD
jejak dari AMBER. AMBER menempatkan nama atom di kolom yang salah dalam file PDB.

-a [seleksi]
Atom termasuk dalam superposisi. Opsi ini membutuhkan dua jenis argumen,
baik (1) nomor yang menentukan satu set jenis atom yang dipilih sebelumnya, atau (2) sebuah eksplisit
Gaya PDB, daftar atom yang dibatasi titik dua untuk disertakan.

Untuk subset tipe atom yang dipilih sebelumnya, opsi bilangan bulat berikut tersedia:

· 0, karbon alfa untuk protein, atom C1´ untuk asam nukleat
· 1, tulang punggung
· 2, semua
· 3, karbon alfa dan beta
· 4, semua atom berat (tanpa hidrogen)

Perhatikan, hanya .A0 opsi tersedia ketika superposisi struktur dengan
urutan yang berbeda.

Untuk kustom memilih satu set eksplisit jenis atom, jenis atom harus ditentukan
persis seperti yang diberikan di bidang file PDB, termasuk spasi, dan tipe atom harus
dikemas dalam tanda kutip. Beberapa jenis atom harus dibatasi oleh titik dua.
Sebagai contoh,

-a ` N : CA : C : O '

akan menentukan jenis atom dalam tulang punggung peptida.

-f Hanya membaca model pertama dari file PDB multi-model

-h Bantuan/penggunaan

-i [nnn]
Iterasi maksimum, {200}

-p [ketelitian]
Presisi relatif yang diminta untuk konvergensi, {1e-7}

-r [akar nama]
Nama root yang akan digunakan dalam penamaan file output, {theseus}

-s [nn:...]
Pemilihan residu (mis. -s15-45:50-55), {all}

-S [nn:...]
Residu untuk dikecualikan (misalnya -S15-45:50-55) {none}

Dua opsi sebelumnya memiliki format yang sama. Residu (atau kolom penyelarasan) berkisar
ditandai dengan awal dan akhir dipisahkan oleh tanda hubung. Beberapa rentang, di mana saja
urutan sewenang-wenang, dipisahkan oleh titik dua. Rantai juga dapat dipilih dengan memberikan
ID rantai tepat sebelum rentang residu. Sebagai contoh, -sA1-20: A40-71
hanya akan mencakup residu 1 hingga 20 dan 40 hingga 70 dalam rantai A. Rantai tidak dapat
ditentukan ketika melapiskan struktur dengan urutan yang berbeda.

-v gunakan pembobotan varians ML (tanpa korelasi) {default}

Input / Output pilihan:
-A [urutan penjajaran fillet]
File perataan urutan untuk digunakan sebagai panduan (format CLUSTA atau A2M)

Untuk digunakan ketika melapiskan struktur dengan urutan yang berbeda. Lihat `` FORMAT FILE ''
di bawah.

-E Cetak opsi ahli

-F Cetak file FASTA dari urutan dalam file PDB dan keluar

Pilihan yang berguna ketika melapiskan struktur dengan urutan yang berbeda. File-file
output dengan opsi ini dapat disejajarkan dengan program penyelarasan beberapa urutan
seperti CLUSTA atau OTOT, dan file penyelarasan output yang dihasilkan digunakan sebagai ini kita
masukan dengan -A .

-h Bantuan/penggunaan

-I Hitung saja statistik untuk file input; jangan berlebihan

-M [berkas peta]
File yang memetakan file PDB ke urutan dalam perataan.

File berformat dua kolom sederhana; lihat ``FORMAT FILE'' di bawah. Digunakan dengan mode 2.

-n Jangan menulis file pdb yang diubah

-o [referensi struktur]
File referensi untuk dilapiskan, semua rotasi relatif terhadap model pertama di
file ini

Misalnya, 'theseus -o cytc1.pdb cytc1.pdb cytc2.pdb cytc3.pdb' akan menggantikan
struktur dan putar seluruh superposisi akhir sehingga struktur dari
cytc1.pdb berada dalam orientasi yang sama dengan struktur di PDB cytc1.pdb asli
file.

-V Versi

Utama komponen analisis:
-C Gunakan matriks kovarians untuk PCA (matriks korelasi adalah default)

-P [nnn]
Jumlah komponen utama untuk dihitung {0}

Dalam kedua hal di atas, komponen utama yang sesuai ditulis dalam B-
bidang faktor dari file PDB keluaran. Biasanya hanya beberapa PC pertama yang ada
bunga (mungkin sampai enam).

CONTOH ini kita 2sdf.pdb

ini kita -l -r baru2sdf 2sdf.pdb

ini kita -s15-45 -P3 2sdf.pdb

ini kita -A cytc.aln -M cytc.mapfile -o cytc1.pdb -s1-40 cytc1.pdb cytc2.pdb cytc3.pdb
cytc4.pdb

LINGKUNGAN


Anda dapat mengatur variabel lingkungan 'PDBDIR' ke direktori file PDB Anda dan ini kita akan
lihat di sana setelah direktori kerja saat ini. Misalnya, di shell C (tcsh atau
csh), Anda dapat meletakkan sesuatu yang mirip dengan ini di file .cshrc Anda:

setenv PDBDIR '/usr/share/pdbs/'

FILE FORMAT


Theseus akan membaca file berformat PDB standar (lihathttp://www.rcsb.org/pdb/>). Setiap
upaya telah dilakukan agar program menerima format file CNS dan X-PLOR yang tidak standar
juga.

Dua file lainnya layak disebutkan, file perataan urutan dan file peta.

Urutan penjajaran fillet
Ketika melapiskan struktur dengan identitas residu yang berbeda (di mana panjang masing-masing
makromolekul dalam hal residu tidak selalu sama), keselarasan urutan
file harus disertakan untuk ini kita untuk digunakan sebagai panduan (ditentukan oleh -A pilihan). Theseus
menerima baik CLUSTA dan A2M (FASTA) diformat beberapa file penyelarasan urutan.

CATATAN 1: Urutan residu dalam pelurusan harus sama persis dengan urutan residu
diberikan dalam koordinat file PDB. Artinya, tidak boleh ada kekurangan atau tambahan
residu yang tidak sesuai dengan urutan dalam file PDB. Cara mudah untuk memastikan
bahwa urutan Anda sama persis dengan file PDB adalah untuk menghasilkan urutan menggunakan
inius' -F opsi, yang menulis file urutan berformat FASTA dari rantai di
file-file PDB-nya. Output file dengan opsi ini kemudian dapat disejajarkan dengan beberapa
program penyelarasan urutan seperti CLUSTA atau OTOT, dan penyelarasan output yang dihasilkan
file yang digunakan sebagai ini kita masukan dengan -A .

CATATAN 2: Setiap file PDB harus memiliki urutan yang sesuai dalam penyelarasan. Namun, tidak
setiap urutan dalam penyelarasan harus memiliki file PDB yang sesuai. Artinya, ada bisa
menjadi urutan tambahan dalam keselarasan yang tidak digunakan untuk memandu superposisi.

PDB -> Urutan berkas peta
Jika nama file PDB dan nama urutan yang sesuai di
alignemnt identik, mapfile dapat dihilangkan. Sebaliknya, Theseus perlu tahu
urutan mana dalam file penyelarasan yang sesuai dengan file struktur PDB mana. Ini
informasi disertakan dalam mapfile dengan format yang sangat sederhana (ditentukan dengan -M
pilihan). Hanya ada dua kolom yang dipisahkan oleh spasi: kolom pertama mencantumkan
nama file struktur PDB, sedangkan kolom kedua mencantumkan urutan yang sesuai
nama persis seperti yang diberikan dalam file penyelarasan beberapa urutan.

Contoh file peta:

cytc1.pdb seq1
cytc2.pdb seq2
cytc3.pdb seq3

LAYAR KELUARAN


Theseus memberikan output yang menggambarkan kemajuan superposing dan beberapa
statistik untuk hasil akhir:

Klasik LS berpasangan :
RMSD konvensional untuk superposisi, RMSD rata-rata untuk semua berpasangan
kombinasi struktur dalam ansambel.

Kuadrat terkecil :
Standar deviasi untuk superposisi, berdasarkan asumsi konvensional
tidak ada korelasi dan varians yang sama. Pada dasarnya sama dengan RMSD dari rata-rata
struktur.

Maksimum Kemungkinan :
Analog ML dari standar deviasi untuk superposisi. Ketika berasumsi bahwa
korelasinya nol (matriks kovarians diagonal), ini sama dengan
akar kuadrat dari rata-rata harmonik varians untuk setiap atom. Sebaliknya,
``Kuadrat terkecil '' yang diberikan di atas melaporkan akar kuadrat dari aritmatika
rata-rata varian. Rata-rata harmonik selalu lebih kecil dari aritmatika
rata-rata, dan rata-rata harmonik menurunkan bobot nilai besar sebanding dengan
besarnya. Ini masuk akal secara statistik, karena ketika menggabungkan nilai, seseorang harus
bobot mereka dengan kebalikan dari varians mereka (yang sebenarnya adalah apa yang ML
metode superposisi tidak).

Marjinal Log Kemungkinan:
Kemungkinan log marjinal akhir dari superposisi, dengan asumsi matriks
Distribusi Gaussian dari struktur dan gamma terbalik hierarkis
distribusi nilai eigen dari matriks kovarians. Log marginal
kemungkinan adalah kemungkinan dengan matriks kovarians terintegrasi keluar.

AIC: Kriteria Informasi Akaike untuk superposisi akhir. Ini penting
statistik dalam analisis kemungkinan dan teori pemilihan model. Ini memungkinkan tujuan
perbandingan beberapa model teoritis dengan jumlah parameter yang berbeda. Di dalam
dalam hal ini, semakin tinggi angkanya semakin baik. Ada tradeoff antara fit to the
data dan jumlah parameter yang cocok. Meningkatkan jumlah parameter
dalam sebuah model akan selalu memberikan kecocokan yang lebih baik dengan data, tetapi juga meningkatkan
ketidakpastian nilai estimasi. Kriteria AIC menemukan kombinasi terbaik
dengan (1) memaksimalkan kecocokan dengan data sementara (2) meminimalkan ketidakpastian karena
jumlah parameter. Dalam kasus superposisi, seseorang dapat membandingkan yang terkecil
superposisi kuadrat ke superposisi kemungkinan maksimum. Metode (atau
model) dengan AIC yang lebih tinggi lebih disukai. Perbedaan AIC dari 2 atau lebih adalah
dianggap bukti statistik yang kuat untuk model yang lebih baik.

BIC: Kriteria Informasi Bayesian. Mirip dengan AIC, tetapi dengan Bayesian
tekanan.

Bis penumpang chi2:
Statistik chi2 tereduksi keseluruhan untuk keseluruhan fit, termasuk rotasi,
terjemahan, kovarians, dan parameter gamma terbalik. Ini mungkin
statistik yang paling penting untuk superposisi. Dalam beberapa kasus, gamma terbalik
kecocokannya mungkin buruk, namun kecocokannya secara keseluruhan masih sangat bagus. Sekali lagi, itu idealnya
mendekati 1.0, yang akan menunjukkan kecocokan yang sempurna. Namun, jika menurutmu itu
terlalu besar, pastikan untuk membandingkannya dengan chi2 untuk kecocokan kuadrat terkecil; dia
mungkin tidak terlalu buruk. Sebuah chi2 besar sering menunjukkan pelanggaran terhadap
asumsi model. Pelanggaran yang paling umum adalah ketika melapiskan dua atau
domain yang lebih independen yang dapat berputar relatif satu sama lain. Jika ini adalah
kasus, maka kemungkinan akan ada tidak hanya satu distribusi Gaussian, tetapi beberapa
campuran Gaussians, satu untuk setiap domain. Kemudian, akan lebih baik untuk menempatkan masing-masing
domain secara mandiri.

Hierarkis adalah (alfa, gamma) chi2:
Chi2 tereduksi untuk invers gamma fit dari nilai eigen matriks kovarians. Sebagai
sebelumnya, idealnya harus mendekati 1.0. Dua nilai dalam tanda kurung adalah
perkiraan ML dari parameter skala dan bentuk, masing-masing, untuk kebalikannya
distribusi gamma.

Rotasi, terjemahan, kovar chi2:
Statistik chi2 tereduksi untuk kesesuaian struktur dengan model. Dengan baik
fit itu harus mendekati 1.0, yang menunjukkan kecocokan data yang sempurna dengan
model statistik. Dalam kasus kuadrat terkecil, model yang diasumsikan adalah matriks
Distribusi Gaussian dari struktur dengan varians yang sama dan tidak ada korelasi.
Untuk kecocokan ML, model yang diasumsikan adalah varians yang tidak sama dan tidak ada korelasi, sebagai
dihitung dengan -v pilihan [bawaan]. Statistik ini untuk superposisi
saja, dan tidak termasuk kecocokan nilai eigen matriks kovarians ke
distribusi gamma terbalik. Lihat ``Omnibus chi2'' di bawah.

Hierarkis minimum ada:
Kesesuaian hierarkis dari distribusi gamma terbalik membatasi varians dari
atom dengan membuat yang besar lebih kecil dan yang kecil lebih besar. Statistik ini
melaporkan kemungkinan varians minimum yang diberikan parameter gamma terbalik yang disimpulkan.

kecondongan, kecondongan nilai Z, kurtosis & kurtosis Z-nilai:
Kemiringan dan kurtosis residu. Keduanya harus 0.0 jika residual cocok
distribusi Gaussian dengan sempurna. Mereka diikuti oleh nilai-P untuk
statistik. Ini adalah ujian yang sangat ketat; residu bisa sangat non-Gaussian dan
namun perkiraan rotasi, translasi, dan matriks kovarians mungkin masih
agak akurat.

Data poin, Gratis param, D/P:
Jumlah total titik data yang diberikan semua struktur yang diamati, jumlah
parameter yang cocok dalam model, dan rasio data-ke-parameter.

rata-rata struktur:
Struktur yang secara keseluruhan paling mirip dengan struktur rata-rata. Ini bisa jadi
dianggap sebagai struktur yang paling ``tipikal'' dalam ansambel.

Total putaran:
Jumlah iterasi yang dibutuhkan algoritma untuk konvergen.

Fractional presisi:
Ketepatan aktual yang menjadi tujuan konvergensi algoritme.

KELUARAN FILE


Theseus menulis file-file berikut:

thisus_sup.pdb
Superposisi terakhir, diputar ke sumbu utama struktur rata-rata.

thisus_ave.pdb
Perkiraan struktur rata-rata.

thisus_residuals.txt
Residu superposisi yang dinormalisasi. Ini dapat dianalisis untuk penyimpangan
dari normalitas (apakah cocok dengan distribusi Gaussian standar). Misalnya, chi2,
skewness, dan statistik kurtosis didasarkan pada nilai-nilai ini.

thisus_transf.txt
Matriks rotasi transformasi akhir dan vektor translasi.

thisus_variances.txt
Vektor varians yang diperkirakan untuk setiap atom.

Ketika Komponen Utama dihitung (dengan -P opsi), file berikut adalah
juga diproduksi:

thisus_pcvecs.txt
Vektor komponen utama.

thisus_pcstats.txt
Statistik sederhana untuk setiap komponen utama (pembebanan, penjelasan varians,
dan sebagainya).

thisus_pcN_ave.pdb
Struktur rata-rata dengan komponen utama ke-N ditulis dalam suhu
bidang faktor.

thisus_pcN.pdb
Superposisi akhir dengan komponen utama ke-N ditulis dalam suhu
bidang faktor. File ini dihilangkan ketika melapiskan molekul dengan yang berbeda
urutan residu (mode 2).

thisus_cor.mat, thisus_cov.mat
Matriks korelasi atomik dan matriks kovarians, berdasarkan
superposisi. Formatnya cocok untuk input ke GNU oktaf. Ini adalah
matriks yang digunakan dalam Analisis Komponen Utama.

Gunakan thisus online menggunakan layanan onworks.net


Server & Workstation Gratis

Unduh aplikasi Windows & Linux

Perintah Linux

Ad




×
iklan
❤️Berbelanja, pesan, atau beli di sini — tanpa biaya, membantu menjaga layanan tetap gratis.