Ini ialah arahan pymvpa2-crossval yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
pymvpa2-crossval - pengesahan silang prestasi pelajar
SINOPSIS
pymvpa2 crossval [--versi] [-h] -i DATASET [DATASET ...] --pelajar PEMBELAJAR [--pelajar-
ruang LEARNER_SPACE] --pembahagi PEMBAHAGIAN [--errorfx ERRORFX] [--avg-datafold-
keputusan] [--latihan imbangan BALANCE_TRAINING] [--persampelan-pengulangan
SAMPLING_ULANG] [--permutasi PERMUTAAN] [--prob-tail {kiri kanan}] -o OUTPUT
[--hdf5-mampatan JENIS]
DESCRIPTION
Pengesahan silang prestasi pelajar
Seorang pelajar berulang kali dilatih dan diuji pada partition set data input yang
dijana oleh skim pembahagian yang boleh dikonfigurasikan. Pembahagian biasanya merupakan latihan
dan bahagian ujian. Pelajar dilatih tentang bahagian latihan set data dan kemudian
generalisasi pelajar diuji dengan membandingkan ramalannya pada bahagian ujian.
Ringkasan prestasi pelajar ditulis kepada STDOUT. Bergantung pada persediaan tertentu
analisis silang pengesahan, sama ada ramalan mentah atau ringkasan pelajar
statistik dikembalikan dalam set data keluaran.
Jika ujian pilih atur Monte-Carlo didayakan (lihat --permutasi) set data keluaran kedua
dengan nilai-p yang sepadan juga disimpan (akhiran nama fail '_nullprob').
PILIHAN
--versi
tunjukkan versi program dan maklumat lesen dan keluar
-h, - membantu, --help-np
tunjukkan mesej bantuan ini dan keluar. --help-np melumpuhkan secara paksa penggunaan alat kelui
untuk memaparkan bantuan.
-i DATASET [DATASET ...], --input DATASET [DATASET ...]
laluan ke satu atau lebih fail set data PyMVPA. Semua set data akan digabungkan menjadi a
set data tunggal (vstack'ed) mengikut susunan spesifikasi. Dalam beberapa kes pilihan ini mungkin
perlu dinyatakan lebih daripada sekali jika berbilang, tetapi berasingan, set data input
diperlukan.
Pilihan khususnya pengesahan bersilang persediaan:
--pelajar PEMBELAJAR
pilih pelajar (nod boleh dilatih) melalui penerangannya dalam gudang pelajar (lihat
arahan 'info' untuk penyenaraian), senarai keupayaan yang dipisahkan dengan titik bertindih, atau oleh fail
laluan ke skrip Python yang mencipta contoh pengelas (lanjutan).
--ruang-pelajar LEARNER_SPACE
nama atribut sampel yang mentakrifkan model yang akan dipelajari oleh pelajar. Oleh
lalai ini ialah atribut bernama 'sasaran'.
--pembahagi PEMBAHAGIAN
pilih skema lipatan data. Hujah yang disokong ialah: 'separuh' untuk split-half
pembahagian, 'ganjil' untuk membahagikan kepada ketulan ganjil dan genap, 'kumpulan-X' di mana
X boleh menjadi sebarang integer positif untuk pembahagian dalam kumpulan X, 'nX' di mana X boleh
sebarang integer positif untuk pembahagian cuti-X-ketul. Secara lalai pembahagi
beroperasi pada ketulan set data yang ditakrifkan oleh atribut sampel 'ketulan'. Nama
daripada atribut "chunking" boleh ditukar dengan menambahkan titik bertindih dan nama
atribut (cth 'oddeven:run'). secara pilihan hujah untuk pilihan ini juga boleh
laluan fail ke skrip Python yang mencipta contoh pembahagi tersuai
(maju).
--errorfx ERRORFX
fungsi ralat untuk digunakan pada sasaran dan ramalan setiap satu
lipatan data pengesahan silang. Ini sama ada boleh menjadi nama mana-mana fungsi ralat dalam
Modul mvpa2.misc.errorfx PyMVPA, atau laluan fail ke skrip Python yang mencipta
fungsi ralat tersuai (lanjutan).
--avg-datafold-results
nilai hasil purata merentas lipatan data yang dijana oleh pembahagi. Sebagai contoh
untuk mengira ralat ramalan min merentas semua lipatan prosedur pengesahan silang.
--latihan imbangan BALANCE_TRAINING
Jika didayakan, sampel latihan adalah seimbang dalam setiap lipatan data. Jika kata kunci
'sama' diberikan sebagai hujah bilangan sampel rawak yang sama untuk setiap unik
nilai sasaran dipilih. Bilangan sampel setiap kategori ditentukan oleh
kategori dengan bilangan sampel paling sedikit dalam set latihan masing-masing. An
hujah integer akan menyebabkan bilangan sampel yang sepadan bagi setiap kategori kepada
dipilih secara rawak. Argumen nombor titik terapung (selang [0,1]) menunjukkan
apakah pecahan sampel yang ada yang akan dipilih.
--persampelan-pengulangan SAMPLING_ULANG
Jika pengimbangan set latihan didayakan, berapa kerap pemilihan sampel rawak harus dilakukan
dilakukan untuk setiap lipatan data. Lalai: 1
--permutasi PERMUTAAN
Bilangan larian pilih atur Monte-Carlo untuk dikira untuk menganggar H0
pengedaran untuk semua keputusan pengesahan silang. Mendayakan pilihan ini akan membuat
laporan nilai-p sepadan yang terdapat dalam ringkasan hasil dan output.
--prob-tail {kiri kanan}
ekor mana bagi taburan kebarangkalian untuk melaporkan nilai-p dari semasa menilai
keputusan ujian permutasi. Contohnya, ramalan min pengkomputeran pengesahan silang
ralat boleh melaporkan nilai p-ekor kiri untuk ujian satu sisi.
Output pilihan yang berikut:
-o PENGELUARAN, --pengeluaran OUTPUT
nama fail keluaran (sambungan '.hdf5' ditambah secara automatik jika perlu). NOTA: The
format output sesuai untuk pertukaran data antara arahan PyMVPA, tetapi tidak
disyorkan untuk penyimpanan atau pertukaran jangka panjang kerana kandungan khususnya mungkin berbeza-beza
bergantung pada persekitaran perisian sebenar. Untuk penyimpanan jangka panjang pertimbangkan
penukaran kepada format data lain (lihat arahan 'dump').
--hdf5-mampatan JENIS
jenis mampatan untuk storan HDF5. Nilai yang tersedia bergantung pada HDF5 tertentu
pemasangan. Nilai biasa ialah: 'gzip', 'lzf', 'szip' atau integer dari 1 hingga 9
menunjukkan tahap mampatan gzip.
Gunakan pymvpa2-crossval dalam talian menggunakan perkhidmatan onworks.net