Il s'agit de la commande pymvpa2-crossval qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
pymvpa2-crossval - validation croisée des performances d'un apprenant
SYNOPSIS
pymvpa2 crossval [--version] [-h] -i BASE DE DONNÉES [BASE DE DONNÉES ...] --apprenant APPRENANT [--apprenant-
espace ESPACE_APPRENANT] --partitionner PARTITIONNEUR [--erreurfx ERREURFX] [--avg-datafold-
résultats] [--équilibre-formation BALANCE_FORMATION] [--échantillonnage-répétitions
ÉCHANTILLONS_RÉPÉTITIONS] [--permutations PERMUTATIONS] [--prob-queue {gauche droite}] -o SORTIE
[--hdf5-compression TYPE]
DESCRIPTION
Validation croisée des performances d'un apprenant
Un apprenant est entraîné et testé à plusieurs reprises sur des partitions d'un ensemble de données d'entrée qui sont
généré par un schéma de partitionnement configurable. La partition constitue généralement une formation
et tester des portions. L'apprenant est formé sur la partie formation de l'ensemble de données, puis
la généralisation de l'apprenant est testée en comparant ses prédictions sur la partie test.
Un résumé des performances d'un apprenant est écrit dans STDOUT. Selon la configuration particulière
de l'analyse de validation croisée, que ce soit les prédictions brutes de l'apprenant ou le résumé
les statistiques sont renvoyées dans un ensemble de données de sortie.
Si le test de permutation Monte-Carlo est activé (voir --permutations) un deuxième jeu de données de sortie
avec les valeurs p correspondantes est également stocké (suffixe du nom de fichier '_nullprob').
OPTIONS
--version
afficher la version du programme et les informations de licence et quitter
-h, --Aidez-moi, --help-np
afficher ce message d'aide et quitter. --help-np désactive de force l'utilisation d'un téléavertisseur
pour afficher l'aide.
-i JEU DE DONNEES [JEU DE DONNEES ...], --saisir JEU DE DONNÉES [JEU DE DONNÉES ...]
chemin(s) vers un ou plusieurs fichiers de jeu de données PyMVPA. Tous les ensembles de données seront fusionnés dans un
ensemble de données unique (vstack'ed) dans l'ordre de spécification. Dans certains cas, cette option peut
doivent être spécifiés plus d'une fois si des ensembles de données d'entrée multiples, mais séparés, sont
nécessaire.
Options pour validation croisée configuration:
--apprenant APPRENANT
sélectionner un apprenant (nœud entraînable) via sa description dans l'entrepôt des apprenants (voir
commande 'info' pour une liste), une liste de capacités séparées par des deux-points, ou par un fichier
chemin d'accès à un script Python qui crée une instance de classificateur (avancé).
--espace-apprenant ESPACE_APPRENANT
nom d'un exemple d'attribut qui définit le modèle à apprendre par un apprenant. Par
par défaut, il s'agit d'un attribut nommé « cibles ».
--partitionner PARTITIONNEUR
sélectionnez un schéma de pliage des données. Les arguments pris en charge sont : 'half' pour split-half
partitionnement, 'oddeven' pour le partitionnement en morceaux pairs et impairs, 'group-X' où
X peut être n'importe quel entier positif pour le partitionnement en groupes X, 'nX' où X peut être
n'importe quel entier positif pour le partitionnement Leave-X-chunks. Par défaut les partitionneurs
fonctionnent sur des morceaux d'ensemble de données qui sont définis par un attribut d'échantillon « morceaux ». Le nom
de l'attribut "chunking" peut être modifié en ajoutant deux points et le nom du
attribut (par exemple 'oddeven:run'). facultativement, un argument de cette option peut également être
un chemin de fichier vers un script Python qui crée une instance de partitionneur personnalisé
(Avancée).
--erreurfx ERREURFX
fonction d'erreur à appliquer aux cibles et prédictions de chacun
pli de données de validation croisée. Cela peut être soit le nom de n'importe quelle fonction d'erreur dans
Le module mvpa2.misc.errorfx de PyMVPA, ou un chemin de fichier vers un script Python qui crée
une fonction d'erreur personnalisée (avancée).
--avg-datafold-results
valeurs moyennes des résultats à travers les plis de données générés par le partitionneur. Par exemple
pour calculer une erreur de prédiction moyenne sur tous les plis d'une procédure de validation croisée.
--équilibre-formation BALANCE_FORMATION
Si activé, les échantillons d'apprentissage sont équilibrés dans chaque pli de données. Si le mot-clé
'égal' est donné comme argument un nombre égal d'échantillons aléatoires pour chaque unique
la valeur cible est choisie. Le nombre d'échantillons par catégorie est déterminé par le
catégorie avec le moins d'échantillons dans l'ensemble d'apprentissage respectif. Un
l'argument entier entraînera le nombre correspondant d'échantillons par catégorie à
être sélectionné au hasard. Un argument de nombre à virgule flottante (intervalle [0,1]) indique
quelle fraction des échantillons disponibles doit être sélectionnée.
--échantillonnage-répétitions ÉCHANTILLONS_RÉPÉTITIONS
Si l'équilibrage de l'ensemble d'apprentissage est activé, à quelle fréquence la sélection d'échantillons aléatoires doit-elle être
effectué pour chaque pli de données. Par défaut : 1
--permutations PERMUTATIONS
Nombre de passes de permutation Monte-Carlo à calculer pour estimer un H0
distribution pour tous les résultats de validation croisée. L'activation de cette option fera
rapports des valeurs p correspondantes disponibles dans le résumé des résultats et la sortie.
--prob-queue {gauche droite}
quelle queue de la distribution de probabilité pour rapporter les valeurs de p lors de l'évaluation
résultats des tests de permutation. Par exemple, une prédiction de moyenne de calcul de validation croisée
erreur pourrait rapporter la valeur p de la queue gauche pour un test unilatéral.
Sortie options:
-o SORTIR, --output SORTIE
nom du fichier de sortie (l'extension '.hdf5' est ajoutée automatiquement si nécessaire). Noter la
le format de sortie convient à l'échange de données entre les commandes PyMVPA, mais n'est pas
recommandé pour le stockage à long terme ou l'échange car son contenu spécifique peut varier
en fonction de l'environnement logiciel réel. Pour un stockage à long terme, pensez
conversion en d'autres formats de données (voir la commande 'dump').
--hdf5-compression TYPE
type de compression pour le stockage HDF5. Les valeurs disponibles dépendent du HDF5 spécifique
installation. Les valeurs typiques sont : 'gzip', 'lzf', 'szip' ou des nombres entiers de 1 à 9
indiquant les niveaux de compression gzip.
Utilisez pymvpa2-crossval en ligne en utilisant les services onworks.net