Questo è il comando prof che può essere eseguito nel provider di hosting gratuito OnWorks utilizzando una delle nostre molteplici postazioni di lavoro online gratuite come Ubuntu Online, Fedora Online, emulatore online Windows o emulatore online MAC OS
PROGRAMMA:
NOME
prof - struttura secondaria e predittore di accessibilità del solvente
SINOSSI
prof [FILE DI INPUT+] [OPZIONI]
DESCRIZIONE
La struttura secondaria è prevista da un sistema di valutazione delle reti neurali a un valore atteso
precisione media > 72% per i tre stati elica, filamento e anello (Rost & Sander, PNAS,
1993, 90, 7558-7562; Rost & Sander, JMB, 1993, 232, 584-599; e Rost & Sander,
Proteine, 1994, 19, 55-72; valutazione di accuratezza). Valutato sullo stesso set di dati,
PROFsec ha una precisione a tre stati superiore di dieci punti percentuali rispetto ai metodi che utilizzano
solo informazioni di sequenza singola, e a più di sei punti percentuali in più rispetto a,
ad esempio, un metodo che utilizza informazioni di allineamento basate su statistiche (Levin, Pascarella, Argos &
Garnier, Prot. Ing., 6, 849-54, 1993). Le previsioni di PHDsec hanno tre caratteristiche principali:
1. migliore accuratezza attraverso informazioni evolutive da più allineamenti di sequenze
2. migliore previsione del filamento beta attraverso una procedura di allenamento equilibrata
3. previsione più accurata dei segmenti della struttura secondaria utilizzando un sistema multilivello
L'accessibilità del solvente è prevista da un metodo di valutazione della rete neurale a una correlazione
coefficiente (correlazione tra solvente relativo osservato sperimentalmente e previsto)
accessibilità) di 0.54 cross-validate su un set di 238 proteine globulari (Rost & Sander,
Proteine, 1994, 20, 216-226; valutazione di accuratezza). L'output della rete neurale
codici per 10 stati di relativa accessibilità. Espresso in unità della differenza
tra previsione per modello di omologia (metodo migliore) e previsione a caso (peggiore
metodo), PROFacc è di circa 26 punti percentuali superiore a una rete neurale comparabile
utilizzando tre stati di uscita (sepolto, intermedio, esposto) e non utilizzando informazioni da
allineamenti multipli.
Le eliche transmembrana nelle proteine integrali di membrana sono previste da un sistema di neuroni
reti. Il difetto del sistema di rete è che spesso le eliche sono troppo lunghe
previsto. Questi sono tagliati da un filtro empirico. La previsione finale (Rost et al.,
Scienza delle proteine, 1995, 4, 521-533; valutazione dell'accuratezza) ha un per-residuo atteso
precisione di circa il 95%. Il numero di falsi positivi, cioè eliche transmembrana
previsto nelle proteine globulari, è di circa il 2%. La previsione della rete neurale di
transmembrane helices (PHDhtm) è raffinato da un algoritmo di programmazione dinamica. Questo
metodo ha portato a previsioni corrette di tutte le eliche transmembrana per l'89% del 131
proteine utilizzate in un test di convalida incrociata; più del 98% delle eliche transmembrana erano
correttamente previsto. L'output di questo metodo viene utilizzato per prevedere la topologia, ovvero il
orientamento dell'N-termine rispetto alla membrana. L'accuratezza attesa del
la previsione della topologia è > 86%. L'accuratezza della previsione è superiore alla media per gli eucarioti
proteine e inferiore alla media per i procarioti. PHDtopology è più accurato di tutti
altri metodi testati su set di dati identici.
Se nessuna opzione per il file di output (come --fileRdb or --fileOut) viene fornito l'RDB formattato
l'output è scritto in ./NOMEFILEINPUT.prof dove 'prof' sostituisce l'estensione di
file di input. In mancanza di estensione '.prof' viene aggiunto al nome del file di input.
Uscita formato
Il formato RDB è auto-annotante, vedi output di esempio in /condividi/profphd/prof/exa.
BIBLIOGRAFIA
Rost, B. e Sander, C. (1994a). Combinando informazioni evolutive e reti neurali per
predire la struttura secondaria delle proteine. proteine, 19(1), 55-72.
Rost, B. e Sander, C. (1994b). Conservazione e previsione dell'accessibilità dei solventi in
famiglie proteiche. proteine, 20(3), 216-26.
Rost, B., Casadio, R., Fariselli, P. e Sander, C. (1995). Eliche transmembrana
previsto con una precisione del 95%. Sci proteico, 4(3), 521-33.
VERSIONI
Vedi ogni parola chiave per ulteriore aiuto. È probabile che la maggior parte di questi si rompa.
a modelli di connettività alternativi (default=3)
3 predizione sec + acc + htm
acc predire l'accessibilità del solvente, solo
ali aggiunge l'allineamento ai file di output PROF "leggibili dall'uomo"
arco
architettura di sistema (es: SGI64|SGI5|SGI32|SUNMP|ALPHA)
ascii
scrivi file di output PROF "leggibili dall'uomo"
migliore
PROF con la migliore precisione e il tempo di esecuzione più lungo
entrambi
prevedere la struttura secondaria e l'accessibilità del solvente
dati
dati= per HTML out: solo quelle parti delle previsioni scritte
mettere a punto
conserva la maggior parte dei file intermedi, stampa i messaggi di debug
dirWork
directory di lavoro, impostazione predefinita: una directory temporanea da File::Temp::tempdir. Deve essere completamente
percorso qualificato.
Noto per lavorare.
doEval
Valutazione DO per lista (solo per strutture e liste conosciute)
doFilterHssp
filtrare il file HSSP di input (escludendo alcune coppie)
doHtmfil
Filtra la previsione della membrana (impostazione predefinita)
fallo
FARE controllare la resistenza dell'elica della membrana prevista (impostazione predefinita)
doHtmref
FARE perfezionare la previsione della membrana (impostazione predefinita)
doHtmtop
DO topologia dell'elica della membrana (impostazione predefinita)
dsp
converti PROF in formato DSSP
espandere
espandere gli inserimenti durante la conversione dell'output in formato MSF
veloce
PROF con la minima precisione e la massima velocità
fileCasp
nome dell'output PROF in formato CASP (file.caspProf)
fileDssp
nome dell'output PROF in formato DSSP (file.dsspProf)
fileHtml
nome dell'output PROF in formato HTML (file.htmlProf)
fileMsf
nome dell'output PROF in formato MSF (file.msfProf)
fileNotHtm
nome del file che segnala che non è stata trovata alcuna elica di membrana
fileOut
nome dell'output PROF in formato RDB (file.rdbProf)
Noto per lavorare.
fileProf
nome dell'output PROF in formato leggibile dall'uomo (file.prof)
Rotto.
fileRdb
nome dell'output PROF in formato RDB (file.rdbProf)
Noto per lavorare.
fileSaf
nome dell'output PROF in formato SAF (file.safProf)
filtro
filtrare il file HSSP di input (escludendo alcune coppie)
buono
PROF con buona precisione e velocità moderata
grafico
aggiungi il grafico ASCII ai file di output PROF "leggibili dall'uomo"
htm usa: 'htm= ' fornisce un'elica transmembrana minima rilevata come predefinita è 'htm=0'
(resp. htm=0.8) numeri più piccoli più falsi positivi e meno falsi negativi!
argomento html
'hmtl' o 'html= ' scrivi il formato HTML di previsione 'html' risulterà in
che l'output PROF sia convertito in HTML 'html=body' limita il file HTML al
La parte del tag HTML_BODY 'html=head' limita il file HTML alla parte del tag HTML_HEADER
'html=all' fornisce sia HEADER che BODY
mantieniConv
mantenere la conversione del file di input in formato HSSP
argomento keepFilter
<*|doKeepFilter=1> conserva il file HSSP filtrato
argomento keepHssp
<*|doKeepHssp=1> conserva il file HSSP intermedio
argomento keepNetDb
<*|doKeepNetDb=1> conserva i file DbNet intermedi
elenco argomento
<*|isList=1> il file di input è un elenco di file
msf converte PROF in formato MSF
bello
dare 'nice-D' per impostare il bel valore (priorità) del lavoro
noProfHead
NON copiare file con tabelle nella directory locale
noCerca
abbreviazione di doSearchFile=0, ovvero nessuna ricerca di file DB
noasci
sopprimere la scrittura di file di risultati ASCII (ovvero leggibili dall'uomo)
nohtml
sopprimere la scrittura di file di risultati HTML
non bello
il lavoro non sarà curato, cioè non eseguito con priorità più bassa
notEval
NON controllare la precisione anche quando sono note strutture
notHtmfil
NON filtrare la previsione della membrana
notHtmisit
NON controllare se l'elica della membrana è abbastanza forte
notHtmref
NON perfezionare la previsione della membrana
notHtmtop
NON topologia ad elica di membrana
nresPerLineAli
Numero di caratteri utilizzati per il file MSF. Valore predefinito: 50.
numeriMin
Numero minimo di residui per eseguire la rete, altrimenti prd=symbolPrdShort. Predefinito: 9.
optGiuria
Aggiunge il dottorato alla giuria. Predefinito: `normale, usePHD'.
Molti altri parametri cambiano l'impostazione predefinita per questo come effetto collaterale, l'elenco è
non completo:
phd, nophd, /^para(3|Both|Sec|Acc|Htm|CapH|CapE|CapHE)/, /^para?/, jct
para3
File dei parametri per sec+acc+htm. Predefinito: ` /net/PROFboth_best.par'.
paraAcc
File di parametri per acc. Predefinito: ` /net/PROFacc_best.par'.
paraEntrambi
File di parametri per sec+acc. Predefinito: ` /net/PROFboth_best.par'.
paraSez
File parametri per sec. Predefinito: ` /net/PROFsec_best.par'.
riSubAcc
Indice di affidabilità minimo (RI) per il sottoinsieme PROFacc. Predefinito: 4.
riSubSez
Indice di affidabilità minimo (RI) per il sottoinsieme PROFsec. Predefinito: 5.
riSubSym
Simbolo per i residui previsti con RI < riSubSec/Acc. Predefinito: `.'.
Salta
problemi, manuale, suggerimenti, notazione, txt, noto, FATTO, Data, data, aa, Lhssp, numaa,
codice
saf converte PROF in formato SAF
scrAddHelp
scrGoal
commutazione di rete neurale
scrHelpTxt
Formati di file di input accettati:
hssp,dssp,msf,saf,fastamul,pirmul,fasta,pir,gcg,svizzero
scrIn
lista_di_file (o file singolo) file_parametro
scrNome
prof
scrNarg
2
sec prevedere la struttura secondaria, solo
silenzioso
nessuna informazione scritta sullo schermo - questa è l'impostazione predefinita
skipMiscante
non interrompere se manca il file di input!
file sorgente
prof
test
è solo un test (più veloce)
tradurre-jobid-in-param-valori
La stringa 'jobid' viene sostituita con $par{jobid}
tst veloce esecuzione del programma, bassa precisione
Utente
nome utente
--versione
Stampa la versione
Usa prof online utilizzando i servizi onworks.net