Dies ist der Befehl prof, der im kostenlosen OnWorks-Hosting-Provider mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, Windows-Online-Emulator oder MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
prof - Prädiktor für Sekundärstruktur und Lösungsmittelzugänglichkeit
ZUSAMMENFASSUNG
Prof. [EINGABEDATEI+] [OPTIONEN]
BESCHREIBUNG
Die Sekundärstruktur wird von einem System neuronaler Netze mit einer erwarteten Bewertung vorhergesagt
durchschnittliche Genauigkeit > 72 % für die drei Zustände Helix, Strang und Loop (Rost & Sander, PNAS,
1993, 90, 7558–7562; Rost & Sander, JMB, 1993, 232, 584–599; und Rost & Sander,
Proteine, 1994, 19, 55–72; Genauigkeitsbewertung). Ausgewertet auf dem gleichen Datensatz,
PROFsec wird mit einer um zehn Prozentpunkte höheren Drei-State-Genauigkeit bewertet als Methoden mit
nur einzelne Sequenzinformationen und mit mehr als sechs Prozentpunkten höher als
B. ein Verfahren, das auf Statistiken basierende Ausrichtungsinformationen verwendet (Levin, Pascarella, Argos &
Garnier, Prot. Eng., 6, 849–54, 1993). PHDsec-Vorhersagen haben drei Hauptmerkmale:
1. verbesserte Genauigkeit durch evolutionäre Informationen aus mehreren Sequenzabgleichen
2. verbesserte Beta-Strang-Vorhersage durch einen ausgewogenen Trainingsablauf
3. genauere Vorhersage von Sekundärstruktursegmenten durch Verwendung eines Mehrebenensystems
Die Lösungsmittelzugänglichkeit wird durch eine Bewertung der neuronalen Netzwerkmethode bei einer Korrelation vorhergesagt
Koeffizient (Korrelation zwischen experimentell beobachtetem und vorhergesagtem relativen Lösungsmittel
Zugänglichkeit) von 0.54 kreuzvalidiert an einem Satz von 238 globulären Proteinen (Rost & Sander,
Proteine, 1994, 20, 216–226; Genauigkeitsbewertung). Die Ausgabe des neuronalen Netzes
Codes für 10 Zustände relativer Zugänglichkeit. Ausgedrückt in Einheiten der Differenz
zwischen Vorhersage durch Homologiemodellierung (beste Methode) und Zufallsvorhersage (schlechteste)
Methode) ist PROFacc einem vergleichbaren neuronalen Netz um rund 26 Prozentpunkte überlegen
unter Verwendung von drei Ausgabezuständen (vergraben, intermediär, exponiert) und ohne Verwendung von Informationen von
mehrere Ausrichtungen.
Transmembranhelices in integralen Membranproteinen werden durch ein System von neuralen
Netzwerke. Das Manko des Netzwerksystems ist, dass oft zu lange Helices sind
vorhergesagt. Diese werden durch einen empirischen Filter ausgeschnitten. Die endgültige Vorhersage (Rost et al.,
Protein Science, 1995, 4, 521-533; Bewertung der Genauigkeit) hat einen erwarteten Pro-Rest
Genauigkeit von etwa 95 %. Die Anzahl der falsch positiven Ergebnisse, dh Transmembranhelices
in globulären Proteinen vorhergesagt, beträgt etwa 2%. Die neuronale Netzvorhersage von
transmembrane helices (PHDhtm) wird durch einen dynamischen programmierungsähnlichen Algorithmus verfeinert. Dies
Methode führte zu korrekten Vorhersagen aller Transmembranhelices für 89% der 131
Proteine, die in einem Kreuzvalidierungstest verwendet werden; mehr als 98% der Transmembranhelices waren
richtig vorhergesagt. Die Ausgabe dieser Methode wird verwendet, um die Topologie vorherzusagen, dh die
Orientierung des N-Terms in Bezug auf die Membran. Die erwartete Genauigkeit der
Topologievorhersage ist > 86 %. Die Vorhersagegenauigkeit ist für Eukaryonten überdurchschnittlich
Proteine und niedriger als der Durchschnitt für Prokaryonten. PHDtopology ist genauer als alle anderen
andere Methoden, die an identischen Datensätzen getestet wurden.
Wenn keine Ausgabedateioption (wie z --fileRdb or --fileOut) erhält die RDB-formatiert
Ausgabe wird geschrieben in ./INPUTFILENAME.prof wobei 'prof' die Erweiterung des ersetzt
Eingabedatei. In Ermangelung der Erweiterung wird '.prof' an den Namen der Eingabedatei angehängt.
Output Format
Das RDB-Format ist selbstannotierend, siehe Beispielausgaben in /share/profphd/prof/exa.
REFERENZEN
Rost, B. und Sander, C. (1994a). Kombination evolutionärer Informationen und neuronaler Netze zu
Vorhersage der Proteinsekundärstruktur. Proteine, 19(1), 55-72.
Rost, B. und Sander, C. (1994b). Konservierung und Vorhersage der Lösungsmittelzugänglichkeit in
Proteinfamilien. Proteine, 20(3), 216-26.
Rost, B., Casadio, R., Fariselli, P. und Sander, C. (1995). Transmembranhelices
mit einer Genauigkeit von 95 % vorhergesagt. Protein Sci, 4(3), 521-33.
OPTIONAL
Weitere Hilfe finden Sie bei den einzelnen Schlüsselwörtern. Die meisten davon sind wahrscheinlich kaputt.
ein alternatives Konnektivitätsmuster (Standard=3)
3 Sek + Acc + htm predict vorhersagen
acc prognostizieren nur die Lösungsmittelzugänglichkeit
ali Alignment zu 'menschenlesbaren' PROF-Ausgabedatei(en) hinzufügen
Bogen
Systemarchitektur (zB: SGI64|SGI5|SGI32|SUNMP|ALPHA)
ASCII
'menschenlesbare' PROF-Ausgabedatei(en) schreiben
beste
PROF mit bester Genauigkeit und längster Laufzeit
beide
Vorhersage der Sekundärstruktur und der Lösungsmittelzugänglichkeit
technische Daten
Daten= für HTML-Out: nur die Teile der geschriebenen Vorhersagen
debuggen
behalten Sie die meisten Zwischendateien bei, drucken Sie Debugging-Meldungen
dirWork
Arbeitsverzeichnis, Standard: ein temporäres Verzeichnis aus File::Temp::tempdir. Muss voll sein
qualifizierter Weg.
Bekanntermaßen zu arbeiten.
doEval
DO-Auswertung für Liste (nur für bekannte Strukturen und Listen)
doFilterHssp
Filtern Sie die Eingabe-HSSP-Datei (mit Ausnahme einiger Paare)
doHtmfil
Filtern Sie die Membranvorhersage (Standard)
doHtmisit
Prüfen Sie die Stärke der vorhergesagten Membranhelix (Standard)
doHtmref
Verfeinern Sie die Membranvorhersage (Standard)
doHtmtop
DO-Membran-Helix-Topologie (Standard)
dssp
Konvertieren Sie PROF in das DSSP-Format
erweitern
Einfügungen erweitern, wenn die Ausgabe in das MSF-Format konvertiert wird
schnell
PROF mit geringster Genauigkeit und höchster Geschwindigkeit
DateiCasp
Name der PROF-Ausgabe im CASP-Format (file.caspProf)
fileDssp
Name der PROF-Ausgabe im DSSP-Format (file.dsspProf)
DateiHtml
Name der PROF-Ausgabe im HTML-Format (file.htmlProf)
DateiMsf
Name der PROF-Ausgabe im MSF-Format (file.msfProf)
fileNotHtm
Name der Datei, die anzeigt, dass keine Membranhelix gefunden wurde
fileOut
Name der PROF-Ausgabe im RDB-Format (file.rdbProf)
Bekanntermaßen zu arbeiten.
DateiProf
Name der PROF-Ausgabe im menschenlesbaren Format (file.prof)
Gebrochen.
fileRdb
Name der PROF-Ausgabe im RDB-Format (file.rdbProf)
Bekanntermaßen zu arbeiten.
fileSaf
Name der PROF-Ausgabe im SAF-Format (file.safProf)
Filter
Filtern Sie die Eingabe-HSSP-Datei (mit Ausnahme einiger Paare)
gut
PROF mit guter Genauigkeit und moderater Geschwindigkeit
Graph
ASCII-Grafik zu 'menschenlesbaren' PROF-Ausgabedatei(en) hinzufügen
htm-Verwendung: 'htm= ' gibt die minimale erkannte Transmembranhelix an, Standard ist 'htm=0'
(bzw. htm=0.8) kleinere Zahlen mehr falsch positive und weniger falsch negative!
html-Argument
'hmtl' oder 'html= ' schreibe das HTML-Format der Vorhersage 'html' führt zu
dass die PROF-Ausgabe in HTML konvertiert wird 'html=body' beschränkt die HTML-Datei auf die
HTML_BODY-Tag-Teil 'html=head' beschränkt die HTML-Datei auf den HTML_HEADER-Tag-Teil
'html=all' gibt sowohl HEADER als auch BODY
KeepConv
Behalten Sie die Konvertierung der Eingabedatei in das HSSP-Format bei
KeepFilter-Argument
<*|doKeepFilter=1> behält die gefilterte HSSP-Datei bei
keepHssp-Argument
<*|doKeepHssp=1> behält die HSSP-Zwischendatei bei
KeepNetDb-Argument
<*|doKeepNetDb=1> behält die Zwischen-DbNet-Datei(en) bei
Listenargument
<*|isList=1> Eingabedatei ist eine Liste von Dateien
msf PROF in das MSF-Format konvertieren
schön
gib 'nice-D', um den nice-Wert (Priorität) des Jobs festzulegen
neinProfHead
Datei mit Tabellen NICHT in lokales Verzeichnis kopieren
keineSuche
Kurzform für doSearchFile=0, dh kein Durchsuchen von DB-Dateien
noascii
Unterdrücken Sie das Schreiben von ASCII-Ergebnisdateien (dh für Menschen lesbare)
neinhtml
unterdrücken Sie das Schreiben von HTML-Ergebnisdateien
nicht nett
Job wird nicht netto, dh nicht mit niedrigerer Priorität ausgeführt
notEval
Überprüfen Sie die Genauigkeit NICHT, auch wenn bekannte Strukturen
nichtHtmfil
Filtern Sie NICHT die Membranvorhersage
nichtHtmisit
NICHT prüfen, ob die Membranhelix stark genug ist
nichtHtmref
verfeinern Sie NICHT die Membranvorhersage
nichtHtmtop
KEINE Membranhelix-Topologie
nresPerLineAli
Anzahl der Zeichen, die für die MSF-Datei verwendet werden. Standard: 50.
ZahlenMin
Minimale Anzahl von Resten zum Ausführen des Netzwerks, andernfalls prd=symbolPrdShort. Standard: 9.
optJury
Fügt der Jury einen Doktortitel hinzu. Standard: `normal,PHD verwenden'.
Viele andere Parameter ändern als Nebeneffekt die Standardeinstellung für diesen, die Liste ist
nicht umfassend:
phd, nophd, /^para(3|Both|Sec|Acc|Htm|CapH|CapE|CapHE)/, /^para?/, jct
para3
Parameterdatei für sec+acc+htm. Standard: ` /net/PROFboth_best.par'.
paraAcc
Parameterdatei für gem. Standard: ` /net/PROFacc_best.par'.
paraBeide
Parameterdatei für sec+acc. Standard: ` /net/PROFboth_best.par'.
paraSec
Parameterdatei für sek. Standard: ` /net/PROFsec_best.par'.
riSubAcc
Minimaler Reliabilitätsindex (RI) für die Teilmenge PROFacc. Standard: 4.
riSubSec
Minimaler Reliabilitätsindex (RI) für Teilmenge PROFsec. Standard: 5.
riSubSym
Symbol für Rückstände, die mit RI < riSubSec/Acc. Vorgabe: `.'.
überspringen
Probleme, Handbuch, Hinweise, Notation, TXT, bekannt, FERTIG, Datum, Datum, aa, Lhssp, numaa,
Code
saf PROF in das SAF-Format konvertieren
scrAddHelp
scrGoal
Vermittlung von neuronalen Netzen
scrHelpTxt
Akzeptierte Eingabedateiformate:
hssp,dssp,msf,saf,fastamul,pirmul,fasta,pir,gcg,swiss
scrIn
list_of_files (oder einzelne Datei) parameter_file
scrName
profi
scrNarg
2
sec Vorhersage der Sekundärstruktur, nur
still
keine Informationen auf den Bildschirm geschrieben - dies ist die Standardeinstellung
überspringenVermisst
bei fehlender Eingabedatei nicht abbrechen!
Quelldatei
profi
Test
ist nur ein Test (schneller)
Jobid-in-Param-Werte übersetzen
String 'jobid' wird durch $par{jobid} ersetzt
tst schneller Programmdurchlauf, geringe Genauigkeit
Benutzer
Benutzername
--Version
Druckversion
Verwenden Sie prof online mit den onworks.net-Diensten