Dit is de opdracht hhsearch die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online-emulator of MAC OS online-emulator
PROGRAMMA:
NAAM
hhsearch - doorzoek een database met HMM's met een query-uitlijning of query HMM
KORTE INHOUD
hhzoeken -i vraag -d databank [opties]
PRODUCTBESCHRIJVING
HHsearch versie 2.0.16 (januari 2013) Doorzoek een database met HMM's met een query-uitlijning of
vraag HMM (C) Johannes Soeding, Michael Remmert, Andreas Biegert, Andreas Hauser Soding,
J. Detectie van eiwithomologie door HMM-HMM-vergelijking. Bioinformatica 21:951-960 (2005).
-i
invoer/query uitlijning van meerdere reeksen (a2m, a3m, FASTA) of HMM
-d
HMM-database van aaneengeschakelde HMM's in hhm-, HMMER- of a3m-indeling OF, als het bestand
extensie pal, lijst met HMM-bestandsnamen, één per regel. Meerdere dbs, HMM's of pal
bestanden met -d ' ...'
kan overal 'stdin' of 'stdout' zijn.
uitgang opties:
-o
schrijf resultaten in standaard formaat naar bestand (default= )
-Ofas
schrijf paarsgewijze uitlijningen van significante overeenkomsten in FASTA-formaat Analoog voor
uitvoer in a3m-, a2m- en psi-formaat (bijv -Oa3m)
-oa3m
schrijf MSA van significante overeenkomsten in a3m-formaat Analoog voor uitvoer in a2m, psi,
en hhm-formaat (bijv - ohhm)
-e [0,1]
E-waardegrens voor opname in meervoudige uitlijning (def=0.001)
-volg
max. aantal weergegeven query-/sjabloonreeksen (def=1) Pas op voor overflows! Alle
deze reeksen worden in het geheugen opgeslagen.
-nadelen toon consensussequentie als hoofdsequentie van query-MSA
-nocons
toon geen consensusreeks in uitlijningen (standaard=toon)
-genopred
toon geen voorspelde 2e structuur in uitlijningen (standaard=toon)
-knikkensp
DSSP 2ndary-structuur niet weergeven in uitlijningen (standaard=show)
-ssconf
betrouwbaarheid tonen voor voorspelde 2e structuur in uitlijningen
-p
minimale waarschijnlijkheid in samenvatting en afstemmingslijst (def=20)
-E
maximale E-waarde in samenvatting en uitlijningslijst (def=1E+06)
-Z
maximaal aantal regels in samenvatting hitlijst (def=500)
-z
minimum aantal regels in samenvatting hitlijst (def=10)
-B
maximaal aantal uitlijningen in uitlijningslijst (def=500)
-b
minimum aantal uitlijningen in uitlijningslijst (def=10)
-alwaar [40,..[
aantal kolommen per regel in uitlijningslijst (def=80)
-dbstrlen
maximale lengte van databasestring die moet worden afgedrukt in hhr-bestand
Filter query meerdere sequentie-uitlijning
-ID kaart [0,100] maximale paarsgewijze sequentie-identiteit (%) (def=90)
-verschil [0,inf[
filter MSA door de meest uiteenlopende set sequenties te selecteren, waarbij u er minstens zoveel behoudt
seqs in elk MSA-blok met een lengte van 50 (def=100)
-cov [0,100] minimale dekking met query (%) (def=0)
-goed [0,100] minimale sequentie-identiteit met query (%) (def=0)
-qsc [0,100] minimale score per kolom met query (def=-20.0)
-nef [1,inf]
doeldiversiteit van uitlijning (standaard=uit)
Invoer opstelling formaat:
-M a2m gebruik A2M/A3M (standaard): hoofdletters = Match; kleine letter = Invoegen; '-' = Verwijderen; '.' =
openingen uitgelijnd met inzetstukken (kan worden weggelaten)
-M eerste
gebruik FASTA: kolommen met een residu in de 1e reeks zijn match-statussen
-M [0,100]
gebruik FASTA: kolommen met minder dan X% tussenruimten zijn overeenkomststatussen
-tags neutraliseer GEEN His-, C-myc-, FLAG-tags en trypsine-herkenningssequentie
achtergrond distributie
HMM-HMM opstelling opties:
-niet uitlijnen
lijn de weergegeven treffers NIET opnieuw uit met het MAC-algoritme (def=realign)
-mac [0,1[
posterieure waarschijnlijkheidsdrempel voor MAC-heruitlijning (def=0.350) Parametercontroles
uitlijning hebzucht: 0:global >0.1:local
-bol/-loc
gebruik globale/lokale uitlijningsmodus voor zoeken/ranken (def=local)
-alt
toon zoveel significante alternatieve uitlijningen (def=2)
-vit gebruik het Viterbi-algoritme voor zoeken/rangschikken (standaard)
-Mac gebruik Maximum Accuracy (MAC) algoritme voor zoeken/ranken
-naar voren
gebruik Voorwaartse waarschijnlijkheid om te zoeken
-excl
zoekposities uitsluiten van de uitlijning, bijv. '1-33,97-168'
-verschuiving [-1,1]
score-offset (def=-0.03)
-corr [0,1]
gewicht van de term voor paarcorrelaties (def=0.10)
-sc aminozuurscore (tja: template HMM bij kolom j) (def=1)
0 = log2 Som(tja*qia/pa) (pa: aa achtergrondfrequenties)
1 = log2 Som(tja*qia/pqa) (pqa = 1/2*(pa+ta) )
2 = log2 Sum(tja*qia/ta) (ta: gem. aa freqs in template)
3 = log2 Sum(tja*qia/qa) (qa: gem. aa freqs in query)
5 lokale correctie van de aminozuursamenstelling
-sm {0,...,4}
0: geen ss scoren 1,2: ss scoren na of tijdens uitlijning [standaard=2] 3,4: ss
scoren na of tijdens uitlijning, voorspeld versus voorspeld
-ssw [0,1] gewicht van ss-score vergeleken met kolomscore (def=0.11)
-sa [0,1] SS-substitutiematrix = (1-ssa)*I + ssa*volledige SS-substitutiematrix
[def=1.00)
kloof kosten opties:
-gap [0,inf[
Overgang pseudocount bijmenging (def=1.00)
-gapd [0,inf[
Overgang pseudocount bijmenging voor open opening (standaard=0.15)
- gapen [0,1.5]
Overgang pseudocount-toevoeging voor verlengde opening (def=1.00)
-gapf ]0,inf]
factor om de gap open penalty voor deletes te verhogen/verlagen (def=0.60)
-gap ]0,inf]
factor om de gap open penalty voor inserts te verhogen/verlagen (def=0.60)
-gat ]0,inf]
factor om de boete voor het verlengen van de opening voor verwijderingen te vergroten/verkleinen (def=0.60)
-gapi ]0,inf]
factor om de boete voor het verlengen van de opening voor wisselplaten te vergroten/verkleinen (def=0.60)
-bijv [0,inf[ penalty (bits) voor end gaps die zijn uitgelijnd met queryresiduen (def=0.00)
-egt [0,inf[ boete (bits) voor eindopeningen uitgelijnd met sjabloonresiduen (def=0.00)
Pseudotelling (pc) opties:
-pcm {0,...,3}
positieafhankelijkheid van pc-bijmenging 'tau' (pc-modus, standaard=2) 0: geen pseudo-tellingen:
tau = 0 1: constant tau = a 2: diversiteitsafhankelijk: tau = a/(1 +
((Neff[i]-1)/b)^c) (Neff[i]: aantal effectieve seqs in lokale MSA rond kolom i)
3: pseudotellingen met constante diversiteit
-pc [0,1] algehele pseudocount-bijmenging (def=1.0)
-printplaat [1,inf[ Neff drempelwaarde voor -pcm 2 (standaard=1.5)
-pcc [0,3] extinctie-exponent c voor -pcm 2 (standaard=1.0)
Contextspecifiek pseudo-tellingen:
-geencontext
gebruik substitutiematrix in plaats van contextspecifieke pseudocounts
-context contextbestand voor het berekenen van contextspecifieke pseudocounts
(standaard=./data/context_data.lib)
-cslib
kolomstatusbestand voor snelle databasevoorfiltering (default=./data/cs219.lib)
-csw [0,inf] gewicht van centrale positie in cs pseudocount-modus (def=1.6)
-csb [0,1] gewichtsvervalparameter voor posities in cs pc-modus (def=0.9)
Overige opties:
-CPU
aantal te gebruiken CPU's (voor SMP's met gedeeld geheugen) (standaard=1)
-v
uitgebreide modus: 0: geen schermuitvoer 1: alleen waarschuwingen 2: uitgebreide
-maxres
max. aantal HMM-kolommen (def=15002)
-maximum [1,inf[ maximaal beschikbaar geheugen in GB (def=3.0)
-scores noteer scores voor alle paarsgewijze vergelijkingen om op te slaan
-kalm {0,..,3} empirische scorekalibratie van 0:query 1:template 2:both
standaard 3: op neurale netwerken gebaseerde schatting van EVD-parameters
Voorbeeld: hhzoeken -i a.1.1.1.a3m -d scop70_1.71.hhm
Gebruik hhsearch online met behulp van onworks.net-services