Dies ist der Befehl cd-hit-2d-para, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
cd-hit-2d-para.pl – Teilen Sie einen großen Clustering-Job in Teile, um cd-hit-2d oder cd-hit- auszuführen.
est-2d-Jobs
ZUSAMMENFASSUNG
cd-hit-2d-para.pl Optionen
BESCHREIBUNG
Dieses Skript unterteilt einen großen Clustering-Auftrag in Teile und sendet Aufträge an die Remote-Einheit
Computer über ein Netzwerk zu verbinden, um es parallel zu machen. Nachdem alle Arbeiten abgeschlossen sind, wird die
Das Skript führt die Clustering-Ergebnisse zusammen, als ob Sie nur ein einzelnes cd-hit-2d oder ausführen würden
cd-hit-est-2d.
Sie können es auch verwenden, um große Aufgaben auf einem einzelnen Computer aufzuteilen, wenn Ihr Computer dies tut
nicht genügend RAM (mit -L Möglichkeit).
Anforderungen:
1 Wenn Sie dieses Skript über ein Netzwerk ausführen, wird das Verzeichnis angezeigt, in dem Sie sich befinden
Führen Sie die Skripte aus und die Eingabedateien müssen auf allen Remote-Hosts verfügbar sein
identischer Weg.
2 Wenn Sie „ssh“ zum Senden von Jobs wählen, müssen Sie Folgendes tun
Passwortloses SSH zu einem beliebigen Remote-Host. Informationen zur Einrichtung finden Sie im SSH-Handbuch
Passwortloses SSH.
3 Ich schlage vor, das Warteschlangensystem anstelle von SSH zu verwenden.
Ich unterstütze derzeit PBS und SGE
4 cd-hit-2d cd-hit-est-2d cd-hit-div cd-hit-div.pl muss sein
im selben Verzeichnis, in dem sich dieses Skript befindet.
Optionen
-i Eingabedateiname für die 1. Datenbank im Fasta-Format, erforderlich
-i2 Eingabedateiname für die 2. Datenbank im Fasta-Format, erforderlich
-o Ausgabedateiname, erforderlich
--P Programm, „cd-hit-2d“ oder „cd-hit-est-2d“, Standard „cd-hit-2d“
--B Dateiname der Liste der Hosts, erforderlich, sofern nicht -Q or -L Option ist im Lieferumfang enthalten
--L Anzahl der CPUs auf dem lokalen Computer, Standardwert 0, wenn Sie ihn nicht über a ausführen
Cluster: Sie können diese Option verwenden, um große Clustering-Jobs in kleine Teile zu unterteilen.
Ich schlage vor, dass Sie einfach „--L 1“ verwenden, es sei denn, Sie haben genügend RAM für jede CPU
--S Anzahl der Segmente, in die die erste Datenbank aufgeteilt werden soll, Standard 1
--S2 Anzahl der Segmente, in die die 2. Datenbank aufgeteilt werden soll, Standard 8
--Q Anzahl der Jobs, die an das Warteschlangensystem übermittelt werden sollen, standardmäßig 0, das Programm
Verwenden Sie den SSH-Modus, um Remote-Jobs zu senden
--T Art des Warteschlangensystems, „PBS“, „SGE“ werden unterstützt, Standard-PBS
--R Neustartdatei, wird nach einem Absturz von run verwendet
-h diese Hilfe ausdrucken
Weitere cd-hit-2d/cd-hit-est-2d-Optionen können in der Befehlszeile angegeben werden
Bei Fragen, Fehlern wenden Sie sich bitte an Weizhong Li unter [E-Mail geschützt]
Verwenden Sie cd-hit-2d-para online über die Dienste von onworks.net