Dies ist der Befehl „cutadapt“, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann
PROGRAMM:
NAME/FUNKTION
Cutadapt – Handbuchseite für Cutadapt 1.8.3
BESCHREIBUNG
Cutadapt-Version 1.8.3 Copyright © 2010-2015 Marcel Martin[E-Mail geschützt] >
Cutadapt entfernt Adaptersequenzen aus Sequenzierungslesevorgängen mit hohem Durchsatz.
Verwendung:
Cutadapt -a ADAPTER [Optionen] [-o Ausgabe.fastq] Eingabe.Fastq
Für gepaartes Ende lautet:
Cutadapt -a ADAPT1 -A ADAPT2 [Optionen] -o out1.fastq -p out2.fastq in1.fastq
in2.fastq
Ersetzen Sie „ADAPTER“ durch die tatsächliche Reihenfolge Ihres 3‘-Adapters. IUPAC-Platzhalterzeichen
sind unterstützt. Das umgekehrte Komplement wird *nicht* automatisch gesucht. Alles liest von
input.fastq wird nach entfernter Adaptersequenz in Output.fastq geschrieben. Adapter
Matching ist fehlertolerant. Es können mehrere Adaptersequenzen angegeben werden (weiter verwenden). -a
Optionen), aber nur der am besten passende Adapter wird entfernt.
Die Eingabe kann auch im FASTA-Format erfolgen. Komprimierte Ein- und Ausgabe wird unterstützt und
automatisch anhand des Dateinamens erkannt (.gz, .xz, .bz2). Verwenden Sie für Standard den Dateinamen „-“.
Input-Output. Ohne das -o Option wird die Ausgabe an die Standardausgabe gesendet.
Manche Andere verfügbar Funktionen sind:
* Diverse weitere Adaptertypen (5‘-Adapter, „gemischte“ 5‘/3‘-Adapter etc.) *
Trimmen einer festen Anzahl von Basen * Qualitätstrimmen * Trimmen des Farbraums lautet *
Filtern von Lesevorgängen nach verschiedenen Kriterien
Verwenden Sie „cutadapt --help" um alle Befehlszeilenoptionen anzuzeigen. Siehe
http://cutadapt.readthedocs.org/ für eine vollständige Dokumentation.
OPTIONAL
--Version
Versionsnummer des Programms anzeigen und beenden
-h, --help
Diese Hilfemeldung anzeigen und beenden
-f FORMAT, --Format=FORMAT
Eingabedateiformat; kann entweder „fasta“, „fastq“ oder „sra-fastq“ sein. Wann ignoriert
Lesen von csfasta/qual-Dateien (Standard: automatische Erkennung anhand der Dateinamenerweiterung).
Optionen, die beeinflussen, wie die Adapter gefunden werden:
Jeder der folgenden drei Parameter (-a, -b, -g) kann mehrfach verwendet werden und
in beliebiger Kombination, um nach einem ganzen Satz möglicherweise unterschiedlicher Adapter zu suchen
Typen. Bei jedem Lesevorgang wird nur der am besten passende Adapter gekürzt (siehe jedoch).
--mal Möglichkeit). Anstatt direkt einen Adapter anzugeben, können Sie auch schreiben
file:FILE und die Adaptersequenzen werden aus der angegebenen DATEI gelesen (was sein muss).
im FASTA-Format).
-a ADAPTER, --Adapter=ADAPTER
Sequenz eines Adapters, der an das 3'-Ende ligiert wurde. Der Adapter selbst und
alles, was folgt, wird gekürzt. Wenn die Adaptersequenz mit dem „$“ endet
Zeichen ist der Adapter am Ende des Lesevorgangs verankert und wird nur gefunden, wenn es sich um ein handelt
Suffix des gelesenen.
-g ADAPTER, --Vorderseite=ADAPTER
Sequenz eines Adapters, der an das 5'-Ende ligiert wurde. Wenn die Adaptersequenz
beginnt mit dem Zeichen „^“, der Adapter ist „verankert“. Ein verankerter Adapter muss vorhanden sein
erscheint vollständig am 5'-Ende des Lesevorgangs (es ist ein Präfix des Lesevorgangs). A
Ein nicht verankerter Adapter kann teilweise am 5-Fuß-Ende erscheinen oder innerhalb des XNUMX-Fuß-Endes auftreten
lesen. Wenn es innerhalb eines Lesevorgangs gefunden wird, ist es auch die Sequenz vor dem Adapter
getrimmt. In allen Fällen wird der Adapter selbst beschnitten.
-b ADAPTER, --überall=ADAPTER
Sequenz eines Adapters, der an das 5'- oder 3'-Ende ligiert wurde. Wenn der Adapter ist
Wird es innerhalb des Lesevorgangs gefunden oder überlappt es das 3'-Ende des Lesevorgangs, ist das Verhalten das
das Gleiche wie für die -a Möglichkeit. Wenn der Adapter das 5'-Ende (Anfang des) überlappt
read), der erste Teil des Lesevorgangs, der zum Adapter passt, wird gekürzt, aber
alles, was folgt, bleibt erhalten.
-e FEHLERRATE, --Fehlerrate=FEHLERRATE
Maximal zulässige Fehlerrate (Anzahl der Fehler geteilt durch die Länge des Abgleichs).
Region) (Standard: 0.1)
--no-indels
Erlauben Sie keine Indels in den Ausrichtungen (lassen Sie nur Abweichungen zu). Derzeit nur
Unterstützt für verankerte Adapter. (Standard: sowohl Nichtübereinstimmungen als auch Indels zulassen)
-n ZÄHLEN, --mal=ANZAHL
Versuchen Sie, die Adapter höchstens COUNT Mal zu entfernen. Nützlich, wenn ein Adapter angehängt wird
mehrmals (Standard: 1).
-O LÄNGE, --Überlappung=LÄNGE
Mindestüberlappungslänge. Wenn die Überlappung zwischen dem Lesevorgang und dem Adapter kürzer ist
größer als LENGTH ist, wird der Lesevorgang nicht geändert. Dies reduziert die Nr. von Basen rein getrimmt
aufgrund kurzer zufälliger Adapterübereinstimmungen (Standard: 3).
--match-read-wildcards
IUPAC-Platzhalter bei Lesevorgängen zulassen (Standard: Falsch).
-N, --no-match-adapter-wildcards
Interpretieren Sie keine IUPAC-Platzhalter in Adaptern.
Optionen zum Filtern verarbeiteter Lesevorgänge:
--discard-trimmed, --verwerfen
Verwerfen Sie Lesevorgänge, die den Adapter enthalten, anstatt sie zu kürzen. Auch verwenden -O in
um zu vermeiden, dass zu viele zufällig übereinstimmende Lesevorgänge weggeworfen werden!
--discard-untrimming, --trimmed-only
Lesevorgänge verwerfen, die den Adapter nicht enthalten.
-m LÄNGE, --minimale Länge=LÄNGE
Verwerfen Sie gekürzte Lesevorgänge, die kürzer als LENGTH sind. Lesevorgänge, die sogar zu kurz sind
vor dem Entfernen des Adapters werden ebenfalls verworfen. Im Farbraum ist ein anfänglicher Primer nicht vorhanden
gezählt (Standard: 0).
-M LÄNGE, --maximale Länge=LÄNGE
Verwerfen Sie gekürzte Lesevorgänge, die länger als LENGTH sind. Lesevorgänge, die sogar zu lang sind
vor dem Entfernen des Adapters werden ebenfalls verworfen. Im Farbraum ist ein anfänglicher Primer nicht vorhanden
gezählt (Standard: keine Begrenzung).
--no-trimmen
Ordnen Sie Lesevorgänge wie gewohnt zu und leiten Sie sie zur Ausgabe/ungekürzten Ausgabe um, entfernen Sie sie jedoch nicht
Adapter.
--max-n=LÄNGE
Der maximal zulässige Anteil von Ns in einem Lesevorgang. Eine Zahl < 1 wird als a behandelt
Anteil, während eine Zahl > 1 als maximale Anzahl von Ns behandelt wird
enthalten.
--mask-adapter
Maskieren Sie Adapter mit „N“-Zeichen, anstatt sie zu kürzen.
Optionen, die beeinflussen, was wohin ausgegeben wird:
--ruhig
Drucken Sie am Ende keinen Bericht aus.
-o DATEI, --Ausgabe=FILE
Geänderte Lesevorgänge in die DATEI schreiben. Je nach Eingabe wird das FASTQ- oder FASTA-Format gewählt.
Der zusammenfassende Bericht wird an die Standardausgabe gesendet. Verwenden Sie „{name}“ in FILE zum Demultiplexen
liest in mehrere Dateien. (Standard: Gekürzte Lesevorgänge werden in die Standardausgabe geschrieben)
--info-Datei=FILE
Schreiben Sie Informationen zu jedem Lesevorgang und seinen Adapterübereinstimmungen in die Datei. Siehe die
Dokumentation zum Dateiformat.
-r DATEI, --rest-Datei=FILE
Wenn der Adapter während eines Lesevorgangs übereinstimmt, schreiben Sie den Rest (nach dem
Adapter) in DATEI.
--wildcard-datei=FILE
Wenn der Adapter Platzhalterbasen ('N's) hat, schreiben Sie Adapterbasen, die mit Platzhaltern übereinstimmen
Positionen in die Datei. Wenn in der Ausrichtung Indels vorhanden sind, ist dies häufig nicht der Fall
genau.
--too-short-output=FILE
Schreibe Lesevorgänge, die zu kurz sind (entsprechend der von angegebener Länge). -m) einordnen.
(Standard: Lesevorgänge verwerfen)
--too-long-output=FILE
Schreibe Lesevorgänge, die zu lang sind (gemäß der von angegebener Länge). -M) einordnen.
(Standard: Lesevorgänge verwerfen)
--untrimmed-output=FILE
Schreiben Sie Lesevorgänge, die den Adapter nicht enthalten, in FILE. (Standard: Ausgabe in dieselbe Datei
wie getrimmt lautet)
Zusätzliche Änderungen an den Lesevorgängen:
-u LÄNGE, --schneiden=LÄNGE
Entfernen Sie LENGTH-Basen vom Anfang oder Ende jedes Lesevorgangs. Wenn LENGTH positiv ist,
Die Basen werden am Anfang jedes Lesevorgangs entfernt. Wenn LENGTH negativ ist, ist die
Basen werden am Ende jedes Lesevorgangs entfernt. Diese Option kann zweimal angegeben werden, wenn
die LÄNGEN haben unterschiedliche Vorzeichen.
-q [5'CUTOFF,]3'CUTOFF, --quality-cutoff=[5'CUTOFF,]3'CUTOFF
Schneiden Sie minderwertige Basen an den 5'- und/oder 3'-Enden der Lesevorgänge ab, bevor Sie den Adapter entfernen. Wenn
Es wird ein Wert angegeben, nur das 3'-Ende wird beschnitten. Wenn zwei durch Kommas getrennte Cutoffs sind
gegeben, das 5'-Ende wird mit dem ersten Cutoff beschnitten, das 3'-Ende mit dem zweiten. Der
Der Algorithmus ist derselbe wie der von BWA verwendete (siehe Dokumentation). (Standard: Nein
Trimmen)
--quality-base=QUALITÄT_BASIS
Gehen Sie davon aus, dass Qualitätswerte als ASCII (Qualität + QUALITÄTSBASE) codiert sind. Der
Der Standardwert (33) ist normalerweise korrekt, außer bei Lesevorgängen, die von einigen Versionen von erzeugt werden
Illumina-Pipeline, wobei dies auf 64 eingestellt werden sollte. (Standard: 33)
--trim-n
Schneiden Sie Ns an den Enden der Lesevorgänge ab.
-x PRÄFIX, prefix=PRÄFIX
Fügen Sie dieses Präfix hinzu, um Namen zu lesen
-y SUFFIX, --Suffix=SUFFIX
Fügen Sie dieses Suffix hinzu, um Namen zu lesen
--strip-suffix=STRIP_SUFFIX
Entfernen Sie dieses Suffix aus Lesenamen, falls vorhanden. Kann mehrfach gegeben werden.
-c, --Farbraum
Farbraummodus: Schneiden Sie auch die Farbe ab, die an den gefundenen Adapter angrenzt.
-d, --double-encode
Im Farbraum kodieren Sie die Farben doppelt (ordnen Sie 0,1,2,3,4 A,C,G,T,N zu).
-t, --trim-primer
Schneiden Sie im Farbraum die Grundierungsbasis und die erste Farbe (den Übergang) ab
zum ersten Nukleotid)
--strip-f3
Für Farbraum: Entfernen Sie das Suffix _F3 von Lesenamen
--maq, --bwa
MAQ- und BWA-kompatible Farbraumausgabe. Das ermöglicht -c, -d, -t, --strip-f3 und
-y '/1'.
--length-tag=TAG
Suchen Sie im Beschreibungsfeld des Lesevorgangs nach TAG gefolgt von einer Dezimalzahl.
Ersetzen Sie die Dezimalzahl durch die korrekte Länge des gekürzten Messwerts. Für
Beispiel, verwenden --length-tag „length=“, um Felder wie „length=123“ zu korrigieren.
--no-zero-cap
Ändern Sie negative Qualitätswerte nicht in Null. Farbraumqualitätswerte von -1
würden in der Ausgabe-FASTQ-Datei als Leerzeichen erscheinen. Da viele Tools Probleme haben
Dadurch werden negative Qualitäten beim Trimmen von Farbraumdaten auf Null umgewandelt.
Nutzen Sie diese Option, um negative Eigenschaften beizubehalten.
-z, --zero-cap
Negative Qualitätswerte auf Null ändern. Dies ist standardmäßig aktiviert, wenn
-c/--colorspace ist ebenfalls aktiviert. Verwenden Sie die obige Option, um es zu deaktivieren.
Paired-End-Optionen:
Die -A/-G/-B/-U-Optionen funktionieren wie ihre -a/-b/-g/-u Gegenstücke.
-A ADAPTER
3'-Adapter, der paarweise vom zweiten Lesegerät entfernt werden muss.
-G ADAPTER
5'-Adapter, der paarweise vom zweiten Lesegerät entfernt werden muss.
-B ADAPTER
5'/3-Adapter, der paarweise vom zweiten Lesegerät entfernt werden muss.
-U LÄNGE
Entfernen Sie LENGTH-Basen vom Anfang oder Ende jedes Lesevorgangs (siehe --schneiden).
-p DATEI, --paired-output=FILE
Schreiben Sie den zweiten Lesevorgang paarweise in die DATEI.
--untrimmed-paired-output=FILE
Schreiben Sie den zweiten Lesevorgang paarweise in diese DATEI, wenn im ersten Lesevorgang kein Adapter gefunden wurde
lesen. Verwenden Sie diese Option zusammen mit --untrimmed-output beim Trimmen gepaart
liest. (Standard: Ausgabe in dieselbe Datei wie die gekürzten Lesevorgänge.)
Nutzen Sie Cutadapt online über die Dienste von onworks.net
