InglésFrancésEspañol

Ad


icono de página de OnWorks

fastq-mcf: en línea en la nube

Ejecute fastq-mcf en el proveedor de alojamiento gratuito de OnWorks sobre Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando fastq-mcf que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


fastq-mcf - ea-utils: detecta niveles de presencia de adaptadores, calcula probabilidades y ubicaciones
de los adaptadores

SINOPSIS


fastq-mcf [opciones] [compañeros1.fq ...]

DESCRIPCIÓN


Version: 1.04.676

Detecta los niveles de presencia del adaptador, calcula las probabilidades y las ubicaciones (inicio, final) del
adaptadores. Elimina las secuencias del adaptador de los archivos fastq.

Las estadísticas van a stderr, a menos que -o está especificado.

Especificar -0 para desactivar todas las configuraciones predeterminadas

Si especifica varias entradas 'paired-end', entonces un -o Se requiere una opción para cada uno. ES DECIR:
-o leer1.clip.q -o leer2.clip.fq

CAMPUS


-h Esta ayuda

-o Archivo de salida FIL (estadísticas a stdout)

-s NN Escala logarítmica para adaptación de longitud mínima del adaptador (2.2)

-t N% de umbral de ocurrencia antes del recorte del adaptador (0.25)

-m N Longitud mínima de clip, anula la escala automática (1)

-p N Porcentaje máximo de diferencia del adaptador (10)

-l N Longitud mínima de secuencia restante (19)

-L N Longitud máxima de secuencia restante (ninguna)

-D N Eliminar lecturas duplicadas: Read_1 tiene N bases idénticas (0)

-k N sKew porcentaje menos que causa la eliminación del ciclo (2)

-x Porcentaje N 'N' (lectura incorrecta) que provoca la eliminación del ciclo (20)

-q Umbral de calidad N que provoca la eliminación de la base (10)

-w Tamaño de ventana N para un recorte de calidad (1)

-H eliminar> 95% de lecturas de homopolímero (no)

-X eliminar lecturas de baja complejidad (no)

-0 Establecer todos los parámetros predeterminados en cero / no hacer nada

-U| u Forzar deshabilitar / habilitar el filtrado PF de Illumina (automático)

-P N escala Phred (automático)

-R No elimines las N de los frentes / finales de las lecturas

-n No recortes, solo muestra lo que se haría

-C N Número de lecturas que se utilizarán para el submuestreo (300k)

-S Guarde todas las lecturas descartadas en archivos '.skip'

-d Genere muchas cosas de depuración aleatoria

Quality ajuste opciones:
--ciclo-ajuste
CYC, AMT Ajustar ciclo CYC (negativo = desplazamiento desde el final) por cantidad AMT

--phred-ajuste
SCORE, AMT Ajustar la puntuación SCORE por importe AMT

--phred-ajustar-max
PUNTUACIÓN Ajustar puntuaciones> PUNTUACIÓN a SCOTE

Filtración opciones *:
- [mate-] qual-mean
NUM Puntuación de calidad media mínima

- [mate-] qual-gt
NUM, THR Al menos NUM quals> THR

- [mate-] max-ns
NUM Maxmium N-calls en una lectura (puede ser un%)

- [mate-] min-len
NUM Longitud mínima restante (igual que -l)

- homopolímero-pct
Porcentaje de filtro de homopolímero PCT (95)

--lowcomplex-pct
Porcentaje de filtro de complejidad PCT (95)

Si se usa el prefijo mate, se aplica al segundo código de solo lectura que no es de barras

Los archivos del adaptador están formateados 'fasta':

Especifique n / a para desactivar el recorte del adaptador y solo use filtros

Aumentar la escala hace que las longitudes de reconocimiento sean más largas, una escala de 100 forzará
reconocimiento completo de adaptadores.

Las secuencias de adaptador con _5p en su etiqueta coincidirán con 'end's, y las secuencias con _3p en
su etiqueta coincidirá con "inicio", de lo contrario, el "final" se determina automáticamente.

Sesgo es cuando un ciclo es pobre, 'sesgado' hacia una base en particular. Si algún nucleótido es
menor que el porcentaje de sesgo, entonces se elimina todo el ciclo. Desactivar para metil-seq,
etc.

Establecer el sesgo (-k) o N-pct (-x) a 0 para apagarlo (debe hacerse para miARN, amplicón
¡y otras situaciones de baja complejidad!)

El filtrado de lectura duplicado es apropiado para tareas de ensamblaje y nunca cuando se lee la longitud
cobertura esperada. -D 50 utilizará 4.5 GB de RAM en 100 millones de lecturas de ADN; tenga cuidado. Genial para ARN
el montaje.

* Los filtros de calidad se evalúan después del recorte / recorte

El filtrado de homopolímeros es un subconjunto de baja complejidad, pero no se realizará un seguimiento por separado
a menos que ambos estén encendidos.

Utilice fastq-mcf en línea utilizando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad