Este es el comando convert_project que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
convert_project - convierte tipos de archivos de ensamblaje y secuenciación
DESCRIPCIÓN
Este programa es parte del paquete ensamblador MIRA. Se utiliza para convertir archivos de proyecto.
tipos en otros tipos. Consulte la documentación a continuación para obtener más detalles.
información sobre convert_project.
SINOPSIS
proyecto_convertido
[-F ] [-t [-t ...]] [-aChimMsuZ] [-AcflnNoqrtvxXyz
{...}] {infile} {outfile} [ ...]
CAMPUS
-f
cargue este tipo de archivos de proyecto, donde fromtype es:
caf un ensamblaje completo o secuencias individuales de CAF
maf un ensamblaje completo o secuencias individuales de CAF
secuencias fasta de un archivo FASTA
Secuencias fastq de un archivo FASTQ
Secuencias gbf de un archivo GBF
Secuencias phd de un archivo PHD
fonnexp
secuencias en archivos EXP del archivo de nombres de archivo
-t
escribir las secuencias / ensamblaje a este tipo (múltiples menciones de -t están permitidos):
secuencias ace o ensamblaje completo a ACE
secuencias caf o ensamblaje completo a CAF
secuencias maf o ensamblaje completo a MAF
sam montaje completo a SAM
samnbb como arriba, pero dejando fuera la referencia (backbones) en los ensamblajes de mapeo
secuencias gbf o consenso a GBF
consenso de gff3 a GFF3
información de la cobertura del ensamblaje de la peluca para mover el archivo
gcwig assembly gc información de contenido para mover el archivo
secuencias fasta o consenso al archivo FASTA (cualidades para
.cualidad)
secuencias fastq o consenso al archivo FASTQ
exp secuencias o ensamblaje completo a archivos EXP en
directorios. Los ensamblajes completos son adecuados para la importación de gap4 como ensamblaje dirigido.
Nota: aunque se recomienda usar caf2gap para importar a gap4
ensamblaje completo del texto a la alineación del texto (solo cuando -f is
caf, maf o gbf)
html ensamblado completo a HTML (solo cuando -f es caf, maf o
GBF)
tcs montaje completo a tcs
hsnp que rodea las etiquetas SNP (SROc, SAOc, SIOc) a HTML (solo cuando -f es caf, maf o
GBF)
análisis asnp de etiquetas SNP (solo cuando -f es caf, maf o gbf)
cstats archivo de estadísticas de contig como de MIRA (solo cuando la fuente contiene contigs)
crlist contig read list file como de MIRA (solo cuando la fuente contiene contigs)
enmascarado
lee dónde el vector de secuenciación está enmascarado (con X) en el archivo FASTA (cualidades para
.cualidad)
secuencias scaf o ensamblaje completo a secuencias únicas CAF
-a Agregar a los archivos de destino en lugar de reescribir
-A
Cadena con parámetros MIRA a analizar Útil cuando se configuran parámetros que afectan
consenso llamando como -CO: mrpg, etc. Por ejemplo: -a "454_SETTINGS -CO: mrpg = 3 "
-b Datos ciegos Reemplaza todas las bases en lecturas / contigs con una 'c'
-C Realice un clip duro para lecturas Al leer formatos que definen puntos de corte,
guarde solo la parte no recortada en el archivo de resultados.
Se aplica solo a archivos / formatos que no contienen
contigios
-d Eliminar columnas de espacio solo cuando la salida es contigs: eliminar columnas que están
completamente vacíos (como después de haber eliminado lecturas durante la edición en gap4 o similar)
Cuando se lee la salida: elimine los espacios en las lecturas
-F Filtrar para leer grupos Caso de uso especial, no usar todavía.
-m Hacer contigs (solo para -t = caf o maf) Encajone lecturas individuales como contig singlets en
el archivo CAF / MAF.
-n
cuando se proporciona, selecciona solo lecturas o contigs dadas por nombre en ese archivo.
-i cuando -n se utiliza, invierte la selección
-o Desplazamiento de calidad fastq (solo para -f = 'fastq') Compensación de valores de calidad en FASTQ
expediente. El valor predeterminado de 0 intenta reconocer automáticamente.
-Q
Establecer la calidad predeterminada para las bases en los tipos de archivo sin valores de calidad.
no se detiene si faltan archivos de calidad esperada (por ejemplo, '.fasta')
-R
Cambiar el nombre de contigs / singlets / reads con la cadena de nombre de pila a la que se le asigna un contador
adjunto. Error conocido: creará nombres duplicados si se ingresa
contiene contigs / singlets así como lecturas libres, es decir, no lee en contigs ni
camisetas sin mangas.
-S
(nombre) Esquema para cambiar el nombre de las lecturas, importante para extremos emparejados Solo 'solexa' es
actualmente soportado.
El siguiendo interruptores trabajo , solamente cuando Las opciones de entrada (COSTE Y FLETE or MAF) contiene contigios
Atención: CAF y MAf también pueden contener solo lecturas.
-M No extraiga contigs (o su consenso), pero la secuencia de las lecturas son
compuesto de.
-N
como -n, pero ordena la salida según el orden dado en el archivo.
-r [cCqf]
Vuelva a calcular el consenso y / o los valores de calidad del consenso y / o las etiquetas de características de SNP.
'c' recalc cualidades contras y contras (con IUPAC) 'C' recalc cualidades contras y contras
(forzando no IUPAC) 'q' recalc las cualidades de consenso solo 'f' recalc las características del SNP
Nota: solo el último de cCq es relevante, f funciona como un
cambiar y se puede combinar con cQq (por ejemplo, "-r C -r F")
Nota: si el CAF / MAF contiene múltiples cepas, recálculo de contras y contras
las cualidades son forzadas, tu
simplemente puede influir en si se utilizan o no IUPAC.
-s dividir la salida en varios archivos en lugar de crear un solo archivo
-u 'Rellenar genomas de cepas' Rellenar los agujeros en el genoma de una cepa (N o @) con
secuencia de un consenso de otras cepas Tiene efecto sólo con -r y -t gbf o
fasta / q en FASTA / Q: las bases llenas están en minúsculas en GBF: las bases llenas están
en mayúsculas
-q
Define la calidad mínima que debe tener una base de consenso de una cepa, bases de consenso
debajo de esto será 'N' Predeterminado: 0 Solo se usa con -ry -f es caf / maf y -t is
(fasta
o gbf)
-v Imprime el número de versión y sal
-x
Longitud mínima de lectura o contig Al cargar, deseche todas las contigs / lecturas con un
longitud menor que este valor. Predeterminado: 0 (= desactivado) Nota: no se aplica a las lecturas
en contigs!
-X
Similar a -x pero se aplica solo a las lecturas y luego a la longitud recortada.
-y
Cobertura de contig promedio mínimo Al cargar, deseche todos los contigs con un promedio
cobertura menor que este valor. Predeterminado: 1
-z
Número mínimo de lecturas en contig Al cargar, descarte todos los contigs con un número
de lee menos que este valor. Predeterminado: 0 (= apagado)
-l
cuando se envía como texto o HTML: número de bases que se muestran en una línea de alineación. Defecto:
60.
-c
cuando se envía como texto o HTML: carácter utilizado para rellenar los espacios finales. Predeterminado: '' (en blanco)
Alias: caf2html, exp2fasta, ... etc. Cualquier combinación de " 2 "
se puede usar como nombre de programa (también usando enlaces) para que convert_project automáticamente
conjuntos -f y -t en consecuencia.
EJEMPLOS
convertir_proyecto fuente.maf dest.sam
convert_project source.caf dest.fasta peluca ace
convert_project -x 2000 -y 10 fuente.caf dest.caf
caf2html -l 100 -c. source.caf dest
Use convert_project en línea usando los servicios de onworks.net