GoGPT Best VPN GoSearch

icono de página de OnWorks

PerM: en línea en la nube

Ejecute PerM en el proveedor de alojamiento gratuito de OnWorks a través de Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando PerM que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


permanente - Mapeo eficiente de lecturas cortas con semillas espaciadas periódicas

Si tiene alguna pregunta sobre el uso, envíe un correo electrónico a "yanghoch at usc dot edu".

SINOPSIS


Para usar la línea de comando, escriba permanente con los argumentos en el orden.

EJEMPLOS


Para los ensayos clínicos de CRISPR, un solo extremo dice lo siguiente:

permanente Ref. Lee [opciones]

Ejemplos:

permanente Ref.fasta Reads.fasta -v 5 -o out.mapping -u ummappedReads.fa

permanente RefFilesList.txt ReadsSetFilesList.txt -v 5 -u UnmappedReads.fa -E

permanente Ref.fasta Reads.csfasta -v 5 -m -s my.index --delimiter ´, ´ --seed F3

permanente my.index SingleEndReads.csfasta -v 5 -o out.sam -k 10 -a ambiguo10.csfasta

Para los ensayos clínicos de CRISPR, extremo emparejado dice lo siguiente:

permanente Ref. -1 F3_Lecturas -2 R3_Lecturas [opciones]

Ejemplos:

permanente ref.fa -1 F3.fa -2 R3.fa -U 3000 -L 100 -v 5 -A -m -s -o out.sam

permanente ref.txt -1 F3.fq -2 R3.fq -v 5 -m -s mi.índice -o out.mapping --seed F3

permanente mi.índice -1 F3.fq -2 R3.fq -U 3000 -L 100 -v 5 -A -o fuera.sam

A construimos an índice sólo:

permanente Ref. Longitud_de_lectura --formato de lectura <.csfasta | .fasta> -m -s índice camino --semilla F3

Ejemplo:

permanente hg18.txt 50 --formato de lectura .csfasta -m -s hg18_50_SOLiD.índice

OPCIONES


Requerido Argumentos

· El archivo de referencia debe estar en formato FASTA con el .fasta, .fna o .fa
extensión de archivo. Para un transcriptoma con múltiples genes o isoformas como referencia,
concatenar todas las secuencias FASTA en un solo archivo FASTA. Alternativamente, si hay
muchos archivos, por ejemplo uno por cromosoma, por ejemplo: chr1.fa a chrY.fa, enumere el FASTA
nombres de archivo uno por línea en un archivo que tiene la .TXT extensión. los .TXT es importante
porque PerM examina la extensión del archivo para saber si el archivo de entrada es una lista de
nombres de archivo. Los nombres de archivo deben incluir la ruta del archivo (relativa o absoluta) a menos que
los archivos FASTA están todos en el mismo directorio desde el que se ejecuta PerM.

· Los archivos leídos deben estar en formato .fasta, .fastq, .csfasta o .csfastq. Permanente
analiza un archivo de acuerdo con su extensión, o el formato especificado explícitamente por el
--formato de lectura bandera. Si hay varios archivos de lectura, enumere cada nombre de archivo, uno
por línea, en un archivo .txt. PerM lo toma como entrada y puede mapear múltiples conjuntos de lectura en
paralelo por [http://en.wikipedia.org/wiki/OpenMP OpenMP].

Short (agrupado by relacionado funcionalidad)

-A Salida que todas alineaciones dentro del umbral de desajuste (ver -v opción), de un extremo a otro.

-B Salida el mejor alineaciones en términos de desajustes en el umbral (ver -v opción). Para
Por ejemplo, si una lectura no tiene alineaciones de coincidencia perfecta, dos fallas de coincidencia de una sola base
alineaciones y alineaciones adicionales con más desajustes, solo los dos
Se generarán alineaciones de desajuste de base. -B es el modo predeterminado si ninguno -A or -B
está especificado.

-E Salida solo lecturas mapeadas de forma única restante después el el mejor la selección hacia abajo ha sido
aplicado si corresponde. Cuando se combina con el -A opción, solo se lee con una
alineación dentro del umbral de desajuste (ver -v opción) se emitirá.

-v Número máximo de discrepancias permitidas (o permitidas en cada extremo para lecturas de pares).
El valor predeterminado es el número de desajustes que la semilla utilizada es completamente sensible
a.

-k Especifica el número máximo de alineaciones a la salida. El valor predeterminado es 200 si el
-k no se da la bandera. Alineaciones para la asignación de lecturas a más del número máximo
posiciones no se emitirán. Utilice la opción -a para recopilar lecturas que excedieron el
máximo.

-t Número de bases en el extremo 5´ de cada lectura para ignorar. Por ejemplo, si los primeros 5
las bases se utilizan como un código de barras o para indexar varias muestras juntas, utilice -t 5. Si no
especificado, no se ignorarán las bases iniciales.

-T Número de bases en cada lectura para usar, comenzando después de las bases ignoradas por la opción -t.
Las bases posteriores en el 3´ de la lectura se ignoran. Por ejemplo, -T 30 significa usar solo
primeras 30 bases (señales) después de cualquier base ignorada debido a la opción -t.

-m Cree el índice de referencia sin reutilizar el índice guardado, incluso si está disponible.

-s camino
Guarde el índice de referencia para acelerar el mapeo en el futuro. Si camino no es
especificado, el índice se creará en el directorio de trabajo actual (es decir, donde
PerM se ejecuta desde) utilizando el nombre de índice predeterminado. Si camino es un directorio, el índice
se creará en el directorio especificado utilizando el nombre de índice predeterminado (directorio
debe existir; no se creará automáticamente). Si camino es una ruta de archivo, el
El índice se creará con el nombre especificado.

-o ruta de archivo
Nombre del archivo de salida de mapeo al mapear un solo conjunto de lectura. El formato de archivo de salida
será el formato de texto delimitado por tabulaciones .mapping o el formato SAM como
determinado por la extensión del nombre del archivo de salida. Por ejemplo {{{-o out.sam}}}
saldrá en formato SAM; {{{-o /path/to/out.mapping}}} se generará en .mapping
formato. Usar --formato de salida para anular este comportamiento. los -o la opción no aplica
cuando se mapean varios conjuntos de lecturas a la vez para aprovechar múltiples
CPU (núcleos); ver el -d opción para ese caso.

-d ruta de acceso
Directorio de salida para mapear archivos de salida al mapear varios conjuntos de lectura (salida
los archivos se nombrarán automáticamente). Si el directorio especificado no existe, el
El directorio de salida se creará siempre que exista el directorio principal. Si el -d
no se especifica el conmutador, los archivos se escribirán en el directorio desde el que se ejecuta PerM.
Nota: si -d ruta de archivo se especifica al mapear un solo conjunto de lectura, ruta de acceso se mantendrá
antepuesto a ruta de archivo; sin embargo, no se recomienda este uso.

-a ruta de archivo
Cree un archivo FASTA (FASTQ) para lecturas asignadas a más posiciones que el umbral
especificado por -k o el valor predeterminado de 200.

-b ruta de archivo
Cree un archivo FASTA (FASTQ) para lecturas más cortas de lo esperado o con
personajes extraños.

-u ruta de archivo
Cree un archivo FASTA (FASTAQ) de lecturas sin asignar. Cuando se asigna un solo conjunto de lectura,
nombre de archivo especifica el nombre del archivo de salida. Cuando se mapean varios conjuntos de lectura,
nombre de archivo es irrelevante y debe omitirse; los archivos de secuencias no mapeadas
automáticamente se le asignará un nombre y se creará en el directorio desde el que se ejecuta PerM.

Largo

--ambiguosReadOnly
Genere solo mapeo ambiguo para encontrar repeticiones (regiones similares dentro de la sustitución
umbral). Cuando se especifica esta opción, lee el asignado al número de mapeo superior
el umbral especificado por -k todavía se imprimirá.

--ambiguosReadInOneLine
lecturas de salida asignadas a más de k lugares en una línea. Cuando esta opción es
especificado, las lecturas asignadas al umbral de número de asignación superior especificado por -k
todavía se imprimirá pero se imprimirá en una línea.

--noSamHeader
No incluya un encabezado SAM. Esto hace que sea más fácil concatenar varios SAM
archivos de salida.

--includeReadsWN
El mapa lee con N o ´.´ bases iguales o menores que el umbral especificado por
codificando N o ´.´ como A o 3. Las lecturas con más ´N´ serán descartadas. El valor por defecto
el establecimiento de descartes leídos con cualquier "N".

--solo estadísticas
Envíe las estadísticas de mapeo solo a stdout, sin guardar alineaciones en archivos.

--ignorarQS
Ignore las puntuaciones de calidad en archivos FASTQ o QUAL.

--printNM
Cuando los puntajes de calidad estén disponibles, use esta marca para imprimir el número de desajustes,
en lugar de puntuaciones no coincidentes en formato de mapeo.

--semilla {F ,, 0 ,, | F ,, 1 ,, | F ,, 2 ,, | F ,, 3 ,, | F ,, 4 ,, | S ,, 11 ,, | S ,, 20 ,, | S ,, 12 ,,}
Especifique el patrón de semillas. Las semillas F ,, 0 ,,, F ,, 1 ,,, F ,, 2 ,,, F ,, 3 ,,, y F ,, 4 ,, son
totalmente sensible a 0-4 desajustes respectivamente. Las semillas S ,, 11 ,, S ,, 20 ,, S ,, 12 ,,
están diseñados para el secuenciador SOLiD. Una semilla S ,, kj ,, es completamente sensible a k
pares de desajustes adyacentes (la firma SNP es el espacio de color) yj desajustes aislados.
Ver [http://code.google.com/p/perm/wiki/Algorithms la página del algoritmo] para más
información sobre los patrones de semillas.

--refFormato {rápido | lista | índice }
Suponga que la (s) secuencia (s) de referencias están en el formato especificado, en lugar de adivinar
según la extensión del archivo.

--formato de lectura |{rápido | rapido | csfasta | csfastq}
Suponga que las lecturas están en el formato especificado, en lugar de adivinar de acuerdo con el
archivo (s) ´ extensión.

--formato de salida { sam | cartografía }
Anule la opción de formato de asignación de salida predeterminada o especifíquela explícitamente cuando
La extensión del archivo de salida no es .sam ni .mapping.

--delimitador tanque
tanque es un carácter que se utiliza como delimitador para separar el id de lectura y el
información adicional en la línea con> al leer un archivo FASTA o CSFASTA.

--Iniciar sesión ruta de archivo
ruta de archivo especifica el nombre del archivo de registro que contiene las estadísticas de mapeo
que también se imprimirá en la pantalla.

--solo adelante
El mapa se lee solo en la hebra delantera: (Esto es para SOLiD Strand específico
secuenciación).

--sólo reverso
El mapa se lee solo en la hebra inversa: (Esto es para SOLiD Strand específico
secuenciación)

para Extremo emparejado Lee

PerM se ocupa de las lecturas emparejadas mediante el mapeo de cada extremo por separado. Todas las combinaciones de
Los pares acoplados mapeados a la misma secuencia de referencia se generarán si su separación es
en el rango permitido según lo especificado por el -L y -U banderas.

-e Excluir pares ambiguos.

-L / --límite inferior Int.
límite inferior para la distancia de separación entre pares

-U / --límitesuperior Int.
límite superior para la distancia de separación emparejada

El límite superior y el límite inferior pueden ser negativos, lo que puede detectar la reorganización
variaciones. Utilizar el -A argumento para evitar perder los pares correctos. Sin embargo, esto puede
aumenta considerablemente el tiempo de ejecución si ambos extremos están en regiones repetitivas.

--es Asignar lecturas de extremo emparejado solo a diferentes hebras

--ff Asignar lecturas de extremo emparejado solo al mismo hilo

--printRefSeq
Imprima la secuencia emparejada de referencia mapeada como las dos últimas columnas en .mapping
formato. | El mapeo de salida de la opción predeterminada tanto en el mismo capítulo como en uno diferente.

DEFAULT AJUSTES


Las siguientes son las configuraciones predeterminadas cuando la opción de línea de comando correspondiente no es
especificado. Especifique la opción para cambiar la configuración predeterminada.

· Permita solo dos desajustes solo en cada extremo y use la semilla F ,, 2 ,, S ,, 11 ,, o F ,, 3 ,,
, seleccionado de acuerdo con las longitudes y tipos de lectura.

· Imprima las mejores alineaciones para cada lectura en términos del número de desajustes.

· Archivos de salida en *.formato de mapeo.

· Busca un índice guardado con el nombre de archivo predeterminado antes de crear el nuevo índice.

· No guardará el índice en el archivo, a menos que se especifique {{{-s}}}.

· Para lecturas finales emparejadas, la distancia de separación permitida predeterminada es 0-3000 bp. Cambio
con el -L y -U .

Paralelo Mapeo

PerM mapea simultáneamente varios conjuntos de lecturas en una lista consultando el mismo índice. Va a
detectar cuántas CPU (núcleos) están disponibles y asignar a cada una de ellas un conjunto de lectura. Si una lectura
conjunto está hecho, el siguiente conjunto de lectura en la lista se procesará automáticamente. Cada conjunto de lectura
tendrá su propio archivo de salida de mapeo. Para utilizar mejor todas las CPU en un nodo, lecturas grandes
El conjunto debe dividirse en muchos conjuntos de lectura pequeños y colocarse en una lista. Cuando varios nodos son
si se utiliza en el mismo sistema de archivos, el índice debe ser preconstruido primero por un nodo; el otro
los nodos leerán el índice preconstruido sin volver a generar el índice. Sin índice prediseñado,
cada máquina intentará construir su propio índice, desperdiciando tiempo de CPU y espacio de almacenamiento.

Exit los códigos de


PerM establece el código de salida en 0 una vez completado con éxito, el comportamiento normal de Unix. Si el
el programa se termina mediante Ctrl-C (SIGINT), el código de salida será 2, el número de SIGINT
(consulta: hombre matar). Si invoca PerM desde otro idioma, puede verificar el código de retorno
y haz algo inteligente. Aquí hay un ejemplo de pseudocódigo de Perl:

while (... algún tipo de bucle ...) {
my $ cmd = "PerM ... argumentos y conmutadores";
mi $ ec = sistema ($ cmd);
si ($ ec == 2) {
print STDERR "PerM terminado vía Ctrl-C. Deteniendo ejecución. \ n \ n";
# Tal vez haga una limpieza, como eliminar los archivos pequeños que el archivo leído
# dividir en para procesamiento paralelo.
salir ($ ec);
}
}

Utilice Permanente on Vía Láctea


Gracias al profesor Anton Nekrutenko y Kelly Vincent de PSU, ahora puede usar PerM en
[http://test.g2.bx.psu.edu/ Galaxy S compruébalo servidor]. Siga el hipervínculo a la página de Galaxy,
y haga clic en NGS: Mapeo en el menú de herramientas. Por favor elija Mapear con Permanente para Sólido y
Illumina. Puede cargar su propia referencia o utilizar el índice hg19 preconstruido en el sistema.
Por favor envíeme un correo electrónico si encuentra alguna dificultad. Una vez que el sistema demuestre su estabilidad,
se moverá al servidor principal de Galaxy con más índices de referencia preconstruidos.

Unidad Prueba


Cuando se desarrolló PerM, también se preparó un módulo de prueba de unidad cppUnit. Si usted es
interesado en el código de prueba para PerM, por favor envíeme un correo electrónico.

Use PerM en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

Comandos de Linux

Ad




×
Anuncio
❤ ️Compre, reserve o adquiera aquí: sin costo, ayuda a mantener los servicios gratuitos.