Este es el comando formatdb que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
formatdb: formato de bases de datos de proteínas o nucleótidos para BLAST
SINOPSIS
formatodb [-] [-B nombre de archivo] [-F nombre de archivo] [-L nombre de archivo] [-T nombre de archivo] [-V] [-a] [-b] [-e]
[-i nombre de archivo] [-l nombre de archivo] [-n str] [-o] [-p F] [-s] [-t str] [-v N]
DESCRIPCIÓN
formatodb debe usarse para formatear bases de datos de fuentes de proteínas o nucleótidos antes
estas bases de datos se pueden buscar por blastall, blastpgp o MegaBLAST. La base de datos de origen
puede estar en formato FASTA o ASN.1. Aunque el formato FASTA se utiliza con mayor frecuencia como
entrada a formatodb, el uso de ASN.1 es ventajoso para aquellos que utilizan ASN.1 como
fuente común para otros formatos como el informe GenBank. Una vez que un archivo de base de datos de origen
ha sido formateado por formatodb BLAST no lo necesita. Tenga en cuenta que si está
va a aplicar actualizaciones periódicas a sus bases de datos BLAST utilizando fusionar(1), necesitará
conservar el archivo de la base de datos de origen.
CAMPUS
Un resumen de las opciones se incluye a continuación.
- Mensaje de uso de impresión
-B nombre de archivo
Gifile binario producido a partir del Gifile especificado por -F. Esta opción especifica el
nombre de un archivo de lista de IG binario. Esta opción debe usarse con el -F opción. A
La lista de GI de texto se puede especificar con el -F opción y el -B la opción producirá
esa lista de IG en formato binario. El archivo binario es más pequeño y BLAST no necesita
para convertirlo, para que se pueda leer más rápido.
-F nombre de archivo
Gifile (archivo que contiene la lista de gi) para usar con -B or -L
-L nombre de archivo
Crea un archivo de alias llamado nombre de archivo, limitando las secuencias buscadas a aquellas
especificado por -F.
-T nombre de archivo
Configure los ID de taxonomía en ASN.1 deflines de acuerdo con la tabla en nombre de archivo.
-V Detallado: busque identificadores de cadena no únicos en la base de datos
-a El archivo de entrada es una base de datos en formato ASN.1 (de lo contrario, se espera FASTA)
-b La base de datos ASN.1 es binaria (a diferencia del texto ASCII)
-e La entrada es una entrada de secuencia. Una base de datos ASN.1 de origen (ya sea de texto ascii o binaria) puede
contienen un Bioseq-set o solo un Bioseq. En este último caso -e debería ser provisto.
-i nombre de archivo
Archivo de entrada para formatear
-l nombre de archivo
Nombre del archivo de registro (predeterminado = formatodb.log)
-n str Nombre base para archivos BLAST (por defecto es el nombre del archivo FASTA original)
-o Analizar SeqID y crear índices. Si la base de datos de origen está en formato FASTA, la
Los identificadores de bases de datos en la línea de definición de FASTA deben seguir las convenciones de
el formato FASTA Defline.
-p F La entrada es un nucleótido, no una proteína.
-s Indice solo por accesión, no por locus. Esto es especialmente útil para conjuntos de secuencias.
como las EST, donde los nombres de accesión y locus son idénticos. Formatdb se ejecuta
más rápido y produce archivos temporales más pequeños si se utiliza esta opción. Es fuertemente
recomendado para EST, STS, GSS y HTGS.
-t str Título del archivo de base de datos [Cadena]
-v N Divida archivos FASTA grandes en "volúmenes" de tamaño N millones de letras (4000 por
defecto). Como parte de la creación de un volumen, formatodb escribe un nuevo tipo de BLAST
archivo de base de datos, llamado archivo de alias, con la extensión `nal 'o` pal'.
Utilice formatdb en línea utilizando los servicios de onworks.net