Este es el comando bp_biofetch_genbank_proxyp que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
bp_biofetch_genbank_proxy.pl - Proxy web de almacenamiento en caché compatible con BioFetch para GenBank
SINOPSIS
Instale en el directorio cgi-bin de un servidor web. Un paso atrás.
DESCRIPCIÓN
Este script CGI actúa como el lado del servidor del protocolo BioFetch como se describe en
http://obda.open-bio.org/Specs/. Proporciona dos servicios de acceso a la base de datos, uno para datos.
fuente "genbank" (entradas de nucleótidos) y la otra para la fuente de datos "genpep" (proteína
entradas).
Este script funciona reenviando sus solicitudes al script eutils de NCBI, que se encuentra en
http://www.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi. Luego reformatea la salida
de acuerdo con el formato BioFetch para que las secuencias puedan ser procesadas y devueltas por el
Módulo Bio :: DB :: BioFetch. Las entradas devueltas se almacenan temporalmente en la caché del servidor web.
sistema de archivos, lo que permite recuperar las entradas a las que se accede con frecuencia sin otra ronda
viaje a NCBI.
INSTALACIÓN
Debe tener lo siguiente instalado para ejecutar este script:
1) perla
2) los módulos de perl LWP y Cache :: FileCache
3) un servidor web (se recomienda Apache)
Para instalar este script, cópielo en el directorio cgi-bin del servidor web. Podrías querer
para acortar su nombre; Se recomienda "dbfetch".
Hay varias constantes ubicadas en la parte superior de la secuencia de comandos que es posible que desee ajustar.
Estos son:
CACHE_LOCATION
Esta es la ubicación en el sistema de archivos donde se ubicarán los archivos en caché. los
el predeterminado es / usr / tmp / dbfetch_cache.
TAMAÑO MÁXIMO
Este es el tamaño máximo al que puede crecer la caché. Cuando la caché supera este tamaño
las entradas más antiguas se eliminarán automáticamente. La configuración predeterminada es 100,000,000 bytes
(100 MB).
VENCIMIENTO
Las entradas a las que no se haya accedido en este período de tiempo se eliminarán de la caché.
El valor predeterminado es 1 semana.
PURGA
Esta constante especifica la frecuencia con la que se depurará la caché para las entradas más antiguas. El valor por defecto
es 1 hora.
Servicios
Para ver si este script funciona como se esperaba, puede probarlo con este script:
utilice Bio :: DB :: BioFetch;
my $ db = Bio :: DB :: BioFetch-> new (-baseaddress => 'http://localhost/cgi-bin/dbfetch',
-format => 'genbank',
-db => 'genbank');
my $ seq = $ db-> get_Seq_by_id ('DDU63596');
imprimir $ seq-> seq, "\ n";
Esto debería imprimir una secuencia de ADN.
Utilice bp_biofetch_genbank_proxyp en línea utilizando los servicios de onworks.net