cdhit-454 - Online na nuvem

Este é o comando cdhit-454 que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

PROGRAMA:

NOME


cd-hit-454 - agrupar sequências rapidamente, otimizado para dados 454

SINOPSE


CDhit-454 [Opções]

DESCRIÇÃO


====== CD-HIT versão 4.6 (construído em 23 de janeiro de 2016) ======

Opções

-i nome de arquivo de entrada em formato fasta, obrigatório

-o nome do arquivo de saída, obrigatório

-c limite de identidade de sequência, padrão 0.98, esta é uma "identidade de sequência global"
calculado como: número de aminoácidos idênticos em alinhamento dividido pelo total
comprimento da sequência mais curta + lacunas

-b largura de banda do alinhamento, padrão 10

-M limite de memória (em MB) para o programa, padrão 800; 0 para ilimitado;

-T número de threads, padrão 1; com 0, todas as CPUs serão usadas

-n word_length, default 10, consulte o guia do usuário para escolhê-lo

-al cobertura de alinhamento para a sequência mais longa, padrão 0.0 se definido como 0.9, o
o alinhamento deve cobrir 90% da sequência

-AL controle de cobertura de alinhamento para a sequência mais longa, padrão 99999999 se definido como 60,
e o comprimento da sequência é 400, então o alinhamento deve ser> = 340 (400-60)
resíduos

-Como cobertura de alinhamento para a sequência mais curta, padrão 0.0 se definido como 0.9, o
o alinhamento deve cobrir 90% da sequência

-COMO controle de cobertura de alinhamento para a sequência mais curta, padrão 99999999 se definido como 60,
e o comprimento da sequência é 400, então o alinhamento deve ser> = 340 (400-60)
resíduos

-B 1 ou 0, padrão 0, por padrão, as sequências são armazenadas na RAM se definido como 1, sequência
são armazenados no disco rígido, é recomendado o uso -B 1 para bancos de dados enormes

-g 1 ou 0, padrão 0 pelo algoritmo padrão do hit de cd, uma sequência é agrupada no
primeiro cluster que atinge o limite (cluster rápido). Se definido como 1, o programa irá
agrupe-o no cluster mais semelhante que atenda ao limite (preciso, mas lento
modo), mas 1 ou 0 não mudará os representantes dos clusters finais

-D tamanho máximo por indel, padrão 1

-Combine pontuação correspondente, padrão 2

-incompatibilidade
pontuação incompatível, padrão -1

-Gap = Vão pontuação de abertura da lacuna, padrão -3

-gap-ext
pontuação de extensão de lacuna, padrão -1

-bin gravar arquivo de cluster de backup (1 ou 0, padrão 0)

-h imprima esta ajuda

Perguntas, bugs, entre em contato com Weizhong Li em liwz@sdsc.edu

Se você achar que o hit de cd é útil, por favor, cite:

"Agrupamento de sequências altamente homólogas para reduzir o tamanho da proteína grande
banco de dados ", Weizhong Li, Lukasz Jaroszewski & Adam Godzik. Bioinformatics, (2001)
17: 282-283 "Cd-hit: um programa rápido para agrupar e comparar grandes conjuntos de
proteínas ou sequências de nucleotídeos ", Weizhong Li & Adam Godzik. Bioinformatics, (2006)
22: 1658-1659 "Beifang Niu, Limin Fu, Shulei Sun e Weizhong Li. Artificiais e
duplicatas naturais em leituras de pirosequenciamento de dados metagenômicos. BMC Bioinformática
(2010) 11: 187

Use cdhit-454 online usando serviços onworks.net



Programas online mais recentes para Linux e Windows