Este é o aplicativo Linux DeepSeek-V3.2-Exp, cuja versão mais recente pode ser baixada como DeepSeek-V3.2-Expsourcecode.tar.gz. Ele pode ser executado online no provedor de hospedagem gratuita OnWorks para estações de trabalho.
Baixe e execute online este aplicativo chamado DeepSeek-V3.2-Exp com OnWorks gratuitamente.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie o emulador OnWorks Linux online ou Windows online ou emulador MACOS online a partir deste site.
- 5. No sistema operacional OnWorks Linux que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo, instale-o e execute-o.
SCREENSHOTS
Ad
DeepSeek-V3.2-Exp
DESCRIÇÃO
O DeepSeek-V3.2-Exp é uma versão experimental da família de modelos DeepSeek, concebida como um trampolim para a arquitetura de próxima geração. A principal inovação desta versão é o DeepSeek Sparse Attention (DSA), um mecanismo de atenção esparsa que visa otimizar a eficiência do treinamento e da inferência em contextos de longo prazo sem degradar a qualidade da saída. De acordo com os autores, eles alinharam a configuração de treinamento do V3.2-Exp com o V3.1-Terminus para que os resultados dos benchmarks permaneçam amplamente comparáveis, mesmo que o mecanismo de atenção interno mude. Em avaliações públicas em uma variedade de benchmarks de raciocínio, código e resposta a perguntas (por exemplo, MMLU, LiveCodeBench, AIME, Codeforces, etc.), o V3.2-Exp apresenta desempenho muito próximo ou, em alguns casos, igual ao do V3.1-Terminus. O repositório inclui ferramentas e kernels para suportar a nova arquitetura esparsa — por exemplo, kernels CUDA, indexadores logit e módulos de código aberto como FlashMLA e DeepGEMM são invocados para desempenho.
Recursos
- Agendamento de atenção esparsa adaptável que ajusta dinamicamente os padrões de escassez com base no comprimento da sequência de entrada
- Modo de fallback de atenção mista densa + esparsa para casos de uso híbridos
- Ponto de verificação com eficiência de memória para contextos ultralongos (por exemplo, >1M tokens)
- Painel de visualização e criação de perfil de desempenho para analisar o comportamento de atenção
- Interface de plugin para trocar diferentes backends de kernel esparsos (por exemplo, FlashMLA, DeepGEMM)
- Suporte para ajuste fino federado do modelo esparso em dados descentralizados
Linguagem de Programação
Python
Categorias
Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/deepseek-v3-2-exp.mirror/. Ele foi hospedado no OnWorks para ser executado online da maneira mais fácil em um de nossos sistemas operacionais gratuitos.
