Esta es la aplicación para Windows llamada DeepSeek-V3, cuya última versión se puede descargar como v1.0.0sourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada DeepSeek-V3 con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie cualquier emulador en línea de OS OnWorks desde este sitio web, pero mejor emulador en línea de Windows.
- 5. Desde el sistema operativo OnWorks Windows que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación e instálala.
- 7. Descargue Wine desde los repositorios de software de sus distribuciones de Linux. Una vez instalada, puede hacer doble clic en la aplicación para ejecutarla con Wine. También puedes probar PlayOnLinux, una elegante interfaz sobre Wine que te ayudará a instalar programas y juegos populares de Windows.
Wine es una forma de ejecutar software de Windows en Linux, pero no requiere Windows. Wine es una capa de compatibilidad de Windows de código abierto que puede ejecutar programas de Windows directamente en cualquier escritorio de Linux. Esencialmente, Wine está tratando de volver a implementar una cantidad suficiente de Windows desde cero para poder ejecutar todas esas aplicaciones de Windows sin necesidad de Windows.
SCREENSHOTS
Ad
DeepSeek-V3
DESCRIPCIÓN
DeepSeek-V3 es un robusto modelo de lenguaje de Mezcla de Expertos (MoE) desarrollado por DeepSeek, con un total de 671 mil millones de parámetros, con 37 mil millones activados por token. Emplea Atención Latente Multicabezal (MLA) y la arquitectura DeepSeekMoE para mejorar la eficiencia computacional. El modelo introduce una estrategia de balanceo de carga sin pérdidas auxiliares y un objetivo de entrenamiento de predicción multitoken para optimizar el rendimiento. Entrenado con 14.8 billones de tokens diversos y de alta calidad, DeepSeek-V3 se sometió a un ajuste fino supervisado y aprendizaje de refuerzo para alcanzar su máximo potencial. Las evaluaciones indican que supera a otros modelos de código abierto y compite con los principales modelos de código cerrado, consiguiéndolo con un entrenamiento de 55 días en 2,048 GPU Nvidia H800, con un coste aproximado de 5.58 millones de dólares.
Caracteristicas
- 671 mil millones de parámetros con 37 mil millones activados por token, lo que garantiza un modelado de lenguaje sólido.
- Arquitectura de atención latente de múltiples cabezas (MLA) y DeepSeekMoE para un cálculo eficiente.
- Estrategia de equilibrio de carga sin pérdida auxiliar para mejorar el rendimiento sin pérdidas adicionales.
- Objetivo de entrenamiento de predicción de múltiples tokens para mejorar las capacidades predictivas.
- Preentrenado en 14.8 billones de tokens diversos, lo que garantiza una comprensión integral del lenguaje.
- Ajuste fino supervisado y aprendizaje de refuerzo para aprovechar al máximo el potencial del modelo.
- Supera a otros modelos de código abierto, comparable a sus principales homólogos de código cerrado.
- Capacitación rentable, completada en 55 días utilizando 2,048 GPU Nvidia H800 por aproximadamente $5.58 millones.
Lenguaje de programación
Python
Categorías
Esta aplicación también se puede obtener desde https://sourceforge.net/projects/deepseek-v3.mirror/. Está alojada en OnWorks para facilitar su ejecución en línea desde uno de nuestros sistemas operativos gratuitos.