Descargar modelos de percepción para Linux

Esta es la aplicación para Linux denominada Perception Models, cuya última versión se puede descargar como perception_modelssourcecode.tar.gz. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.

 
 

Descargue y ejecute en línea esta aplicación llamada Modelos de Percepción con OnWorks de forma gratuita.

Siga estas instrucciones para ejecutar esta aplicación:

- 1. Descargue esta aplicación en su PC.

- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.

- 3. Cargue esta aplicación en dicho administrador de archivos.

- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.

- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.

- 6. Descarga la aplicación, instálala y ejecútala.

CAPTURAS DE PANTALLA:


Modelos de percepción


DESCRIPCIÓN:

Perception Models es un marco de trabajo de vanguardia desarrollado por Facebook Research para tareas avanzadas de percepción de imágenes y vídeos. Incorpora dos componentes principales: el Codificador de Percepción (PE) para la extracción de características visuales y el Modelo de Lenguaje de Percepción (PLM) para la decodificación y el razonamiento multimodal. El módulo PE es una familia de codificadores de visión diseñados para destacar en la comprensión de imágenes y vídeos, superando a modelos como SigLIP2, InternVideo2 y DINOv2 en múltiples pruebas de referencia. Por otro lado, PLM se integra con PE para potenciar el modelado de lenguaje de visión, logrando resultados competitivos con sistemas multimodales líderes como QwenVL2.5 e InternVL3, a la vez que es totalmente reproducible con datos abiertos. El proyecto admite una amplia gama de aplicaciones de investigación, desde el reconocimiento visual y la predicción densa hasta la comprensión multimodal de grano fino. Además, incluye varios conjuntos de datos abiertos a gran escala para la percepción de imágenes y vídeos.



Caracteristicas

  • Combina el codificador de percepción (PE) para la codificación de la visión y el modelo de lenguaje de percepción (PLM) para la decodificación multimodal
  • Rendimiento de vanguardia en benchmarks de imagen, vídeo y lenguaje de visión
  • Modelos abiertos y reproducibles que utilizan conjuntos de datos disponibles libremente para lograr transparencia
  • Varias variantes de PE especializadas para tareas básicas, alineadas con el lenguaje y espaciales
  • PLM disponible en tamaños de parámetros 1B, 3B y 8B para necesidades de investigación flexibles
  • Integrado con herramientas populares como Hugging Face Transformers, timm y lmms-eval


Lenguaje de programación

Python


Categorías

Modelos de IA

Esta aplicación también se puede descargar desde https://sourceforge.net/projects/perception-models.mirror/. Está alojada en OnWorks para facilitar su ejecución en línea desde uno de nuestros sistemas operativos gratuitos.



Últimos programas en línea de Linux y Windows


Categorías para descargar Software y Programas para Windows y Linux