Perception Models-Download für Linux

Dies ist die Linux-App namens Perception Models, deren neueste Version als perception_modelssourcecode.tar.gz heruntergeladen werden kann. Sie kann online beim kostenlosen Hosting-Anbieter OnWorks für Workstations ausgeführt werden.

 
 

Laden Sie diese App namens „Perception Models with OnWorks“ kostenlos herunter und führen Sie sie online aus.

Befolgen Sie diese Anweisungen, um diese App auszuführen:

- 1. Diese Anwendung auf Ihren PC heruntergeladen.

- 2. Geben Sie in unserem Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX den gewünschten Benutzernamen ein.

- 3. Laden Sie diese Anwendung in einem solchen Dateimanager hoch.

- 4. Starten Sie den OnWorks Linux-Online- oder Windows-Online-Emulator oder den MACOS-Online-Emulator von dieser Website.

- 5. Rufen Sie vom gerade gestarteten OnWorks Linux-Betriebssystem aus unseren Dateimanager https://www.onworks.net/myfiles.php?username=XXXXX mit dem gewünschten Benutzernamen auf.

- 6. Laden Sie die Anwendung herunter, installieren Sie sie und führen Sie sie aus.

SCREENSHOTS:


Wahrnehmungsmodelle


BESCHREIBUNG:

Perception Models ist ein hochmodernes Framework, das von Facebook Research für fortgeschrittene Aufgaben der Bild- und Videowahrnehmung entwickelt wurde. Es umfasst zwei Hauptkomponenten: den Perception Encoder (PE) zur visuellen Merkmalsextraktion und das Perception Language Model (PLM) für multimodale Dekodierung und Schlussfolgerung. Das PE-Modul ist eine Familie von Vision Encodern, die für herausragendes Bild- und Videoverständnis entwickelt wurden und Modelle wie SigLIP2, InternVideo2 und DINOv2 in mehreren Benchmarks übertreffen. Gleichzeitig ist PLM in PE integriert, um die Vision-Language-Modellierung zu unterstützen und Ergebnisse zu erzielen, die mit führenden multimodalen Systemen wie QwenVL2.5 und InternVL3 konkurrieren können – und das alles bei vollständiger Reproduzierbarkeit mit offenen Daten. Das Projekt unterstützt eine breite Palette von Forschungsanwendungen, von visueller Erkennung und dichter Vorhersage bis hin zu feinkörnigem multimodalem Verständnis. Darüber hinaus umfasst es mehrere große offene Datensätze zur Bild- und Videowahrnehmung.



Eigenschaften

  • Kombiniert Perception Encoder (PE) für die visuelle Kodierung und Perception Language Model (PLM) für die multimodale Dekodierung
  • Hochmoderne Leistung bei Bild-, Video- und Vision-Language-Benchmarks
  • Offene, reproduzierbare Modelle unter Verwendung frei verfügbarer Datensätze für Transparenz
  • Mehrere PE-Varianten, spezialisiert auf Kern-, sprachbezogene und räumliche Aufgaben
  • PLM in den Parametergrößen 1B, 3B und 8B für flexible Forschungsanforderungen verfügbar
  • Integriert mit beliebten Tools wie Hugging Face Transformers, timm und lmms-eval


Programmiersprache

Python


Kategorien

KI-Modelle

Diese Anwendung kann auch von https://sourceforge.net/projects/perception-models.mirror/ heruntergeladen werden. Sie wurde in OnWorks gehostet, um sie auf einfachste Weise online von einem unserer kostenlosen Betriebssysteme aus ausführen zu können.



Neueste Linux- und Windows-Online-Programme


Kategorien zum Herunterladen von Software und Programmen für Windows und Linux