Ini ialah apl Linux bernama Perception Models yang keluaran terbarunya boleh dimuat turun sebagai perception_modelssourcecode.tar.gz. Ia boleh dijalankan dalam talian dalam penyedia pengehosan percuma OnWorks untuk stesen kerja.
Muat turun dan jalankan dalam talian apl bernama Perception Models dengan OnWorks ini secara percuma.
Ikut arahan ini untuk menjalankan apl ini:
- 1. Memuat turun aplikasi ini dalam PC anda.
- 2. Masukkan dalam pengurus fail kami https://www.onworks.net/myfiles.php?username=XXXXX dengan nama pengguna yang anda mahukan.
- 3. Muat naik aplikasi ini dalam pengurus filem tersebut.
- 4. Mulakan OnWorks Linux dalam talian atau emulator dalam talian Windows atau emulator dalam talian MACOS dari tapak web ini.
- 5. Daripada OS Linux OnWorks yang baru anda mulakan, pergi ke pengurus fail kami https://www.onworks.net/myfiles.php?username=XXXX dengan nama pengguna yang anda mahukan.
- 6. Muat turun aplikasi, pasang dan jalankan.
SKRIN:
Model Persepsi
HURAIAN:
Model Persepsi ialah rangka kerja terkini yang dibangunkan oleh Facebook Research untuk tugasan persepsi imej dan video lanjutan. Ia memperkenalkan dua komponen utama: Pengekod Persepsi (PE) untuk pengekstrakan ciri visual dan Model Bahasa Persepsi (PLM) untuk penyahkodan dan penaakulan multimodal. Modul PE ialah keluarga pengekod penglihatan yang direka untuk cemerlang dalam pemahaman imej dan video, mengatasi model seperti SigLIP2, InternVideo2 dan DINOv2 merentas pelbagai penanda aras. Sementara itu, PLM menyepadukan dengan PE untuk memperkasakan pemodelan bahasa penglihatan, mencapai hasil yang berdaya saing dengan sistem multimodal terkemuka seperti QwenVL2.5 dan InternVL3, sambil boleh dihasilkan semula sepenuhnya dengan data terbuka. Projek ini menyokong pelbagai aplikasi penyelidikan, daripada pengecaman visual dan ramalan padat kepada pemahaman multimodal yang terperinci. Selain itu, ia termasuk beberapa set data terbuka berskala besar untuk persepsi imej dan video.
Ciri-ciri
- Menggabungkan Pengekod Persepsi (PE) untuk pengekodan penglihatan dan Model Bahasa Persepsi (PLM) untuk penyahkodan pelbagai mod
- Prestasi terkini dalam imej, video dan penanda aras bahasa penglihatan
- Model terbuka dan boleh diterbitkan semula menggunakan set data yang tersedia secara bebas untuk ketelusan
- Berbilang varian PE khusus untuk tugas teras, sejajar bahasa dan ruang
- PLM tersedia dalam saiz parameter 1B, 3B dan 8B untuk keperluan penyelidikan yang fleksibel
- Disepadukan dengan alatan popular seperti Hugging Face Transformers, timm dan lmms-eval
Bahasa Pengaturcaraan
Python
Kategori
Ini adalah aplikasi yang juga boleh diambil dari https://sourceforge.net/projects/perception-models.mirror/. Ia telah dihoskan dalam OnWorks untuk dijalankan dalam talian dengan cara yang paling mudah daripada salah satu Sistem Operasi percuma kami.