This is the Linux app named Multimodal whose latest release can be downloaded as multimodalv2025.10.06.00sourcecode.tar.gz. It can be run online in the free hosting provider OnWorks for workstations.
ดาวน์โหลดและใช้งานแอปชื่อ Multimodal พร้อม OnWorks ออนไลน์ได้ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้
- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้
ภาพหน้าจอ:
หลายรูปแบบ
รายละเอียด:
โปรเจกต์นี้ หรือที่รู้จักกันในชื่อ TorchMultimodal เป็นไลบรารี PyTorch สำหรับการสร้าง ฝึกอบรม และทดลองใช้แบบจำลองหลายโหมดและหลายงานในวงกว้าง ไลบรารีนี้มีหน่วยการสร้างแบบโมดูลาร์ เช่น ตัวเข้ารหัส โมดูลฟิวชัน ฟังก์ชันการสูญเสีย และการแปลงที่รองรับการรวมโมดัลต่างๆ (วิสัยทัศน์ ข้อความ เสียง ฯลฯ) ในสถาปัตยกรรมแบบรวม ไลบรารีประกอบด้วยคลาสโมเดลที่พร้อมใช้งาน เช่น ALBEF, CLIP, BLIP-2, COCA, FLAVA, MDETR และ Omnivore ซึ่งใช้เป็นแบบจำลองอ้างอิงที่คุณสามารถนำไปใช้หรือดัดแปลงได้ การออกแบบเน้นความสามารถในการประกอบ: คุณสามารถผสมผสานส่วนประกอบของตัวเข้ารหัส ฟิวชัน และตัวถอดรหัส แทนที่จะเริ่มต้นจากแบบจำลองแบบโมโนลิธิก คลังข้อมูลนี้ยังมีสคริปต์ตัวอย่างและชุดข้อมูลสำหรับงานมัลติโหมดทั่วไป (เช่น การดึงข้อมูล การตอบคำถามด้วยภาพ การต่อสายดิน) เพื่อให้คุณสามารถทดสอบและเปรียบเทียบแบบจำลองได้ตั้งแต่ต้นจนจบ การติดตั้งรองรับทั้ง CPU และ CUDA และฐานโค้ดได้รับการปรับปรุงเวอร์ชัน ทดสอบ และบำรุงรักษาแล้ว
คุณสมบัติ
- ตัวเข้ารหัสแบบโมดูลาร์ ชั้นฟิวชัน และโมดูลการสูญเสียสำหรับสถาปัตยกรรมมัลติโหมด
- การใช้งานโมเดลอ้างอิง (ALBEF, CLIP, BLIP-2, FLAVA, MDETR เป็นต้น)
- ตัวอย่างไปป์ไลน์สำหรับงานต่างๆ เช่น VQA การดึงข้อมูล การต่อสายดิน และการเรียนรู้หลายงาน
- กลยุทธ์การผสมผสานที่ยืดหยุ่น: เร็ว, ช้า, ใส่ใจกัน ฯลฯ
- แปลงยูทิลิตี้สำหรับการประมวลผลล่วงหน้าและการจัดตำแหน่งโหมด
- รองรับการตั้งค่า CPU และ GPU พร้อมฐานโค้ดที่ผ่านการทดสอบและกำหนดเวอร์ชันแล้ว
ภาษาโปรแกรม
หลาม
หมวดหมู่
นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/multimodal.mirror/ ได้ แอปพลิเคชันนี้โฮสต์อยู่ใน OnWorks เพื่อให้ใช้งานออนไลน์ได้ง่ายที่สุดจากระบบปฏิบัติการฟรีของเรา