Linux için CC-Net indirme

Bu, en son sürümü cc_net1.0.0sourcecode.tar.gz olarak indirilebilen CC-Net adlı Linux uygulamasıdır. İş istasyonları için ücretsiz barındırma sağlayıcısı OnWorks'te çevrimiçi olarak çalıştırılabilir.

 
 

CC-Net with OnWorks isimli uygulamayı ücretsiz olarak indirip online olarak çalıştırın.

Bu uygulamayı çalıştırmak için şu talimatları izleyin:

- 1. Bu uygulamayı PC'nize indirdiniz.

- 2. Dosya yöneticimize https://www.onworks.net/myfiles.php?username=XXXXX istediğiniz kullanıcı adını girin.

- 3. Bu uygulamayı böyle bir dosya yöneticisine yükleyin.

- 4. Bu web sitesinden OnWorks Linux çevrimiçi veya Windows çevrimiçi öykünücüsünü veya MACOS çevrimiçi öykünücüsünü başlatın.

- 5. Yeni başladığınız OnWorks Linux işletim sisteminden, istediğiniz kullanıcı adıyla https://www.onworks.net/myfiles.php?username=XXXXX dosya yöneticimize gidin.

- 6. Uygulamayı indirin, kurun ve çalıştırın.

EKRAN GÖRÜNTÜLERİ:


CC-Net


AÇIKLAMA:

cc_net, ilgili makalede tanıtılan tek dilli veri kümeleri ve çok dilli CC-100 koleksiyonu dahil olmak üzere büyük ölçekli metin korpusları oluşturmak için Ortak Tarama'yı indirmek, segmentlere ayırmak, temizlemek ve filtrelemek için araçlar sağlar. Anlık görüntüler almak, metin çıkarmak, yinelenenleri kaldırmak, dili tanımlamak ve sezgisel yöntemlere ve dil modellerine dayalı kalite filtrelemesi uygulamak için boru hatları içerir. Çıktılar, dil modellerinin ön eğitimi ve yeni taramalarla yeniden üretilebilen veya güncellenebilen standartlaştırılmış korpuslar oluşturmak için tasarlanmıştır. Depo, HTTP hataları, anlık görüntü farklılıkları ve istatistik JSON'ları gibi pratik endişeleri belgelendirir ve birçok dilde topluluk kullanımını yansıtır. Güçlü olmasına rağmen, depo arşivlenmiştir ve salt okunurdur, bu nedenle kullanıcılar onu olduğu gibi çalıştırmayı veya bakım için çatallandırmayı beklemelidir. Arşivlenmiş durumda bile, sorunlar ve sürüm sayfaları uygulama ayrıntıları ve veri kümesi soyağacı için yararlı referanslar olmaya devam etmektedir.



Özellikler

  • Uçtan uca Ortak Tarama indirme ve çıkarma
  • Dil tanımlama ve tek dilli segmentasyon
  • Kalite filtreleme ve veri çoğaltma kanalları
  • CC-100 gibi çok dilli veri kümelerinin oluşturulmasına destek
  • Üretilebilir istatistikler ve korpus meta veri çıktıları
  • Anlık görüntü işleme için betikler ve yapılandırmalar


Programlama dili

Python


Kategoriler

Doğal Dil İşleme (NLP)

Bu uygulama, https://sourceforge.net/projects/cc-net.mirror/ adresinden de indirilebilir. Ücretsiz İşletim Sistemlerimizden birinden çevrimiçi olarak en kolay şekilde çalıştırılabilmesi için OnWorks'te barındırılmıştır.



En yeni Linux ve Windows çevrimiçi programları


Windows ve Linux için Yazılım ve Programları indirebileceğiniz kategoriler