İngilizceFransızcaİspanyolca

Ad


OnWorks favicon'u

ids2ngram - Bulutta Çevrimiçi

Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden OnWorks ücretsiz barındırma sağlayıcısında ids2ngram çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen ids2ngram komutudur.

Program:

ADI


ids2ngram - ids dosyasından n-gram veri dosyası oluştur

SİNOPSİS


ids2ngram [seçenek] ... kimlik dosyası...

TANIM


ids2ngram ikili dosyadan sıralanmış bir [id1,..,idN,freq] dizisi olan idngram dosyasını oluşturur
kimlik akışı dosyaları. Burada, id akışı dosyaları her zaman tarafından oluşturulur. mmseg or slmseg.
Temel olarak, n-kelime gruplarının (yani (id1,..,idN) kümesinin) tüm oluşumunu bulur ve
bu demetleri, demetleri oluşturan kimliklerin sözlükbilimsel sırasına göre sıralar, sonra yazar
onları belirtilen çıktı dosyasına.

GİRİŞ


Giriş dosyası, şuna benzeyen bir ikili kimlik akışı olarak sunulur:
[id0,...,idX]

SEÇENEKLER


Aşağıdaki seçeneklerin tümü zorunludur.

-n,--Nmax N
üretir N-gram sonucu. ids2ngram yalnızca uni-gram, bi-gram ve trigram'ı destekler,
yani 1 aralığında olmayan herhangi bir sayı geçerli değildir.

-s,--takas dosya değiştir
Geçici ara dosyayı belirtin.

-o, --dışarı çıktı dosyası
Sonuç idngram dosyasını belirtin, örneğin [id1, ..., idN, freq] dizisi

-p, --para N
Paragraf başına maksimum n-gram öğelerini belirtin. ids2ngram geçici dosyaya yazar
paragraf bazında. Her paragraf yazdığında,
için tahsis edilen ilgili bellek. Bilgisayar sisteminiz izin verdiğinde, daha yüksek bir N
önerilir. Bu, daha az G/Ç nedeniyle işlem hızını hızlandırabilir.

ÖRNEK


Aşağıdaki örnek, oluşturmak için üç giriş idstream dosyası idsfile[1,2,3] kullanacaktır.
idngram dosyası all.id3gram. Her para (dahili harita boyutu veya karma boyutu) 1024000 olur,
geçici sonuç için takas dosyası kullanma. Tüm geçici para sonucu sonunda elde edilecek şekilde birleştirilir
nihai sonuç.

ids2ngram -n 3 -s /tmp/takas -o hepsi.id3gram -p 1024000 kimlik dosyası1 kimlik dosyası2 kimlik dosyası3

onworks.net hizmetlerini kullanarak ids2ngram'ı çevrimiçi kullanın


Ücretsiz Sunucular ve İş İstasyonları

Windows ve Linux uygulamalarını indirin

Linux komutları

Ad