Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen ids2ngram komutudur.
Program:
ADI
ids2ngram - ids dosyasından n-gram veri dosyası oluştur
SİNOPSİS
ids2ngram [seçenek] ... kimlik dosyası...
TANIM
ids2ngram ikili dosyadan sıralanmış bir [id1,..,idN,freq] dizisi olan idngram dosyasını oluşturur
kimlik akışı dosyaları. Burada, id akışı dosyaları her zaman tarafından oluşturulur. mmseg or slmseg.
Temel olarak, n-kelime gruplarının (yani (id1,..,idN) kümesinin) tüm oluşumunu bulur ve
bu demetleri, demetleri oluşturan kimliklerin sözlükbilimsel sırasına göre sıralar, sonra yazar
onları belirtilen çıktı dosyasına.
GİRİŞ
Giriş dosyası, şuna benzeyen bir ikili kimlik akışı olarak sunulur:
[id0,...,idX]
SEÇENEKLER
Aşağıdaki seçeneklerin tümü zorunludur.
-n,--Nmax N
üretir N-gram sonucu. ids2ngram yalnızca uni-gram, bi-gram ve trigram'ı destekler,
yani 1 aralığında olmayan herhangi bir sayı geçerli değildir.
-s,--takas dosya değiştir
Geçici ara dosyayı belirtin.
-o, --dışarı çıktı dosyası
Sonuç idngram dosyasını belirtin, örneğin [id1, ..., idN, freq] dizisi
-p, --para N
Paragraf başına maksimum n-gram öğelerini belirtin. ids2ngram geçici dosyaya yazar
paragraf bazında. Her paragraf yazdığında,
için tahsis edilen ilgili bellek. Bilgisayar sisteminiz izin verdiğinde, daha yüksek bir N
önerilir. Bu, daha az G/Ç nedeniyle işlem hızını hızlandırabilir.
ÖRNEK
Aşağıdaki örnek, oluşturmak için üç giriş idstream dosyası idsfile[1,2,3] kullanacaktır.
idngram dosyası all.id3gram. Her para (dahili harita boyutu veya karma boyutu) 1024000 olur,
geçici sonuç için takas dosyası kullanma. Tüm geçici para sonucu sonunda elde edilecek şekilde birleştirilir
nihai sonuç.
ids2ngram -n 3 -s /tmp/takas -o hepsi.id3gram -p 1024000 kimlik dosyası1 kimlik dosyası2 kimlik dosyası3
onworks.net hizmetlerini kullanarak ids2ngram'ı çevrimiçi kullanın