āĻāĻāĻŋ āĻšāĻ˛ ids2ngram āĻāĻŽāĻžāĻ¨ā§āĻĄ āĻ¯āĻž āĻāĻŽāĻžāĻĻā§āĻ° āĻāĻāĻžāĻ§āĻŋāĻ āĻŦāĻŋāĻ¨āĻžāĻŽā§āĻ˛ā§āĻ¯ā§āĻ° āĻ āĻ¨āĻ˛āĻžāĻāĻ¨ āĻāĻ¯āĻŧāĻžāĻ°ā§āĻāĻ¸ā§āĻā§āĻļāĻ¨ āĻ¯ā§āĻŽāĻ¨ āĻāĻŦā§āĻ¨ā§āĻā§ āĻ āĻ¨āĻ˛āĻžāĻāĻ¨, āĻĢā§āĻĄā§āĻ°āĻž āĻ āĻ¨āĻ˛āĻžāĻāĻ¨, āĻāĻāĻ¨ā§āĻĄā§āĻ āĻ āĻ¨āĻ˛āĻžāĻāĻ¨ āĻāĻŽā§āĻ˛ā§āĻāĻ° āĻŦāĻž MAC OS āĻ āĻ¨āĻ˛āĻžāĻāĻ¨ āĻāĻŽā§āĻ˛ā§āĻāĻ° āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ OnWorks āĻĢā§āĻ°āĻŋ āĻšā§āĻ¸ā§āĻāĻŋāĻ āĻĒā§āĻ°āĻĻāĻžāĻ¨āĻāĻžāĻ°ā§āĻ¤ā§ āĻāĻžāĻ˛āĻžāĻ¨ā§ āĻ¯ā§āĻ¤ā§ āĻĒāĻžāĻ°ā§āĨ¤
āĻāĻžāĻ°ā§āĻ¯āĻā§āĻ°āĻŽ:
NAME āĻāĻ°
ids2ngram - āĻāĻāĻĄāĻŋ āĻĢāĻžāĻāĻ˛ āĻĨā§āĻā§ āĻāĻ¨-āĻā§āĻ°āĻžāĻŽ āĻĄā§āĻāĻž āĻĢāĻžāĻāĻ˛ āĻ¤ā§āĻ°āĻŋ āĻāĻ°ā§āĻ¨
āĻ¸āĻžāĻāĻ¨ā§āĻĒāĻŋāĻ¸āĻŋāĻ¸
ids2ngram [āĻĒāĻāĻ¨ā§āĻĻ] ... ids_file...
āĻŦāĻ°ā§āĻŖāĻ¨āĻžāĻ
ids2ngram idngram āĻĢāĻžāĻāĻ˛ āĻ¤ā§āĻ°āĻŋ āĻāĻ°ā§, āĻ¯āĻž āĻŦāĻžāĻāĻ¨āĻžāĻ°āĻŋ āĻĨā§āĻā§ āĻāĻāĻāĻŋ āĻ¸āĻžāĻāĻžāĻ¨ā§ [id1,..,idN,freq] āĻ ā§āĻ¯āĻžāĻ°ā§āĨ¤
āĻāĻāĻĄāĻŋ āĻ¸ā§āĻā§āĻ°āĻŋāĻŽ āĻĢāĻžāĻāĻ˛āĨ¤ āĻāĻāĻžāĻ¨ā§, āĻāĻāĻĄāĻŋ āĻ¸ā§āĻā§āĻ°āĻŋāĻŽ āĻĢāĻžāĻāĻ˛āĻā§āĻ˛āĻŋ āĻ¸āĻ°ā§āĻŦāĻĻāĻž āĻ¤ā§āĻ°āĻŋ āĻšāĻ¯āĻŧ mmseg or slmseg.
āĻŽā§āĻ˛āĻ¤, āĻāĻāĻŋ n-āĻļāĻŦā§āĻĻā§āĻ° āĻāĻŋāĻĒāĻ˛ (āĻ¯ā§āĻŽāĻ¨ (id1,..,idN) āĻāĻ° āĻāĻŋāĻĒāĻ˛) āĻāĻŦāĻ
āĻāĻ āĻāĻŋāĻĒāĻ˛āĻā§āĻ˛āĻŋāĻā§ id āĻāĻ° āĻ āĻāĻŋāĻ§āĻžāĻ¨āĻŋāĻ āĻā§āĻ°āĻŽ āĻ āĻ¨ā§āĻ¸āĻžāĻ°ā§ āĻ¸āĻžāĻāĻžāĻ¨ tuples āĻ¤ā§āĻ°āĻŋ āĻāĻ°ā§, āĻ¤āĻžāĻ°āĻĒāĻ° āĻ˛āĻŋāĻā§āĻ¨
āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻ āĻāĻāĻāĻĒā§āĻ āĻĢāĻžāĻāĻ˛ āĻ¤āĻžāĻĻā§āĻ°.
āĻāĻ¨āĻĒā§āĻ
āĻāĻ¨āĻĒā§āĻ āĻĢāĻžāĻāĻ˛āĻāĻŋ āĻāĻāĻāĻŋ āĻŦāĻžāĻāĻ¨āĻžāĻ°āĻŋ āĻāĻāĻĄāĻŋ āĻ¸ā§āĻā§āĻ°āĻŋāĻŽ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻāĻĒāĻ¸ā§āĻĨāĻžāĻĒāĻŋāĻ¤ āĻšāĻ¯āĻŧ, āĻ¯āĻž āĻĻā§āĻāĻ¤ā§ āĻāĻāĻ°āĻāĻŽ:
[id0,...,idX]
āĻŦāĻŋāĻāĻ˛ā§āĻĒ
āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻāĻŋāĻ¤ āĻ¸āĻŦ āĻŦāĻŋāĻāĻ˛ā§āĻĒ āĻŦāĻžāĻ§ā§āĻ¯āĻ¤āĻžāĻŽā§āĻ˛āĻ.
-n,--NMax N
āĻāĻ¤ā§āĻĒāĻ¨ā§āĻ¨ N-āĻā§āĻ°āĻžāĻŽ āĻĢāĻ˛āĻžāĻĢāĻ˛āĨ¤ ids2ngram āĻļā§āĻ§ā§āĻŽāĻžāĻ¤ā§āĻ° uni-gram, bi-gram, āĻāĻŦāĻ trigram āĻ¸āĻŽāĻ°ā§āĻĨāĻ¨ āĻāĻ°ā§,
āĻ¤āĻžāĻ 1..3 āĻāĻ° āĻĒāĻ°āĻŋāĻ¸āĻ°ā§ āĻ¨āĻž āĻĨāĻžāĻāĻž āĻ¯ā§āĻā§āĻ¨ā§ āĻ¸āĻāĻā§āĻ¯āĻž āĻŦā§āĻ§ āĻ¨āĻ¯āĻŧāĨ¤
-s,-- āĻ āĻĻāĻ˛āĻŦāĻĻāĻ˛ āĻ¸ā§āĻ¯āĻŧāĻžāĻĒ-āĻĢāĻžāĻāĻ˛
āĻ āĻ¸ā§āĻĨāĻžāĻ¯āĻŧā§ āĻŽāĻ§ā§āĻ¯āĻŦāĻ°ā§āĻ¤ā§ āĻĢāĻžāĻāĻ˛āĻāĻŋ āĻāĻ˛ā§āĻ˛ā§āĻ āĻāĻ°ā§āĻ¨āĨ¤
-o, --āĻāĻāĻ āĻāĻāĻāĻĒā§āĻ āĻĢāĻžāĻāĻ˛
āĻĢāĻ˛āĻžāĻĢāĻ˛ idngram āĻĢāĻžāĻāĻ˛āĻāĻŋ āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻ āĻāĻ°ā§āĻ¨, āĻ¯ā§āĻŽāĻ¨ [id1, ..., idN, freq] āĻāĻ° āĻ ā§āĻ¯āĻžāĻ°ā§
-p, --āĻĒāĻžāĻĄāĻŧāĻž N
āĻ āĻ¨ā§āĻā§āĻā§āĻĻ āĻĒā§āĻ°āĻ¤āĻŋ āĻ¸āĻ°ā§āĻŦā§āĻā§āĻ n-āĻā§āĻ°āĻžāĻŽ āĻāĻāĻā§āĻŽ āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻ āĻāĻ°ā§āĻ¨. ids2ngram āĻ āĻ¸ā§āĻĨāĻžāĻ¯āĻŧā§ āĻĢāĻžāĻāĻ˛ā§ āĻ˛ā§āĻā§
āĻĒā§āĻ°āĻ¤āĻŋ āĻ āĻ¨ā§āĻā§āĻā§āĻĻā§āĻ° āĻāĻŋāĻ¤ā§āĻ¤āĻŋāĻ¤ā§āĨ¤ āĻĒā§āĻ°āĻ¤āĻŋāĻŦāĻžāĻ° āĻāĻāĻŋ āĻāĻāĻāĻŋ āĻ āĻ¨ā§āĻā§āĻā§āĻĻ āĻāĻāĻ āĻ˛āĻŋāĻā§, āĻāĻāĻŋ āĻŽā§āĻā§āĻ¤ āĻāĻ°ā§
āĻāĻ° āĻāĻ¨ā§āĻ¯ āĻŦāĻ°āĻžāĻĻā§āĻĻāĻā§āĻ¤ āĻŽā§āĻŽāĻ°āĻŋāĨ¤ āĻ¯āĻāĻ¨ āĻāĻĒāĻ¨āĻžāĻ° āĻāĻŽā§āĻĒāĻŋāĻāĻāĻžāĻ° āĻ¸āĻŋāĻ¸ā§āĻā§āĻŽ āĻ āĻ¨ā§āĻŽāĻ¤āĻŋ āĻĻā§āĻ¯āĻŧ, āĻāĻāĻāĻŋ āĻāĻā§āĻāĻ¤āĻ° N
āĻĒā§āĻ°āĻ¸ā§āĻ¤āĻžāĻŦāĻŋāĻ¤ āĻšāĻ¯āĻŧāĨ¤ āĻāĻŽ I/O āĻāĻ° āĻāĻžāĻ°āĻŖā§ āĻāĻāĻŋ āĻĒā§āĻ°āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ°āĻŖā§āĻ° āĻāĻ¤āĻŋ āĻŦāĻžāĻĄāĻŧāĻŋāĻ¯āĻŧā§ āĻ¤ā§āĻ˛āĻ¤ā§ āĻĒāĻžāĻ°ā§āĨ¤
EXAMPLE āĻāĻŋ
āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻāĻŋāĻ¤ āĻāĻĻāĻžāĻšāĻ°āĻŖāĻāĻŋ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻ¤ā§ āĻ¤āĻŋāĻ¨āĻāĻŋ āĻāĻ¨āĻĒā§āĻ idstream āĻĢāĻžāĻāĻ˛ idsfile[1,2,3] āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻŦā§
idngram āĻĢāĻžāĻāĻ˛ all.id3gram. āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻĒā§āĻ¯āĻžāĻ°āĻž (āĻ āĻā§āĻ¯āĻ¨ā§āĻ¤āĻ°ā§āĻŖ āĻŽāĻžāĻ¨āĻāĻŋāĻ¤ā§āĻ°ā§āĻ° āĻāĻāĻžāĻ° āĻŦāĻž āĻšā§āĻ¯āĻžāĻļ āĻāĻāĻžāĻ°) āĻšāĻŦā§ 1024000,
āĻ āĻ¸ā§āĻĨāĻžāĻ¯āĻŧā§ āĻĢāĻ˛āĻžāĻĢāĻ˛ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻ¸ā§āĻ¯āĻŧāĻžāĻĒ āĻĢāĻžāĻāĻ˛ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĨ¤ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻā§āĻŽā§āĻĒ āĻĒā§āĻ¯āĻžāĻ°āĻž āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻ āĻŦāĻļā§āĻˇā§ āĻĒā§āĻ¯āĻŧā§ āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻž āĻšāĻŦā§
āĻā§āĻĄāĻŧāĻžāĻ¨ā§āĻ¤ āĻĢāĻ˛āĻžāĻĢāĻ˛āĨ¤
ids2ngram -n 3 -s /tmp/swap -o all.id3gram -p 1024000 idsfile1 idsfile2 idsfile3
onworks.net āĻĒāĻ°āĻŋāĻˇā§āĻŦāĻž āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻ āĻ¨āĻ˛āĻžāĻāĻ¨ā§ ids2ngram āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨