This is the Linux app named StringZilla whose latest release can be downloaded as stringzilla_shared_windows_x86_4.0.15.tar. It can be run online in the free hosting provider OnWorks for workstations.
OnWorks を使用して StringZilla という名前のこのアプリをオンラインで無料でダウンロードして実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショットは
Ad
ストリングジラ
DESCRIPTION
StringZilla は文字列ライブラリのゴジラであり、大規模なテキスト データセットを分割、並べ替え、シャッフルします。 StringZilla は、非常に単純なヒューリスティックを使用しているため、ほとんど愚かです...しかし、それは機能します。 memcpy の速度を達成するために、単語の最初の数文字をハイパースカラー コードと照合します。 この実装は単一の C 99 ヘッダー ファイルに収まり、古いプラットフォームでは異なる SIMD フレーバーと SWAR を使用します。 Str は、長い Python str 文字列を置き換え、C レベル API をラップするように設計されています。 一方、ファイルは、ファイルのコピーを RAM にロードせずに、永続メモリからファイルをメモリ マップします。 そのファイルの内容は不変のままであり、マッピングは複数の Python プロセスで同時に共有できます。 標準的なデータセット前処理の使用例は、Common Crawl のような大きなテキスト データセットをメモリにマップし、子プロセスを生成し、それらの間でジョブを分割することです。
オプション
- コレクションレベルの操作
- 低レベルの Python API
- 文字列ライブラリ、大規模なテキスト データセットの分割、並べ替え、およびシャッフル
- JavaScript ドキュメント
- Python ドキュメント
- 部分文字列検索
プログラミング言語
C + +
カテゴリー
これは、https://sourceforge.net/projects/stringzilla.mirror/ から取得できるアプリケーションです。 無料のオペレーティング システムの XNUMX つから最も簡単な方法でオンラインで実行できるように、OnWorks でホストされています。