これはUnsupervisedMTというLinuxアプリで、最新リリースはUnsupervisedMTsourcecode.tar.gzとしてダウンロードできます。ワークステーション向けの無料ホスティングプロバイダーであるOnWorksでオンラインで実行できます。
OnWorks を使用して、UnsupervisedMT というアプリを無料でダウンロードし、オンラインで実行します。
このアプリを実行するには、次の手順に従ってください。
-1。このアプリケーションをPCにダウンロードしました。
--2。ファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXに必要なユーザー名を入力します。
-3。このアプリケーションをそのようなファイルマネージャにアップロードします。
-4。このWebサイトからOnWorksLinuxオンラインまたはWindowsオンラインエミュレーターまたはMACOSオンラインエミュレーターを起動します。
-5。起動したばかりのOnWorksLinux OSから、必要なユーザー名でファイルマネージャーhttps://www.onworks.net/myfiles.php?username=XXXXXにアクセスします。
-6。アプリケーションをダウンロードし、インストールして実行します。
スクリーンショット:
教師なしMT
説明:
教師なし機械翻訳(Unsupervised Machine Translation)は、パラレルコーパスを用いずに翻訳を行うためのフレーズベースSMTとニューラルMTの両方のアプローチを実装した研究リポジトリです。ニューラルコンポーネントは、seq2seq、注意喚起付きbiLSTM、Transformerといった複数のアーキテクチャをサポートし、言語間で広範なパラメータ共有を可能にすることでデータ効率を向上させます。トレーニングは、ノイズ除去、自動エンコード、バックトランスレーションを利用し、オンザフライでマルチスレッド化された合成パラレルデータを生成して教師信号を継続的に更新します。このプロジェクトでは、単一言語データの取得と前処理、BPEコードの学習、言語間の教師なしアライメントをブートストラップするクロスリンガル埋め込みのトレーニングを行うスクリプトも提供しています。EMNLP 2018のコアセットアップに加えて、コードベースは、多言語トレーニング、共有パラメータによる言語モデルの事前トレーニング、敵対的トレーニングなどの追加のオプション機能を公開しています。
オプション
- seq2seq、biLSTM+attention、Transformerアーキテクチャを使用したニューラルMT
- エンコーダ/デコーダ間のパラメータ共有と複数言語の埋め込み
- ノイズ除去オートエンコーダのトレーニングとオンザフライ生成によるバックトランスレーション
- 大規模な単一言語コーパスをダウンロード、トークン化、BPE、およびバイナリ化するユーティリティ
- fastTextまたはアライメントメソッドによるクロスリンガル埋め込みでモデルを初期化する
- 自動化された Moses トレーニングと評価を備えた教師なし PBSMT パイプライン
プログラミング言語
Python、Unixシェル
カテゴリー
このアプリケーションは、https://sourceforge.net/projects/unsupervisedmt.mirror/ からも入手できます。OnWorks でホストされているため、無料のオペレーティングシステムから最も簡単にオンラインで実行できます。