GoGPT Best VPN GoSearch

OnWorksファビコン

html2text - クラウド上のオンライン

Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーター上の OnWorks 無料ホスティング プロバイダーで html2text を実行します。

これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの 2 つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド htmlXNUMXtext です。

プログラム:

NAME


html2text - 高度な HTML からテキストへのコンバーター

SYNOPSIS


html2テキスト -助けて
html2テキスト -バージョン
html2テキスト [ -解析解除 | -小切手 ] [ -デバッグスキャナー ] [ -デバッグ-パーサー ] [ -rcfile path ] [
スタイル ( コンパクト | かなり ) ] [ -幅 ] [ -o 出力ファイル ] [ -ノブ ] [ -ASCII |
-utf8 ] [ -ノメタ ] [ 入力ファイル ...]

DESCRIPTION


html2テキスト から HTML ドキュメントを読み取ります。 入力ファイルs、それぞれをストリームにフォーマットします。
プレーンテキスト文字を変換し、結果を標準出力 (または 出力ファイル、もし
  -o コマンドラインオプションが使用されます)。

ない場合 入力ファイルはコマンドラインで指定されます。 html2テキスト 標準入力から読み取ります。
ダッシュ 入力ファイル は、標準入力を指定する別の方法です。

html2テキスト すべての HTML 3.2 構造を理解しますが、その一部のみをレンダリングできます。
テキスト出力形式の制限。 ただし、プログラムは良いものを提供しようとしています
レンダリングできない要素を置き換えます。 html2テキスト HTML 4 入力も解析しますが、
他の HTML プロセッサほど成功するとは限りません。 構文的に間違っているものも受け入れます
入力し、それを「合理的に」解釈しようとします。

html2テキスト HTML ドキュメントの形式は、読み取り形式のプロパティによって制御されます。
RC ファイルから。 html2テキスト 読み込もうとします $HOME/.html2textrc (またはで指定されたファイル
  -rcfile コマンドラインオプション); そのファイルが読み取れない場合は、 html2テキスト 読み込もうとします
/etc/html2textrc。 RC ファイルを読み取れない場合 (または RC ファイルがすべてをオーバーライドしない場合)
書式設定プロパティ)、「妥当な」デフォルトが想定されます。 RC ファイル形式は次のとおりです。
html2textrc(5)マニュアルページ。

Debian バージョンの html2テキスト 入出力の記録も行うことができます (「
詳細については、/usr/share/doc/html2text/README.Debian)。 html2テキスト エンコーディングを取得しようとします
HTMLドキュメントから。 エンコーディングが指定されていない場合は、次を使用できます -ASCII   -utf8 オプション。
出力はユーザーのロケール文字セット (LC_CTYPE) に変換されます。

OPTIONS


-ノメタ
デフォルトでは、Debian バージョンの html2テキスト 入力に「meta http-equiv」タグを使用する
レコーディング中。 このオプションはこの動作をキャンセルします。

-ASCII デフォルトでは、 -ノメタ 供給される、 html2テキスト 使用されます UTF-8 出力用。
このオプションを指定すると、プレーン ASCII 代わりに使用されます。 非 ASCII であることを確認するには
文字がレンダリングされる場合は、ファイル「ascii.substitutes」を参照してください。

-utf8 デフォルトでは、 -ノメタ 供給される、 html2テキスト 使用されます ISO 8859-1 入力用に。
このオプションを指定すると、 UTF-8 代わりに (入力と出力の両方に) が使用されます。 これ
オプションは意味します -ノブ.

-小切手 このオプションは診断目的です。HTML ドキュメントは解析されるだけであり、解析されません。
それ以外の場合は処理されます。 この動作モードでは、 html2テキスト 解析について報告します
エラーとスキャン エラーが発生しますが、他の動作モードでは発生しません。 ご了承ください
解析エラーとスキャンエラーは致命的ではありません html2テキストただし、誤解を招く可能性があります
HTML コードやドキュメントの一部が飲み込まれます。

-デバッグ-パーサー
しましょう html2テキスト シフトされたトークン、適用されたルールなどをレポートします。
HTML ドキュメントをスキャンしています。 このオプションは診断を目的としています。

-デバッグスキャナー
しましょう html2テキスト HTML のスキャン中に、スキャンされた各語彙トークンに関するレポートを作成します。
書類。 このオプションは診断を目的としています。

-助けて コマンドラインの概要を出力して終了します。

-ノブ デフォルトではオリジナル html2テキスト 下線付きの文字を次のようなシーケンスでレンダリングします。
「アンダースコア-バックスペース-文字」と「文字-バックスペース-文字」のような太字文字
UTF-8 の問題のため、Debian バージョンの html2テキスト しない
バックスペースが生成されるため、このオプションは実際には何もしません。

-o 出力ファイル
出力を書き込む 出力ファイル 標準出力の代わりに。 ダッシュ
出力ファイル は、標準出力を指定する別の方法です。

-rcfile path
で指定されたファイルを読み取ろうとします。 path RC ファイルとして。

スタイル ( コンパクト | かなり )
形式 かなり 書式設定パラメータのデフォルト値の一部を変更します。
に文書化 html2textrc(5)。 書式設定パラメータの内容と方法を確認するには
デフォルトが変更されている場合は、ファイル「pretty.style」を確認してください。 このオプションを省略した場合、
コンパクト がデフォルトとみなされます。

-解析解除
このオプションは診断目的です。解析されたドキュメントをフォーマットする代わりに、
構文的に正しいことが保証された HTML コードを生成します。 もしも html2テキスト
構文的に正しくない HTML ドキュメントの解析に問題がある場合、このオプションが役立つ可能性があります
あなたは何を理解しますか html2テキスト 元のHTMLコードの意味だと思います。

-バージョン
プログラムバージョンを印刷して終了します。

-幅
デフォルトでは、 html2テキスト HTML ドキュメントを画面幅 79 に合わせてフォーマットします。
文字。 出力をファイルにリダイレクトする場合、または端末に幅がある場合
80 文字以外、または単にその方法を知りたい場合 html2テキスト 情報
大きなテーブルや異なる端末幅の場合は、
今とは異なる .

onworks.net サービスを使用してオンラインで html2text を使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

Linuxコマンド

Ad




×
Advertisement
❤️ここでショッピング、予約、購入してください。料金はかかりません。これにより、サービスが無料で維持されます。