これはコマンド html2markdown.py2 で、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks の無料ホスティング プロバイダーで実行できます。
プログラム:
NAME
html2markdown - HTML のページをマークダウンに変換します。
SYNOPSIS
html2マークダウン [オプション...] [(ファイル名|URL)[エンコーディング]]
DESCRIPTION
html2マークダウン 指定された HTML ページをダウンロードし、それを でマークアップされたテキストに変換します。
マークダウン。 ソース HTML ページは、ローカル ファイルまたはリモート URL の場合があります。 指定されていない場合は、
標準入力から読み取られます。 出力は標準出力に出力されます。
もし エンコーディング を指定すると、によって提供されるエンコード情報がオーバーライドされます。
HTTPサーバー。 指定がない場合は、 Python-フィードパーサー (利用可能な場合) に使用されます
ソースエンコーディングを決定します。 利用できない場合、またはローカル ファイルを読み取る場合、
エンコーディングは UTF-8 であると想定されます。
OPTIONS
--ラップリンクなし
長いリンクを折り返さないでください。
--無視-強調
強調のための書式設定は含めないでください。
-参照リンク
インライン リンクの代わりに参照形式のリンクを使用します。
--ignore-リンク
リンクにはいかなる書式設定も含めないでください。
--プロテクトリンク
リンクを山かっこで囲んで改行から保護します。
--ignore-images
画像の書式設定は含めないでください。
--images-to-alt
画像データを破棄し、代替テキストのみを保持します。
--サイズ付きの画像
寸法を維持するために、高さと幅の属性を持つイメージ タグを生の HTML として記述します。
-g, --google-doc
HTML でエクスポートされた Google ドキュメントを変換します。
-d, --ダッシュの順序なしリスト
順序なしリスト項目には、スターではなくダッシュを使用します。
-e, --アスタリスク-強調
強調されたテキストには、アンダースコアではなくアスタリスクを使用します。
-b BODY_WIDTH, --身幅=BODY_WIDTH
出力行あたりの文字数、 0 ラップなしの場合。
-i リスト_インデント, --google-リスト-インデント=リスト_インデント
Google がネストされたリストをインデントするピクセル数。
-s, --取り消し線の非表示
取り消し線のテキストを非表示にします。 以下の場合にのみ関連します -g も指定されています。
--エスケープオール
すべての特殊文字をエスケープします。 出力は読みにくくなりますが、例外的なケースは回避されます
フォーマットの問題。
--bypass-tables
Markdown 構文ではなく HTML でテーブルをフォーマットします。
--単一改行
ブロック要素の後には XNUMX つの改行ではなく XNUMX つの改行を使用します。 注意:
必要 --身幅=0.
--unicode-snob
文書全体で Unicode を使用します。
--自動リンクなし
該当する場合は、自動リンクを使用しないでください。
--no-skip-internal-links
内部リンクをスキップしないでください。
--パラグラフの後のリンク
文書の代わりに各段落の後にリンクを置きます。
--マークコード
プログラムコードブロックにマークを付ける [コード]...[/コード].
--デコードエラー=DECODE_ERRORS
デコードエラーが発生した場合の対処方法。 無視する, 厳格な, replace 許容できる
値。
- バージョン
プログラムのバージョン番号を表示して終了します。
-h, - 助けて
ヘルプメッセージを表示して終了します。
onworks.net サービスを使用して html2markdown.py2 をオンラインで使用する