英語フランス語スペイン語

Ad


OnWorksファビコン

ルックアップ - クラウドでオンライン

Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターを介して、OnWorks の無料ホスティング プロバイダーでルックアップを実行します。

これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、MAC OS オンライン エミュレーターなど、複数の無料オンライン ワークステーションのいずれかを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド ルックアップです。

プログラム:

NAME


lookup - インタラクティブなファイル検索と表示

SYNOPSIS


検索 [引数] [ file ... ]

DESCRIPTION


見上げる テキスト ファイルの迅速な対話型検索を可能にします。 ASCII、JIS-ROMAN、および
日本語 EUC パック形式のテキストで、統合されたローマ字カナ コンバーターを備えています。

この マニュアル


見上げる さまざまな用途に柔軟に対応します。 ただし、このマニュアルでは、
ジム・ブリーンの検索アプリケーション 布告 (和英辞典)と 漢字の (漢字
データベース)。 これらのファイルの内容と形式に精通していると役立ちます。 を参照してください
これらのファイルを取得する方法については、このマニュアルの最後にある INFO セクションを参照してください。
彼らのドキュメント。

概要 OF MAJOR 商品特徴


以下は、実際に読んでみたいというあなたの食欲をそそるいくつかの主要な機能について言及しているだけです。
マニュアル全体 (-:

ローマ字かなコンバーター
見上げる ローマ字を仮名に変換できます。その場で入力することもできます。

あいまい検索
検索は少しあいまいまたはあいまいな場合があります。
あなたは¡È¤È¤¤ç¡É(正しい読み方は¡È¤È¤¦¤¤ç¤¦¡É)を検索しようとします。

正規表現
パワフルで表現力豊かな レギュラー 表現 検索用。 簡単に特定できる
に影響を与える複雑な検索.
そ、そ、でも、それもまた、こんな特徴を持って……。

ワイルドカード「グロブ」パターン
必要に応じて、本格的な通常のファイル名の代わりに、よく知られたファイル名のワイルドカード パターンを使用できます
式。

フィルタ
あなたが持つことができます 検索 そうでなければ検索に一致する特定の行をリストしませんが、可能です
必要に応じて、すばやく確認できるように保存します。 たとえば、すべての名前のみのエントリを持つことができます
から 布告 通常の出力からフィルタリングされます。

自動修正
同様に、印刷の直前に行に対して標準的な検索と置換を行うことができます。
おそらく、ほとんどの検索で表示する必要のない情報を削除するためです。 たとえば、
あなたは一般的に興味がない 漢字のさんの中国語読み方情報、お持ちできます
印刷前に行から削除されます。

スマートワード優先モード
あなたが持つことができます 検索 を含むエントリのみを一覧表示する 全体 言葉 検索に一致するもの (反対に
〜に 埋め込まれた 一致、たとえば検索「内側」など) が、完全に一致する単語がない場合
存在する場合は、先に進み、検索に一致するエントリを一覧表示します。

便利な機能
その他の便利な機能には、動的に設定可能でパラメーター化されたプロンプト、自動
検索に一致する行の部分の強調表示、出力ページャー、readline-
長い入力行の水平スクロールを伴う入力のように、「lookup」起動ファイル、
自動化されたプログラマビリティなど。 読む!

REGULAR 表現


見上げる を自由に利用する レギュラー 表現 (または 正規表現 略して)さまざまな制御で
検索の側面。 正規表現の重要な概念に慣れていない場合は、以下をお読みください。
続行する前に、このマニュアルのチュートリアルの付録を参照してください。

日本を キャラクター エンコーディング 方法


内部的には、 検索 日本語パック形式 EUC で動作し、ロードするすべてのファイルをエンコードする必要があります
同様に。 JIS または Shift-JIS でエンコードされたファイルがある場合は、最初にそれらを EUC に変換する必要があります。
ロードする前に (これを実行できるプログラムについては、INFO セクションを参照してください)。

ただし、インタラクティブな入力および出力エンコーディングは、-jis、-sjis、および
-euc 呼び出しフラグ (デフォルトは -euc)、またはプログラムへのさまざまなコマンド (説明
後)。

システムに適したエンコーディングを使用してください。 X の下で kterm を使用している場合
ウィンドウシステム、使用できます 検索の -jis フラグを kterm のデフォルトの JIS エンコーディングに一致させます。 もしくは、あなた
kterm の「-km euc」起動オプション (またはメニュー選択) を使用して、kterm を EUC モードにすることができます。
また、kterm のスクロールバー (「-sb -sl 500」) が非常に便利であることがわかりました。

日本には多くの英語のフォントがあり、通常はバックスラッシュとして印刷される文字
(半角バージョンの ¡À) は、米国では円記号 (半角バージョンの ¡
私)。 システムでどのように表示されるかは、使用するフォントと出力の関数です
これは、使用されていたフォントや方法とは異なる場合があります。
このマニュアルを印刷します (どちらもキーボードに印刷されているものとは異なる場合があります)。
適切なキー)。 読むときは、このことを念頭に置いてください。

起動


あなたのコピーが 布告 である ~/lib/布告. で簡単にプログラムを開始できます

検索 ~/lib/布告

お気づきでしょう 検索 の前にインデックスの構築に時間を費やします。
default→→lookup→→プロンプトが表示されます。

見上げる 検索するファイルのインデックスを構築することで、検索速度を大幅に向上させます。
インデックスの構築自体に時間がかかる場合があるため、 検索 ビルドを書く
次にプログラムを実行するときにすばやくロードできるファイルへのインデックス。 索引ファイル
エンディングはジェフリーズ・インデックス(Jeffrey's Index)。

のインデックスを作成しましょう 布告 & 漢字の 今:

ルックアップ - 書き込み ~/lib/布告 ~/lib/kanjidic

これにより、インデックスファイルが作成されます
~/lib/edict.jin
~/lib/kanjidic.jin
終了します。

これで再起動できます 検索 , 事前に計算されたインデックス ファイルを次のように自動的に使用します。

検索 ~/lib/布告 ~/lib/kanjidic

インデックスが作成されるのを待たずに、プロンプトが表示されます。
(ただし、遅延の考えられる理由については、オペレーティング システムに関するセクションを参照してください)。

入力


基本的に、検索とコマンドの XNUMX 種類の入力があります。 コマンドは次のようなことを行います
言う 検索 より多くのファイルをロードするか、フラグを設定します。 一部に一致するファイルのレポート行を検索します
検索指定子 (検索する行を XNUMX つ以上の正規表現で指定します)。

入力構文は最初は奇妙に思えるかもしれませんが、強力で強力になるように設計されています。
簡潔。 それをよく学ぶために少し時間を費やすと、必要なときに大きな成果が得られます。

BRIEF 実施例


あなたが始めたと仮定して 検索   布告 & 漢字の 上記のように、いくつか試してみましょう
検索します。 これらの例では、
Èsearch [勅令]> ¡É
プロンプトです。 「Æ>」の後のスペースはプロンプトの一部であることに注意してください。

入力を考慮すると:

検索 [布告]> 静かな

検索 Ètranquil¡É という文字列を含むすべての行を報告します。 現在、約
そのような行は数十行あり、そのうちの XNUMX 行は次のようになります。

°Â¤é¤« [¤ä¤¹¤é¤«] /平和 (an)/静かな/穏やかな/休息/
°Â¤é¤® [¤ä¤¹¤é¤®] /平和/平穏/

Ètranquil¡Éの行に注意してください&「静けさ」は一致しましたか? これは、「静か」だったからです。
「静けさ」という言葉に埋め込まれています。 のみに検索を制限できます。
単語「tranquil」特殊文字「単語の開始」「記号」「<」を先頭に追加し、
次のように、特殊な「単語の終わり」「シンボル」「>」を正規表現に変換します。

検索 [布告]>

これは正規表現で、「単語の先頭」の後に「t」、「r」、「」が続きます。
...,¡Æl¡Ç, これは単語の末尾にあります.¡É現在のバージョンの 布告 XNUMXつしかありません
一致するエントリ。

別の方法を試してみましょう:

検索 [布告]> 福島

これは「英語」「フクシマ」の検索です。仮名または漢字の検索方法は次のとおりです。
後で調べました。 選択されて印刷されたいくつかの行の中には、次のものがあることに注意してください。

ÉûÅç [¤Õ¤¯¤·¤Þ] /福島 (pn,pl)/
ÌÚÁ¾Ê¡Åç [¤¤½¤Õ¤¯¤·¤Þ] /木曽福島 (pl)/

デフォルトでは、検索は大文字と小文字を区別しない方法で行われます。
by 検索、少なくともマッチングに関する限り。 これは 場合 折り畳み式の.

このオプションをオフにするコマンドを与えてみましょう。
同じ。 ここで奇妙な点について ルックアップ 入力構文: デフォルト設定では、すべて
コマンドラインはスペースで始める必要があります。 スペースは (デフォルト) コマンドの導入部です。
文字を検索し、通常の検索ではなくコマンドを期待するように入力パーサーに指示します
式です。 It is a 一般的な ミス at 最初の 〜へ 忘れます   主要な スペース いつ を発行する
指図。 気をつけて。

コマンド「fold」を試して、ケース折りの現在のステータスを報告してください。 すぐに注意してください
スペースを入力すると、プロンプトが
↑検索コマンド> ↓
検索仕様ではなくコマンドを入力していることを思い出してください。

ルックアップ コマンド > 折り畳み

返信は「file #0's case folds is on」のはずです

折り畳み式で実際にオフにすることができます。 もう一度「福島」で検索してみてください。
今回は「福島」のエントリがリストされていないことに注意してください。 さっそく検索してみる
文字列「フクシマ」で、「フクシマ」を含むエントリがリストされていないことを確認します。

ケースの折り畳みは通常非常に便利です(対応するカタカナとひらがなも作成されます)
同じように一致します)、オンに戻すことを忘れないでください:

ルックアップ コマンド > フォールド オン

日本を 入力


見上げる 自動ローマ字カナ変換機能付き。 先頭の「Æ/」はローマ字であることを示します。
従う。 「È/tokyo」と入力してみてください。入力すると、「È/¤È¤¤ç」に変換されます。 打ったとき
戻り、 検索 ȤȤ¤¤çÉをどこかに含むすべての行をリストします。 そうですね。 見て
一致する行で慎重に。 それらの中に (ケースを折り畳んだ場合)、次のように表示されます。

¥¥ê¥¹¥È¶µ [¥¥ê¥¹¥È¤¤ç¤¦] /キリスト教/
Åìµþ [¤È¤¦¤¤ç¤¦] /東京 (pl)/東京/日本の現在の首都/
Æ̶À [¤È¤ã¤¤ç¤¦] /凸レンズ/

最初のものには、ȤȤ¤ç¡Éが含まれています(ȥȤ¤ç¡Éとして、大文字と小文字のȥȡÉが一致します-
ひらがなには鈍感な方法です。
それらには ȤȤ¤¤ç がありません。 それらは近い (¡È¤È¤¦¤¤ç¡Éand¡È¤È¤ã¤¤ç¡É) ですが、正確ではありません。
これは次の結果です 検索ファジー化です。 コマンドを試してみてください。
コマンド導入スペース)。 ファジー化がオンになっていることがわかります。 消して
「fuzz off」を使用して、「/tokyo」(入力すると変換されます) をもう一度試してください。 今回はあなただけ
ȤȤ¤ççÉを正確に持っている行を取得します(まあ、大文字と小文字の折り畳みはまだオンになっているので、一致する可能性があります
カタカナも)。

あいまい検索では、母音の長さは無視されます。
例。 また、Ȥã¡É文字の有無は無視され、ペア¤¸¤Â、
¤º ¤Å、¤¨ ¤ñ、および ¤ª ¤ò は、あいまい検索では同一と見なされます。

あいまい検索を「発音検索」と考えると便利かもしれません。 特別
注: 正規表現である場合、ファジィ化は実行されません。
非ASCII文字。 入力パターンがファイル名のようなワイルドカードの場合、これは問題ではありません
パターン (以下で説明)。

かなのあいまいさに加えて、あいまいさがオンの場合、漢字には特別なケースが XNUMX つあります。 の
漢字の繰り返しマーク「È¡¹¡É」は、「È»þ¡¹¡Éと「È»þ»þ¡É」が一致するように認識されます。

ファジー化をオンに戻し (「fuzz on」)、すべてを検索します。 全体 言葉 どの音
東京みたい。 その検索は次のように指定されます。

検索 [布告]> /

(繰り返しますが、「tokyo」は、入力すると「ȤȤ¤ç」に変換されます)。 私のコピー 布告 XNUMXつ持っている
ライン

Åìµþ [¤È¤¦¤¤ç¤¦] /東京 (pl)/東京/日本の現在の首都/
Æõö [¤È¤ã¤¤ç] /特別許可/特許/
Æ̶À [¤È¤ã¤¤ç¤¦] /凸レンズ/

この種の単語全体のローマ字とかなの検索は非常に一般的で、特別なショートカットがあります。
入力する代わりに¡È/ ¡È[tokyo]¡Éと入力できます。 主役はスタートを意味する
ローマ字&「単語の開始」。 あなたは入力しましたか? 代わりに(なしで
先頭の¡Æ/¡Çor¡Æ[¡Çtoはローマ字からかなへの変換を示します)、すべての行を取得します
英語 丸ごと「tokyo」が入っています。 それも合理的な要求ですが、そうではありません
私たちは現時点で望んでいます。

かな変換に加えて、ウィンドウ システムで使用できる任意のカット アンド ペーストを使用できます。
検索行に日本語テキストを取得するために提供します。 ȤȤ¤ç¡Éをどこかから切り取り、
検索ライン。 Enter キーを押して検索を実行すると、何も入力されていないことがわかります。
ファジー化 (ファジー化フラグがオンになっていても)。 ないからだよ
主要な¡Æ/¡Ç。 先頭の「Æ/」は、ローマ字からかなへの変換が必要であることを示すだけでなく、
しかし、あなたはそれをファジーにやりたいと思っています。

したがって、あいまいなカット アンド ペーストが必要な場合は、ペーストする前に先頭に「Æ/」を入力します (または、戻って
貼り付けた後に先頭に追加します)。

これらの例はすべて非常に単純ですが、正規表現が持つすべての力を利用できます。
オファー。 もう少し複雑な例として、検索¡Éはすべての行を探します
「グレー」または「グレー」という言葉が入っています。 Æ[¡Çは行頭ではないので、
上記の意味ではありません(語頭ローマ字)。 この場合、それはちょうど
正規表現「クラス」インジケータ。

ファイル名のような「*.txt」ワイルドカード パターンを使用する方が快適な場合は、次を使用できます。
「ワイルドカード オン」コマンドを使用すると、パターンをこのように見なすことができます。

これは、の基本の簡単な紹介でした 検索.

非常に強力で、はるかに複雑になる可能性があります。 以下は、そのさまざまな詳細な説明です
パーツと機能。

読み込まれた行 入力


実際のキーストロークは、かなり標準的な readline 風のパッケージによって読み取られます。 加えて
タイプするだけでなく、次のキーストロークを使用できます。

^B / ^F 行内で XNUMX 文字左/右に移動
^A / ^E 行頭/行末に移動
^H / ^G カーソルの左右の XNUMX 文字を削除
^U / ^K カーソルの左右のすべての文字を削除
履歴リストの ^P / ^N 前/次の行
^L または ^R 線を再描画します
^D カーソルの下の文字を削除するか、行が空の場合は EOF
^スペースフォースのローマ字変換 (一部のシステムでは^@)

ローマ字からかなへの自動変換がオンになっている場合 (デフォルトではオンになっています)、特定の
上記のように、変換が行われる状況。 小文字のローマ字は
ひらがな、大文字のローマ字はカタカナに変換されます。 これは通常問題にはなりませんが、
ただし、大文字と小文字の折り畳みは検索でひらがなとカタカナを同じように扱うためです。

正確にどのような状況で自動変換が行われるかは、むしろ意図されています
基本的な考え方を習得すれば、直感的に使用できます。 ただし、 どれか 時間、制御空間を使用して
カーソルの左側の ASCII をかなに変換します。 これは、次の場合に特に役立ちます。
コマンドラインで仮名を入力する必要がある (自動変換が行われない場所。以下を参照)

ローマ字 FLAVOR


ローマ字のほとんどのフレーバーが認識されます。 特別なまたは非自明な項目は以下に記載されています。
小文字はひらがな、大文字はカタカナに変換されます。

長母音は、母音を繰り返すか、Æ-¡Çまたは​​Æ^¡Çで入力できます。

Èna¡É が ¤Ê または ¤ó¤¢ のようにあいまいな場合は、一重引用符を使用して
力 ¤ó. したがって、「Ökenichi」×¢ª¤±¤Ë¤Á一方、「Ökenichi」×¢ª¤±¤ó¤¤¤Á.

ローマ字は、¤Õ¤¡ や ¤Á¤§ などの多くの非標準的な組み合わせで豊富に拡張されています。
直感的な方法で表されます:¡Öfa¡×¢ª¤Õ¤¡,¡Öche¡×¢ª¤Á¤§。 等

関心のある他のさまざまなマッピング:

を ¢è¤ò 我々¢è¤ñ wi¢è¤ð
VA¢è¥ô¥¡ VI¢è¥ô¥£ VU¢è¥ô VE¢è¥ô¥§ VO¢è¥ô¥©
di ¢ª¤â dzi¢ª¤â dya¢ª¤â¤ã dyu¢ª¤â¤å dyo¢ª¤â¤ç
デュ ¢è¤Å ツズ¢è¤Å ズズ¢è¤Å

(以下の仮名はすべて通常の仮名の縮小版です)

xa ¢ã ¤¡ xi¢ã ¤£ xu¢ã ¤¥ xe¢è¤§ xo¢è¤©
xu ¢ª¤¥ xtu¢ª¤ã xwa¢ª¤î xka¢ª¥õ xke¢ª¥ö
xya¢ã ¤ã xyu¢ã¤å xyo¢è¤ç

入力 構文


スペースで始まる任意の入力行 (またはコマンドとして設定されている任意の文字)
導入文字)をコマンドとして処理する 検索 検索仕様ではなく。
オートマチック これらの行では仮名変換は行われません (ただし、 強制的な 制御による変換-
スペースはいつでも実行できます)。

その他の行は、次の特殊なケースで検索正規表現として使用されます。

? 単一の疑問符で構成される行は、現在のコマンドの導入を報告します
文字 (デフォルトはスペースですが、「cmdchar」コマンドで変更できます)。

= 行が「Æ=¡Ç」で始まる場合、(「Æ=¡Ç」のない行) は通常の検索と見なされます。
式であり、自動 (または内部 -- 以下を参照) かな変換はどこでも行われません。
行 (繰り返しますが、変換は常に制御スペースで強制できます)。 これはすることができます
正規表現の先頭がコマンドの紹介である検索を開始するために使用されます
文字、または自動かな変換が一時的に行われない特定の状況で
欲しい。

/¡Æ/¡Çで始まる行は、行全体のローマ字入力を示します。 自動仮名なら
変換がオンになっている場合、ローマ字が入力されると、変換はリアルタイムで行われます。
それ以外の場合は、行が入力されると内部で行われます。 関係なく、 の存在
先頭の「Æ/」は、仮名 (変換またはカット アンド ペースト) が必要であることを示します。
ファジー化がオンになっている場合。

上記に加えて、行が「Æ=」またはコマンドの紹介で始まらない場合
文字 (および自動変換がオンになっている)、¡Æ/¡Ç どこにでも オンザラインが開始します
次の単語の自動変換。

[ ¡Æ[¡Çで始まる行はローマ字とみなされます(ちょうど¡Æ/¡Çで始まる行と同様に、
変換されたローマ字はファジー化されます (オンの場合)。 ただし、Æ[¡Çが使用されている場合
Æ/¡Ç ではなく、暗黙の Æ<¡
正規表現。 また、そのような行の末尾は、「」の末尾に変換されます。
結果の正規表現では単語「指定子」「>」です。

上記に加えて、行には特定のプレフィックスとサフィックスがあり、さまざまな側面を制御できます。
検索またはコマンド:

! 先頭に追加することで、特定の検索中にさまざまなフラグを切り替えることができます
a¡È!!¡Éシーケンスを入力行に。

それぞれに関連するコマンドとともに、シーケンスを以下に示します。

!F! ¡Ä この行のろ過が切り替えられます(フィルタ)
!M! ¡Ä この行の変更がトグルされます(変更)
!w! ¡Ä この行(単語)の単語優先モードが切り替えられます
!c! この行は大文字と小文字が折り畳まれています (fold)
!f! ¡Ä この行ではファジー化がトグルされています(ファズ)
!W! この行ではワイルドカード パターン モードが切り替えられます (ワイルドカード)
!r! 生。 この行のファジー化を強制的にオフにします
!h! ¡Ä この行のハイライトがトグルされます(ハイライト)
!t! ¡Ä この行のタグ付けが切り替えられます(タグ)
!d! ¡Ä この行は表示中(表示)

文字は¡È!cf!¡Éのように組み合わせることができます。

シーケンスの後の最初の文字が ASCII でない場合、最後の「Æ!」は省略できます。
文字。

文字が指定されていない場合 (¡È!!¡É).¡È!f!¡É がデフォルトです。

これらの最後の XNUMX つのポイントは、「È!/ローマ字」の一般的なケースで便利に組み合わせることができます。
È!f!/ローマ字と同じです。

特別なシーケンスは、上記をリストし、現在回転しているものを示します
に。

a¡È!!¡Ésequenceで受け入れられる文字は、によって示される指標の多くであることに注意してください
「files」コマンド。

+ A¡Æ+¡Ç上記のものの先頭に追加すると、最終的な検索正規表現が出力されます。 これは
あいまい化および/または内部仮名変換がいつ、どのようなものであるかを確認するのに役立ちます
ハプニング。 検討:

検索 [勅令]> +/¤ï¤«¤ë
マッチは¡È¤ï[¤¡¤¢¡¼]*¤ã?¤«[¤¡¤¢¡¼]*¤ë[¤¥¤¦¤ª¤©¡¼]*¡É

「リーディング」のために仮名がぼやけているため、多少複雑な結果が説明されます。
正規表現。 比較のために、次の点に注意してください。

検索 [勅令]> +¤ï¤«¤ë
一致は「」です。
検索 [勅令]> +!/¤ï¤«¤ë
一致は「」です。

「+」が示すように、これらはファジー化されていません。 最初のものには先頭がありません。
あいまい化を誘発しますが、XNUMX 番目の行には「Æ!」行の接頭辞があります (これがデフォルトです)。
その行のファジー化モードを「オフ」に切り替えます。

、すべての検索とほとんどのコマンドのデフォルトは、ロードされた最初のファイルで動作することです(布告
これらの例では)。 このデフォルトを変更することもできます (「select」コマンドを参照してください)。
入力行の最後にコンマと数字の並びがある場合、その行を別の行と強制的に連携させる
以前にロードされたファイル。 追加された「,1」は、最初の余分なファイルがロードされた状態で動作します (これらの
例、 漢字の)。 追加された「2」は、2 番目の余分なファイルがロードされた状態で動作します。

追加された「,0」は、元の最初のファイルで機能します (デフォルトのファイルが
Èselect コマンドで変更されています)。

次のシーケンスは、一般的な使用法を示しています。

検索 [勅令]> [¤È¤¤ç¤È]
ÅìµþÅÔ [¤È¤¦¤¤ç¤¦¤È] /東京都/

上から○を切り貼りし、検索に○、○を追加 漢字の:

検索 [布告]> ÅÔ,1
ÅÔ 4554 N4769 S11 ..... ¥È ¥Ä ¤ß¤ä¤³ {大都市} {首都}

ファイル名のようなもの ワイルドカード マッチング


ワイルドカード パターン モードが選択されている場合、パターンは拡張されていると見なされます。Q "*.txt" "-like"
パターン。 これは、正規表現に慣れていないユーザーにとってより便利な場合がよくあります。 に
このモードがデフォルトで選択されている場合は、

デフォルトのワイルドカード

「.lookup」ファイルにコピーします (下記の「STARTUP FILE」を参照)。

ワイルドカード モードがオンの場合は、「È*」、「È?」、「È+」、および「È.」のみが影響を受けます。 のエントリを参照してください。
詳細については、以下の「wildcard」コマンドを参照してください。

複数パターン検索 (後述) やその他の通常の検索など、その他の機能
式のメタ文字を使用できます。

マルチパターン 検索


複数のパターンを XNUMX つの検索指定子に入れることができます。 たとえば、

検索 [勅令]> 中国||日本

最初の部分 (「china」) は、「china」を含むすべての行を選択します。 それから、 から 間で
それらの ラインの XNUMX 番目の部分では、「japan」が含まれる行が選択されます。 ¡È||¡Éはそうではありません
あらゆるパターンの一部 -- それは 検索パイプの仕組み。

上記の例は、「china|japan¡É」を選択する単一のパターンとは大きく異なります。
Èchina¡Éのいずれかを含むすべての行or「日本」。 Èchina||japan¡Éでは、次のようなセリフが得られます
中国にある& その後 また 日本もある。

また、正規表現「china.*japan」(またはワイルドカード
Èchina*japan¡É) パターンは、Èchina を含む行を選択し、その後、いくつかのものを選択します。
日本。 しかし、「日本」が「中国」の前に来る場合を考えてみましょう。 あなたのためだけに
比較すると、複数パターン指定子「china||japan」は、
単一の正規表現「china.*japan|japan.*china」.

È|||¡É の代わりに È|!|¡É を使用すると、次のようになります。 マッチング...¡

のすべての行を見つける方法を考えてみましょう 漢字の ハルパーン数はあるが、
ネルソン数:

検索 [布告]> |!|

次に、リストを次のものに制限したい場合 また ジンメイヨウマーキングを持っていた
(漢字の's¡ÈG9¡Éfield) で、読みが ¤¢¤ だった場合、次のように作成できます。

検索 [布告]> |!| || ||<¤¢​​¤>

先頭に Æ+¡Ç を追加すると、次のように説明されます。

試合はえ
ではないえ
とえ
そして¡È<¤¢¤>¡É

¡È|!|¡Éおよび¡È||¡Éを使用して、いずれかで最大XNUMX個の個別の正規表現を作成できます
検索仕様。

繰り返しになりますが、「È||」は「または」(C プログラムの場合のように「または」を意味するものではない)
正規表現内でのように)。 読むと便利かもしれません¡È||¡Éas¡È&
また、読書しながら え。

È||¡Éand¡È|!|¡É構文の周りの空白は、
無視されますが、両側の正規表現の一部として保持されます。

組み合わせ SLOTS


各ファイルは、ロードされると「スロット」に割り当てられ、その後ファイルが参照されます。
その後作られます。 その後、スロットを検索したり、フィルターやフラグを設定したりできます。

単一のファイルを表すのではなく、コンビネーション スロットと呼ばれる特別な種類のスロットです。
以前にロードされた複数のスロットを表すことができます。 組み合わせスロット (または「コンボ」) に対して検索します。
slot「略して) それに関連付けられている、以前にロードされたすべてのスロットを検索します。
(「コンポーネント スロット」と呼ばれます)。 コンボスロットは 組み合わせる

コンボ スロットにはフィルターまたは変更仕様はありませんが、ローカル プロンプトとフラグを持つことができます。
通常のファイル スロット。 ただし、フラグはコンボ スロットで特別な意味を持ちます。 ほとんどのコンボ
スロット フラグは、コンポーネント スロット フラグに対するマスクとして機能します。 のメンバーとして行動したとき
対応するコンボスロットのフラグが無効になっている場合、コンポーネントスロットのフラグは無効になります。
無効にする。

これに対する例外は、 オートカナ, ファズ, タグ フラグ。

  オートカナ & ファズ flags は、通常のファイル スロットとまったく同じようにコンボ スロットを管理します。
スロットがコンビネーション スロットのコンポーネントとして検索されると、コンポーネント スロットの ファズ (と
オートカナ) フラグ、またはその欠如は無視されます。

  タグ フラグはまったく異なります。 を参照してください タグ コマンドで完全な情報を取得できます。

からの次の出力を検討してください。 ファイル コマンド:

¨®¨¬¨³¨¬¨¬¨¬¨¬¨¸¨¬¨¬¨³¨¬¨¬¨¬¨³¨¬¨¬¨¬¨¨¨¨¨¨¨¨¨¨¨¨¨¨ ¨¬¨¬¨¬¨¬
¨ 0¨F wcfh d¨¢a I¨ 2762k¨/usr/jfriedl/lib/edict
¨ 1¨ FM cf d¨¢a I ¨ 705k¨/usr/jfriedl/lib/kanjidic
� 2�F cfh@d�¢a� 1k�/usr/jfriedl/lib/local.words
¨*3¨FM cfhtd¨¢a¨combo¨kotoba (#2, #0)
¨±¨¬¨µ¨¬¨¬¨¬¨¬¨º¨¬¨¬¨µ¨¬¨¬¨¬¨µ¨¬¨¬¨¬¨¨¨¨¨¬¨¬¨¬¨¬¨¬ ¨¬¨¬¨¬¨¬

のディスカッションを参照してください。 ファイル 出力の基本的な説明については、以下のコマンドを参照してください。

ご覧のとおり、スロット #3 は 組み合わせ スロット 「コトバ」という名前で コンポーネント スロット 2
そしてゼロ。 このスロットで検索が開始されると、最初のスロット #2「local.words」が
検索された後、スロット #0「edict」。 コンボスロットの filter フラグは on、コンポーネント
スロット」 filter 検索中、フラグはオンのままです。 コンボスロットの 単語 フラグは オフ,
ただし、スロット #0 の 単語 フラグは検索中に強制的にオフになります。

ジョブの設定方法については、 組み合わせる コンボ スロットの作成については、コマンドを参照してください。

PAGER


見上げる ページャーが組み込まれています(a'la 他には?)。 画面をテキストで埋めると、文字列
--MORE [スペース、リターン、c、q]--
示されています。 スペースはテキストの別の画面を許可します。 改行すると、もう XNUMX 行許可されます。 A¡Æc¡Ç
次のコマンドまで、出力テキストをページングせずに続行できるようにします。 A¡Æq¡Ç は出力をフラッシュします
現在のコマンド。

OSがサポートしている場合、 ルックアップ 画面サイズのアイデアは、起動時に自動的に設定され、
ウィンドウのサイズ変更。 見上げる 両方の水平入力を行うには、画面の幅を知っている必要があります-
行のスクロール、および長い行が画面上でいつ折り返されるかを知るため。

ページャーのパラメーターは、「pager」コマンドを使用して手動で設定できます。

コマンド


コマンドを意図した行は、コマンド導入文字 (
デフォルトはスペースですが、「cmdchar」コマンドで設定できます)。 しかし、そのキャラクターはそうではありません
コマンド自体の一部であり、次のコマンド リストには表示されません。

で動作するコマンドがいくつかあります。 選択 file or 選択 スロット (両方の意味
同じこと)。 選択されたファイルは、追加されたコンマ + 数字によって示されるファイルです。
上記の通り。 そのような指示が与えられていない場合、デフォルト 選択 file 使用されます(通常
最初にロードされたファイルですが、「select」コマンドで変更できます)。

一部のコマンドは、 ブール値 フラグをオンまたはオフにするなどの引数。 そのようなすべての場合において、
「1」または「オン」はフラグをオンにすることを意味し、「0」または「オフ」はフラグをオフにするために使用されます。 いくつかの
フラグはファイルごと (「fuzz」、「fold」など) であり、そのようなフラグを設定するコマンドは通常設定します。
選択したファイルのみのフラグ。 ただし、その後に引き継がれるデフォルト値は
ロードされたファイルは、コマンドの先頭に「default」を追加することで設定できます。 これは特に便利です
ファイルがロードされる前の起動ファイル (「起動ファイル」セクションを参照)。

「Æ|」で区切られた項目は、相互に排他的な可能性 (つまり、ブール値の引数)
È1|オン|0|オフ)。

括弧内の項目 (「Æ[」および「」」「」) はオプションです。 ブール値を受け入れるすべてのコマンド
オプションでフラグまたはモードを設定する引数 -- 引数がない場合、コマンドは報告します
モードまたはフラグの現在のステータス。

引数を引用符で囲むことができるコマンド (load など) では、単一または
二重引用符。

コマンド:

[デフォルト] オートカナ [ブール値]
自動ローマ字 ¢ª かな変換 選択 file オンまたはオフになっています (デフォルトは
の上)。 ただし、「デフォルト」が指定されている場合、デフォルトとして継承される値は、
その後ロードされるファイルが設定 (または報告) されます。

入力構文セクションで説明されているように、先頭に「=」を追加することで一時的に無効にすることができます。

クリア|CL
画面のクリアを試みます。 kterm を使用している場合は、適切な tty を出力するだけです
制御シーケンス。 それ以外の場合は、「clear」コマンドを実行しようとします。

cmdchar ['半角文字']
デフォルトのコマンド導入文字はスペースですが、これを介して変更できます
指図。 文字を囲む一重引用符が必要です。 引数が指定されていない場合は、
現在の値が出力されます。

単一の疑問符で構成される入力行も現在の値を出力します
(現在の値がわからない場合に便利です)。

コマンド導入文字を他の特殊文字のいずれかに設定するものは悲惨です
¡Æ+¡Ç、¡Æ/¡Çなどの入力行文字。

結合 [「名前」] [ NUM += ] スロット番号 ...
コンビネーション スロットにファイル スロットを作成または追加します (コンビネーション スロットのセクションを参照してください)。
一般情報)。 コマンドとして「コンボ」を使用することもできます。

この例では、スロット 0 ~ 2 にファイルがロードされていると仮定します。 縮れた, 萌え, ラリー,
XNUMX つすべてを参照する組み合わせスロットを作成できます。

コンボ「三ばか大将」 2, 0, 1

コマンドは報告します

コンボ スロット #3 (三ばか大将) の作成: 2 0 1

  オプションで、 ファイル リスト、および指定するために使用されることもあります
への引数としてのスロット select

新しく作成されたコンボ スロットを介した検索は、 コンボ
コマンドライン: 最初 ラリーをタップし、その後、 縮れた、 そして最後に 萌え.

後で別のファイルを読み込む場合 (たとえば、 ジェフリー スロット #4) に追加することができます。
以前作ったコンボ:

コンボ 3 += 4

(「È+=」という言葉遣いは、C プログラミング言語に由来し、「に追加する」という意味です)。
組み合わせに追加すると、常にリストの最後にスロットが追加されます。

必要に応じて、スロットを追加して名前を変更することもできます。

コンボ「四手」 3 += 4

返信は次のようになります
コンボ スロット #3 (4 手先) に追加: XNUMX

ファイル スロットは、特定のコンボ スロットのコンポーネントになることができるのは XNUMX 回だけです。 通報するときは
スロット番号を作成または追加した場合、その番号がすでに使用されている場合は括弧内に表示されます
リストのメンバー。

さらに、ただ file スロットはの構成要素メンバーになることができます コンボ スロット。 組み合わせようとする
コンボスロット X コンボスロットへ Y 結果として Xのコンポーネント ファイル スロット (
コンボスロット自体)に追加 Y.

コマンド デバッグ [ブール値]
内部コマンド パーサーのデバッグ フラグをオンまたはオフに設定します (デフォルトはオフ)。

デバッグ [ブール値]
内部の一般的なデバッグ フラグをオンまたはオフに設定します (デフォルトはオフ)。

説明する 指定子
このコマンドは、文字 (または文字列内の各文字) がどのようにエンコードされているかを示します。
さまざまなエンコード方法:

検索コマンド > 「μ¤」を記述する
EUC は 0xb5a4 (181 164; 265 \244) です。
JIS は 0x3524 ( 53 36; 65 \044 "5$")
KUTEN は 2104 なので ( 0x1504; 25 \004)
S-JIS は 0x8b1f (139 31; 213 \037) であるため

説明する文字または文字列を囲む引用符はオプションです。 与えることもできます
通常のASCII文字で、その文字の倍幅バージョンが記述されています....
たとえば、ÈA¡É を示すと、È£Á¡É が記述されます。 指定子 XNUMX桁になることもあります
区点値の場合、その区点を持つ文字が記述されます。

四桁なら 指定子 0 進数が含まれているか、前に「XNUMXx」が付いている場合は、値
をJISコードとする。 値の前に「Èjis」、「Èsjis」、「euc」、または「Èkuten」を付けることができます。
要求されたコードへの解釈を強制します。

最後に、 指定子 取り除かれた JIS (漢字インと漢字アウトのない JIS) の文字列にすることができます
コード、またはコードを含むがエスケープ文字を含まない)。 ために
たとえば、ÈF|K\¡É は、Æü と ËÜ の XNUMX 文字を表します。

エンコーディング [euc|sjis|jis]
-euc、-jis、および -sjis コマンドライン オプションと同じように、
インタラクティブな入力と出力 (または現在のステータスを報告します)。 出力の詳細
エンコーディングは、 出力 エンコーディング 指図。 入力用の別のエンコーディング
で設定できます エンコーディング

ファイル [ - | 長さ ]
次のように、どのファイルがどのスロットにロードされているか、およびそれらに関するいくつかのステータス情報を一覧表示します。

¨*0¨F wcfh d¨¢a I¨ 3749k¨/usr/jeff/lib/edict
¨ 1¨ FM cf d¨¢a I ¨ 754k¨/usr/jeff/lib/kanjidic

¨®¨¬¨³¨¬¨¬¨¬¨¬¨¬¨¸¨¬¨¬¨³¨¬¨¬¨¬¨³¨¬¨¬¨¬¨¬¨¬¨¬¨¬¨¬¨¬ ¨¨¨¨¨¨¨¨¨¨
¨ 0¨F wcf hd ¨¢a I ¨ 2762k¨/usr/jfriedl/lib/edict
¨ 1¨ FM cf d ¨¢a I ¨ 705k¨/usr/jfriedl/lib/kanjidic
� 2�F cfWh@d�¢a� 1k�/usr/jfriedl/lib/local.words
¨*3¨FM cf htd¨¢a¨combo¨kotoba (#2, #0)
� 4� cf d�¢a� 205k�/usr/dict/words
¨±¨¬¨µ¨¬¨¬¨¬¨¬¨¬¨º¨¬¨¬¨µ¨¬¨¬¨¬¨µ¨¬¨¬¨¬¨¬¨¬¨¬¨¬¨¬¨¬ ¨¨¨¨¨¨¨¨¨¨

最初のセクションはスロット番号です。 デフォルト スロット (によって設定されたように
select コマンド)。

XNUMX 番目のセクションには、スロットごとのフラグとステータスが表示されます。 フラグがオンの場合は文字が表示され、
オフの場合は省略されます。 以下のリストでは、各項目に関連するコマンドが示されています。

F ¡Ä フィルタがある場合 {ただし、無効の場合は '#'}。 (フィルター)
M ¡Ä 変更仕様がある場合 {ただし、無効な場合は '%' }。 (変更)
w ¡Ä 単語優先モードがオンの場合。 (言葉)
c ¡Ä ケース折りがオンの場合。 (折り畳み)
f ¡Ä ファジー化がオンの場合。 (ファズ)
W ¡Ä ワイルドカード パターン モードがオンの場合(ワイルドカード)
h ¡Ä 強調表示がオンの場合。 (ハイライト)
t ¡Ä タグがある場合 {but @ 無効の場合} (タグ)
d ¡Ä 見つかった行を表示する必要がある場合 (display)
¨¡ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨ ¨¡ ¨ ¨¡ ¨¡¨¡¨¡¨¡¨¡¨¡¨¡¨¡
a ¡Ä オートカナがオンの場合 (autokana)
ファイル固有のローカル プロンプト (prompt) がある場合は P ¡
ファイルが事前に計算されたインデックスでロードされている場合 (ロード)
d ¡Ä 表示フラグがオンの場合 (表示)
上のセクションの文字は直接 È!!¡É シーケンスに対応していることに注意してください。
INPUT SYNTAX セクションで説明されている文字。

フラグ セクションの末尾に数字がある場合は、ファイルの #/10 だけが
ファイルが完全にロードされるのではなく、実際にメモリにロードされます。
アンロードされたファイルはロードされます。 検索 アイドル状態、または最初に使用されたとき。

スロットがコンビネーション スロットの場合 (上記の例ではスロット #3 です)、
XNUMX 番目のセクションで、コンビネーション名とコンポーネント スロット番号が
第XNUMX。 また、コンビネーション スロット ( filter or 修正する 仕様のみ
フラグ)、 F および M を介した検索中に対応するモードが許可されている場合に表示されます
コンボスロット。 を参照してください タグ コマンドに関する情報 t コンビネーションスロットに関して。

コマンドに引数 ('-' または 'long' のいずれか) が与えられた場合、短いメッセージが表示されます。
フラグの意味についても印刷されています。

フィルター ["ラベル"] [!] /正規表現/[私]
のフィルタを設定します 選択 スロット (組み合わせではなくファイルを含む必要があります)。
フィルタが設定され、ファイルに対してアクティブになっている場合、指定された 正規表現 フィルタリングされます
出力から (「Æ!」が前に置かれた場合) 正規表現、任意の行 正規表現に一致するのは
フィルタリングされます)。 の ラベル , これは必須ではなく、単にさまざまなドキュメントとして機能します
診断。

例として、 布告 多くの場合、行には「(pn)」が付けられ、
与えられた英語は地名です。 こういった地名は面倒なことも多いので、あるといいですね
特に要求されない限り、出力からそれらを除外します。 例を考えてみましょう:

検索コマンド > フィルタ "名前" /(pn)/
検索 [勅令]> [¤¤Î]
µ¡Ç½ [¤¤Î¤ã] /機能/学部/
µ¢Ç¼ [¤¤Î¤ã] /誘導/
ºòÆü [¤¤Î¤ã] /昨日/
¢ã3 "name" 行がフィルタリングされた¢ä

この例では、正規表現の開始と終了を区切るために「Æ/」文字が使用されています (そのまま
多くのプログラムで共通)。 ただし、任意の文字を使用できます。 最後に、存在する場合は、
大文字と小文字を区別しない方法で正規表現を適用する必要があることを示します。

フィルタは、一度設定すると、別の形式で有効または無効にできます。
「filter」コマンド (後述)。 一時的にオフにすることもできます (または、
È!F!¡Éline 接頭辞により、無効、一時的にオン)。

フィルタリングされた行は、必要に応じて保存し、表示することができます。 保存したものを見る
list size および show コマンド。

保存を有効にしていて、XNUMX 行だけがフィルタリングされる場合、それは単に
最後に出力されます (XNUMX 行がどのようにフィルタリングされたかについての XNUMX 行のメッセージを出力するのではなく)。

ちなみに、より良い「名前」フィルター 布告 だろう:

フィルター「名前」 #^[^/]+/[^/]* [^/]*/$#

これは、英語セクションが XNUMX つしかないすべてのエントリをフィルタリングするためです。
名前。 これは、正規表現を区切るために「Æ/」以外のものを使用する例でもあります。
物事を少し読みやすくします。

フィルター [ブール値]
のフィルタを有効または無効にします。 選択 スロット. 引数が指定されていない場合は、表示されます
現在のフィルターとステータス。

[デフォルト] 折り[ブール値]
  選択 スロットの大文字と小文字の折り畳みがオンまたはオフ (デフォルトはオン) であるか、そうでない場合は報告されます
与えられた引数。 ただし、「デフォルト」を指定した場合は、デフォルトとして継承される値が
デフォルトでは、後でロードされるファイルが設定 (または報告) されます。

È!c!¡Éline プレフィックスで一時的に切り替えることができます。

[デフォルト] ファズ [ブール値]
  選択 スロットのファジー化がオンまたはオフ (デフォルトはオン) であるか、そうでない場合は報告されます
与えられた引数。 ただし、「デフォルト」を指定した場合は、デフォルトとして継承される値が
デフォルトでは、後でロードされるファイルが設定 (または報告) されます。

È!f!¡Éline プレフィックスで一時的に切り替えることができます。

ヘルプ [正規表現]
引数を指定しないと、短いヘルプ リストが表示されます。 引数を指定すると、次のコマンドのみがリストされます。
ヘルプ文字列は、指定された 正規表現.

[デフォルト] ハイライト [ブール値]
の一致文字列の強調表示をオンまたはオフに設定します。 選択 スロット (デフォルトはオフ)、またはレポート
引数が指定されていない場合は現在のステータス。 ただし、「デフォルト」が指定されている場合、その値は
後でロードされるファイルによってデフォルトとして継承されるように設定 (または報告) されます。

オンの場合、一致した行の部分を太字または反転ビデオ (以下を参照) で表示します
検索で 正規表現. 複数の正規表現が指定された場合、最初の正規表現と一致した部分
ショーです。

正規表現は行の一部に一致する可能性があることに注意してください。 修正する
パラメータ。 この場合、強調表示は行われません。

È!h!¡Éline プレフィックスで一時的に切り替えることができます。

ハイライト スタイル [大胆な | 逆の | 傑出した | <___>]
ハイライト時のハイライトのスタイルを設定します。 リバース (反転ビデオ)および
傑出した 同じだ。 デフォルトは 大胆な. 次のような HTML タグを指定することもできます。
として¡ ... . これは特にだろう
ルックアップがサーバーに組み込まれている場合など、出力が CGI に送られる場合に便利です。
構成。

生の VT100/xterm 制御シーケンスを使用すると、強調表示が影響を受けることに注意してください。 これ
端末がそれらを理解しない場合、特にあまり良くありません。 ごめん。

もし {表現} 指図...

評価された場合 表現 ゼロ以外の場合、 command 実行されます。

() ではなく {} で囲まれていることに注意してください。 表現.

表現 数字、演算子、括弧などで構成できます。
通常の +、-、*、および / は次のとおりです。

!x 次の場合は 0 が返されます x 1 以外の場合は XNUMX x ゼロです。
x && y ¡
!x △△△△△の場合は 1 を返す x ゼロです。ゼロでない場合は 0 です。
x & y 両方の場合は 1 を返します x & y は非ゼロ、それ以外の場合は 0 です。
x | y ¡Ä¡Æor¡Ç の場合は 1 を返します x or y (または両方) は非ゼロ、それ以外の場合は 0

特別なトークンもあるかもしれません true & false それぞれ 1 と 0 です。

もあります チェック済み, マッチ, 印刷, ノンワード, フィルタリングした に対応する
によって出力される値 統計情報

使用例は、コンピューターで生成されたスクリプトでの次のようなものです。

!d!この行を期待してください
if {!printed} msg おっと! 「この行を期待する」が見つかりませんでした

入力エンコーディング [ euc | sjis ]
インタラクティブで 8 ビットのバイトが見つかった場合に使用するエンコーディングを設定 (または報告) するために使用されます。
入力 (すべての種類の JIS が常に認識されます)。 また、参照してください エンコーディング & 出力
エンコーディング コマンド。

制限[]
検索を中止する前に印刷する行数を設定します (または現在の
値が指定されていない場合は番号)。 デフォルトは 100 です。

ゼロに設定すると、出力制限は無効になります。

ログ [ に [+] file ]
プログラム出力のログ記録を開始します file (日本語のエンコード方法は
画面出力用)。 È+¡É が指定された場合、ログはテキストに追加されます。
以前に fileの場合、先頭の破線がファイルに挿入されます。

引数が指定されていない場合は、現在のログ ステータスを報告します。

ログ - | オフ
もしそうなら... オフ が与えられた場合、現在開いているログ ファイルはすべて閉じられます。

読み込み [-今|-必要なときに] "ファイル名"
指定されたファイルを次に使用可能なスロットにロードします。 事前計算されたインデックスが見つかった場合
(そのままファイル名.jin¡É)もロードされています。 それ以外の場合、インデックスは内部で生成されます。

ロードされるファイル (およびロードされている場合はインデックス) は、アイドル時間中にロードされます。 これ
起動ファイルはロードされる多くのファイルをリストできますが、それぞれを待つ必要はありません
それらを順番にロードします。 È-now¡É フラグを使用すると、すぐにロードが行われますが、
「-whenneeded」オプション (「-wn」に短縮できます) を使用すると、ロードのみが発生します。
スロットが最初にアクセスされたとき。

呼び出します 検索 as
% ルックアップ -writeindex ファイル名
インデックスファイルを生成して書き込みます。これは、将来自動的に使用されます。

ファイルが既にロードされている場合、ファイルは再読み込みされませんが、以前に読み込まれたファイル
共有されます。 ただし、新しいスロットには、独自のフラグ、プロンプト、フィルターなどがあります。

変更 /正規表現/replace/[ig]
設定します 修正する 以下のためのパラメータ 選択 file. ファイルに変更パラメータがある場合
それに関連付けられているため、検索中に選択された各行には、行のその部分が含まれます
どれが一致するか 正規表現 (もしあれば) 置換 印刷される前の文字列。

以下のような filter コマンドの場合、区切り文字は「Æ/」である必要はありません。 スペース以外の文字は問題ありません。
final が指定されている場合、正規表現は大文字と小文字を区別しない方法で適用されます。 もし
final が指定された場合、最初の一致だけでなく、行内のすべての一致に対して置換が行われます
合いそうな部分 正規表現.

  置換 一致したテキストの一部を参照するために、È1ÈÉ などが埋め込まれている可能性があります。
(正規表現のチュートリアルを参照してください)。

変更パラメータは、一度設定すると、別の形式で有効または無効にすることができます。
変更コマンド (以下で説明)。 また、¡È!m!¡Éラインから一時的に切り替えることもできます。
接頭辞。

超国家主義者のばかげた例は次のとおりです。
変更 / /大日本帝国/g
そのため、次のような行
Æü¶ä [¤Ë¤Á¤®¤ó] /日本銀行/
として出てくるでしょう
Æü¶ä [¤Ë¤Á¤®¤ó] /大日本帝国銀行/

を使用した変更コマンドの実際の例として 漢字の、その可能性が高いと考えてください
各エントリが持つさまざまな分野のすべてに興味があるわけではありません。 以下に使用できます
出力から U、N、Q、M、E、B、C、および Y フィールドの情報を削除します。

変更 /( [UNQMECBY]\S+)+//g,1

ちょっと複雑ですが、うまくいきます。 ここで、 置換 部分は空です。つまり、
一致した部分を削除するだけです。 このような Æü の検索の結果は、通常、次のようになります。
印刷

Æü 467c U65e5 N2097 B72 B73 S4 G1 H3027 F1 Q6010.0 MP5.0714 ¡
MN13733 E62 Yri4 P3-3-1 ¥Ë¥Á ¥¸¥Ä ¤Ò -¤Ó -¤« {日}

しかし、上記の変更仕様では、より単純に次のように表示されます

Æü 467c S4 G1 H3027 F1 P3-3-1 ¥Ë¥Á ¥¸¥Ä ¤Ò -¤Ó -¤« {日}

変更 [ブール値]
の変更パラメータを有効または無効にします。 選択 file、または現在の
引数が指定されていない場合のステータス。

MSG 文字列
与えられた 文字列 が印刷されます。

ほとんどの場合、スクリプトでターゲット コマンドとして使用されます。 if

出力エンコーディング [ euc | sjis | ジス…]
プログラム出力に使用するエンコーディングの種類を正確に設定するために使用されます (
エンコーディング 指図)。 次の場合に使用 エンコーディング コマンドの詳細が不十分です。
ニーズ。

引数が指定されていない場合、現在の出力エンコーディングを報告します。 それ以外の場合、引数は
通常は、ダッシュで区切られた次の適切な組み合わせです。

ユー
出力エンコーディングに EUC を選択します。

シズ
出力エンコーディングに Shift-JIS を選択します。

jis[78|83|90][-ascii|-roman]
出力エンコーディングに JIS を選択します。 年 (78、83、または 90) が指定されていない場合は、78 が使用されます。
必要に応じて、英語を通常としてエンコードする必要があることを指定できます ASCII (デフォルト
JIS選択時)または JIS-ローマン.

212
JIS X0212-1990 をサポートする必要があることを示します (Shift-JIS 出力では無視されます)。

no212
JIS X0212-1990 をサポートしないことを示します (デフォルト設定)。 これ
のドメインの下に JIS X0212-1990 文字を配置します disp, ノーディスプ, コードまたは マーク
(以下で説明します)。

ホーク
それを示します hアルフ wIDTH kana はそのままにしてください (デフォルト設定)。

なし
それを示します hアルフ wIDTH kana は出力から削除する必要があります。 (会員登録はお済みでしょうか? まだ
実装されました)。

折り畳み
それを示します hアルフ wIDTH kana は、対応する全角に折りたたむ必要があります。
(会員登録はお済みでしょうか? まだ 実装されました)。

disp
それを示します 表示不可 文字 (JIS X0212-1990 など)
エンコーディング方式は Shift-JIS です) とにかく渡す必要があります (ほとんどの場合、
画面ゴミ)。

ノーディスプ
それを示します 表示不可 文字は出力から静かに削除する必要があります。

コード
それを示します 表示不可 文字は XNUMX 進コードとして出力する必要があります
(デフォルト設定)。

マーク
それを示します 表示不可 文字は¡È¡ú¡Éとして印刷する必要があります。

もちろん、すべてのオプションがすべての組み合わせで、または常に意味を持つわけではありません。 とき
現在の(または新しい)出力エンコーディングが報告され、完全かつ正確な指定子が
選択された出力エンコーディング。 例としては、「jis78-ascii-no212-hwk-code」があります。

ポケットベル [ ブール値 | サイズ ]
出力ページャーをオンまたはオフにしたり、画面サイズのアイデアを設定したり、現在のページャーを報告したりします
状態。

サイズ 印刷する行数を示す単一の数値を指定できます
間の「MORE?」プロンプト (通常は、画面全体の高さよりも数行少なく、デフォルトでは
20行です)。 È#x#¡É の形式の XNUMX つの数字にすることもできます。ここで、最初の数字は
width (半角文字で、デフォルトは 80) で、XNUMX 番目は上記のように XNUMX ページあたりの行数です。

ページャーがオンの場合、出力のすべてのページで「MORE?」プロンプトが表示されます。
XNUMXつの可能な応答があります。 スペースがあると、もう XNUMX ページ全体を印刷できます。 返品は
もう XNUMX 行許可します。 A¡Æc¡Ç(for¡Ècontinue¡É) は、残りのすべての出力 (for
現在のコマンド) は一時停止せずに続行しますが、a'q'('quit'' の場合) は出力をフラッシュします。
現在のコマンド用。

OS でサポートされている場合、ページャー サイズのパラメーターはウィンドウから適切に設定されます。
起動時のサイズまたはウィンドウのサイズ変更。

デフォルトのポケットベルのステータスは「オフ」です。

[ローカル] プロンプト "文字列"
プロンプト文字列を設定します。 「ローカル」が示されている場合は、プロンプト文字列を設定します。 選択
スロット それだけ。 それ以外の場合は、グローバル デフォルトのプロンプト文字列を設定します。

プロンプト文字列には、以下に示す特別な % シーケンスが含まれる場合があります。関連するコマンドは、
括弧:

%N ¡ デフォルト スロットのファイルまたはコンボ名。
%n %N と同様ですが、ファイル名の場合、先頭のパスは表示されません。
%# ¡Ä デフォルト スロットの番号。
%S コマンド導入文字 (cmdchar)
%0 ¡Ä 実行中のプログラムの名前
%F='文字列' ¡ÄÄ 文字列 フィルタリングが有効な場合に表示 (filter)
%M='文字列' ¡ÄÄ 文字列 変更が有効な場合に表示 (変更)
%w='文字列' ¡ÄÄ 文字列 単語モードがオンの場合に表示されます (word)
%c='文字列' ¡ÄÄ 文字列 ケース折り畳み(折り)の場合に表示
%f='文字列' ¡ÄÄ 文字列 ファジー化がオンの場合に表示されます (fuzz)。
%W='文字列' ¡ÄÄ 文字列 wildcard-pat の場合に表示されます。 モードオン (ワイルドカード)。
%d='文字列' ¡ÄÄ 文字列 (ディスプレイ) に表示されている場合に表示されます。
%C='文字列' ¡ÄÄ 文字列 現在コマンドを入力している場合に表示されます。
%l='文字列' ¡ÄÄ 文字列 ロギングがオン (ログ) の場合に表示されます。
%L ¡Ä もしあれば、現在の出力ログの名前 (log)

テスト (%f など) の場合、「%」の直後に「!」を配置して、「%」の意味を逆にすることができます。
テストします (つまり、%!f="no fuzz")。 %F の逆は、フィルターがインストールされているが無効になっている場合です。
(すなわち、 文字列 デフォルト ファイルのフィルターがない場合は表示されません)。 修正
%M も同様に機能します。

また、引数文字列を取る項目には別の形式を使用できます。 交換する
括弧付きの引用符は扱います 文字列 再帰プロンプト指定子として。 例えば、
指定子

%C='コマンド'%!C(%f='ファジー'検索:)

コマンドを入力すると、「コマンド」プロンプトが表示されますが、どちらかの結果になります。
コマンドを入力しない場合は、あいまい検索: または検索: プロンプトを表示します。 括弧内
構造は入れ子にすることができます。

テスト構成の文字は、の文字​​と同じであることに注意してください。
INPUT SYNTAX に記述されているシーケンス。

適切なプロンプト コマンドの例は次のとおりです。

プロンプト "%C(%0 コマンド)%!C(%w'*'%!f'raw '%n)> "

このプロンプト指定では、プロンプトは通常次のように表示されます。ファイル名> ¡
ファジィ化は生のままオフになっています ファイル名> え。 単語優先モードがオンの場合、
全体に ¡È*¡É が付加されています。 ただし、コマンドが入力されている場合、プロンプトは
その後になる コマンド、ここで プログラムの名前でした(システムに依存しますが、ほとんど
おそらく「ルックアップ」)。

デフォルトのプロンプト フォーマット文字列は È%C(%0 command)%!C(search [%n])> ¡É です。

正規表現デバッグ [ブール値]
内部正規表現デバッグ フラグを設定します (何十億行ものデータが必要な場合はオンにします)
画面に吐き出されます)。

保存されたリストのサイズ []
検索中に、一致する行がフィルターまたは単語によって出力から除外される場合があります。
プリファレンスモード。 このコマンドは、任意の実行中に記憶するそのような行の数を設定します
後で (次の検索の前に) 表示されるようにします。 表示する

デフォルトは100です。

選択する [ NUM | | 。 ]
If NUM が与えられ、 デフォルト スロット そのスロット番号に。 もしも が与えられ、
デフォルト スロット その名前でロードされたファイル(または組み合わせ)で見つかった最初のスロットに。
呪文「select .¡É」は、デフォルトのスロットをそれ自体に設定するだけです。
後続のフラグの変更が機能することを示すスクリプト ファイル
スクリプトが実行された時点でデフォルトであったファイル sourced.

引数が指定されていない場合は、単に現在の デフォルト スロット (また、 ファイル
コマンド)。

経由でロードされたコマンドファイルで source コマンド、または起動ファイルとして、コマンド処理
スロットごとの項目 (フラグ、ローカル プロンプト、フィルターなど) を使用すると、ファイルまたはスロットが最後に処理されます。
select編。 ロードが完了すると、最後に選択されたスロットが選択されたままになります。

インタラクティブに、デフォルトのスロットが 選択 スロット 後続の検索および
#¡É が追加されていないコマンド(INPUT SYNTAX で説明されているとおり)
セクション)。

表示する
前回の検索で省略された行を表示します ( filter or 言葉の好み
モード).

変更が有効になっている場合、すべての変更が適用されます (「modify」コマンドを参照)。
ファイル。 このコマンドでは、行プレフィックス ¡È!m!¡É も使用できます (この場合、
ザ・ム! コマンド標識文字)。

リストの長さは、「保存されたリストのサイズ」コマンドによって制御されます。

ソース "ファイル名"
コマンドはから読み取られます ファイル名 そして実行されました。

ファイル内で、¡È#¡É で始まるすべての行はコメントとして無視されます (コメントは
È#¡É はコマンド内で使用するのに適した文字であるため、単独で行に表示されます)。

最初の非空白文字が È=¡É、¡È!¡É、または È+¡É である行は検索と見なされます。
他のすべての非空白行が考慮されます 検索 コマンド。 したがって、
コマンド導入文字で始まる行。 ただし、先頭の空白は
いつもOK。

検索行の場合、不要な場合は末尾の空白が削除されるように注意してください。
末尾の空白 (すべての先頭以外の空白と同様) は、通常の
式です。

コマンド ファイル内では、ファイルごとのフラグなどを変更するコマンドは、常に
最近ロードされた (または選択された) ファイル。 したがって、次のようなもの

「my.word.list」をロード
単語をオンにする

「my.kanji.list」を読み込む
言葉をなくす
ローカルプロンプトを設定する「漢字を入力してください>」

直感的に理解できるように言います。

スクリプト ファイルには 負荷または select スロットごとのフラグが設定される前に、次のことができます
select を使用して、現在のスロットで動作するコマンド スクリプトを容易にします。

スピナー[]
スピナーの値を設定します (ばかげた小さな機能です)。 ゼロ以外の値に設定すると、
ファイルのチェック中にスピナーを回転させます。 の行
ファイルは実際に検索指定子に対してチェックされます。 デフォルトはオフ (ゼロ) です。

統計情報
前回のファイルに対してチェックされたテキスト ファイルの行数に関する情報を表示します。
検索指定子、一致して出力された行数。

鬼ごっこ [ブール値] ["文字列"]
タグの有効化、無効化、または設定 選択 スロット.

スロットがコンビネーション スロットでない場合、タグ 文字列 設定できます (引用符が必要です)。

タグ文字列が設定され、ファイルに対して有効になっている場合、文字列は一致する各ファイルの先頭に追加されます
出力行が印刷されました。

異なり、 filter & 修正する ときに機能を自動的に有効にするコマンド
パラメータが設定され、 タグ 設定しても自動的に有効になりません。 有効にすることができます
タグを介して設定されているか、後でタグをオンにするだけで有効にすることができます。
slot はコンビネーション スロットであり、有効/無効ステータスのみを変更できます (デフォルトではオン)。
タグ文字列は設定できません。

特別な扱いの理由は、タグがどのように機能するかの特別な性質にあります
コンビネーションファイルと連動。

選択したスロットがコンビネーションスロットである場合の検索では、メンバーである各ファイル
対応するフラグが無効になっている場合、ファイルごとのフラグが無効になっている組み合わせの
オリジナルのコンビネーションスロットに。 これにより、コンビネーション スロットのフラグが次のように機能します。
「マスク」は、各コンポーネント ファイルのファイルごとのフラグを消し去ります。

ただし、タグ フラグは、コンポーネント ファイルのタグ フラグがオンになっているという点で特別です。 on もし
コンビネーション スロットのタグ フラグがオンになっている (そして、もちろん、コンポーネント ファイルにはタグがあります
文字列登録済み)。

これの使用目的は、(無効な) タグをファイルに設定することですが、 直接
そのファイルに対する検索では、先頭にタグが追加されません。 ただし、ファイルが次のように検索された場合
コンビネーション スロットの一部 (およびコンビネーション スロットのタグ フラグがオン)、タグ 意志 be
出力行がどのファイルから来ているかを簡単に理解できるようにします。

詳細 [ブール値]
詳細モードをオンまたはオフに設定するか、現在のステータスを報告します (デフォルトはオン)。 多くのコマンド
詳細モードがオンになっている場合は、確認を返信します。

バージョン
プログラムの現在のバージョンを報告します。

[デフォルト] ワイルドカード [ブール値]
  選択 スロットのパターンは、オンにするとワイルドカード パターンと見なされます。
オフにすると式が表示されます。 引数が指定されていない場合、現在のステータスが報告されます。 しかし、
「デフォルト」が指定されている場合、パターンタイプはデフォルトとしてその後継承されます。
ロードされたファイルが設定 (または報告) されます。

È!W!¡Éline プレフィックスで一時的に切り替えることができます。

ワイルドカード パターンを選択すると、変更されるメタ文字は次のようになります。
stuff¡É,¡È?¡Éは、ÈÈ任意のXNUMX文字を意味しますが、一方、È+¡Éおよび¡È.¡ その他の正規表現
È|¡É,¡È(¡É,¡È[¡Éなどの項目は変更されません。

実際に一致するかどうかは、単語モードのステータスと、
パターンそのもの。 ワードモードがオンの場合、またはパターンが start-of- で始まる場合
word¡È<¡Éor¡È[¡É、スペース以外のみが一致します。 それ以外の場合は、任意の文字が一致します。

要約すると、ワイルドカード モードがオンの場合、入力パターンは次のように影響を受けます。

* は正規表現 .* または
? 正規表現に変更されます。 または + は正規表現 + に変更されます
. 正規表現に変更されます。

ファイル名パターンは「ファイル名グロブ」と呼ばれることが多いため、コマンド「glob」を使用できます。
「ワイルドカード」の代わりに。

[デフォルト] 単語|単語設定 [ブール値]
選択したファイルの単語設定モードがオンまたはオフ (デフォルトはオフ)、またはレポート
引数が指定されていない場合は、現在の設定。 ただし、「デフォルト」が指定されている場合、
後でロードされるファイルによってデフォルトとして継承される値が設定 (または報告) されます。

単語優先モードでは、エントリが検索されます as if 検索正規表現には
先頭の「<」および末尾の「」>「」の結果、単語全体が一致するエントリのリストが生成されます
正規表現。 ただし、存在しない場合でも、存在する場合   非単語エントリ、非単語
エントリが表示されます (これには「保存されたリスト」が使用されます -- そのコマンドを参照してください)。 これで出来上がり
このような言葉がある場合は、見せてください。そうでない場合は、あなたが持っているものを何でも見せてください
モードになりました。

単語エントリと単語以外のエントリの両方がある場合、単語以外のエントリは
保存されたリスト (そこに記憶されている可能性のあるフィルタリングされたエントリではなく)。

XNUMX つの注意点: 検索が複数の場所で行に一致し、最初の行が a
単語全体、他の単語の XNUMX つ is、行は非単語全体と見なされてリストされます。
たとえば、単語優先モードをオンにして「Öjapan」を検索すると、次のようなエントリは表示されません。
as¡È/日本語/language in Japan/最初に、日本は日本語の一部であり、日本語ではない
単語全体。 単語全体のエントリだけが本当に必要な場合は、「自分自身」を使用してください。

モードは、¡È!w!¡Éline プレフィックスを介して一時的に切り替えることができます。

どの行をフィルタリングし、記憶し、破棄し、表示するかを定義するルール
検索の順列はかなり複雑ですが、最終結果はかなり直感的です。

やめる | 去る | さようなら| 出口
プログラムを終了します。

起動 FILE


ファイルが~/.lookupが存在し、コマンドがそこから読み取られます。 検索 スタートアップ

ファイルは、 source コマンドはファイルを読み取ります(詳細については、そのエントリを参照してください
ファイル形式等の情報)

ただし、コマンドライン引数を介してロードされたファイルがあった場合、
ファイル(およびファイルごとのフラグを設定するなどの関連コマンド)をロードするための起動ファイルは、
無視されます。

同様に、コマンドライン フラグ -euc、-jis、または -sjis を使用すると、起動時に無効になります。
入力および/または出力エンコーディングの設定を扱うコマンドをファイルします。

上記の XNUMX つの段落で述べた特別な扱いは、
コマンド ファイル内のコマンドには適用されません。 sourced
起動ファイル内から。

以下は、起動ファイルの適切な例です。
## 起動ファイルの処理中に冗長モードをオフにする
詳細オフ

プロンプト "%C([%#]%0)%!C(%w'*'%!f'raw '%n)> "
スピナー200
ポケットベル

## edict のフィルターは、次のエントリにヒットします。
## 英語部分は XNUMX つだけで、その英語部分は
## pl または pn の指定があります。
負荷 ~/lib/布告
フィルター「名前」 #^[^/]+/[^/]* [^/]*/$#
ハイライト
一言

## 漢字のフィルタは、記号のないエントリにヒットします
## 使用頻度数。 変更仕様は削除します
## 名前付きの初期コード (U、N、Q、M、E、および Y) を持つフィールド
負荷 ~/lib/kanjidic
フィルター「珍しい」!/ /
変更 /( [UNQMEY])+//g

## ローカルのワード ファイルに同じフィルタを使用し、
## ただし、デフォルトではオフになっています。
負荷 ~/lib/local.words
フィルター「名前」 #^[^/]+/[^/]* [^/]*/$#
フィルターオフ
ハイライト
一言
## ローカル ワードのタグが必要ですが、次の場合のみ
## 以下のコンボからアクセス
タグオフ「¡Õ」

「言葉」を組み合わせる 2 0
言葉を選ぶ

## インタラクティブな使用のために冗長性をオンに戻します。
詳細オン

コマンドライン 議論


スタートアップ ファイルを使用すると、コマンド ライン引数が必要になることはほとんどありません。 実際の使用では、
次のように、インデックス ファイルを作成するためにのみ必要です。

ルックアップ - 書き込み テキストファイル

フラグではないコマンド ライン引数は、順番にロードされるファイルと見なされます。
起動中。 この場合、起動ファイル内のすべての「ロード」、「フィルタ」などのコマンドは、
無視されます。

次のフラグがサポートされています。

-助けて
短いヘルプ メッセージを報告して終了します。

-write 指定したファイルのインデックス ファイルを作成して終了します。 いいえ
スタートアップ file 読み取られます。

-euc
入力と出力のエンコード方式を EUC (現在のデフォルト) に設定します。 まったく同じ
エンコーディングeucコマンドとして。

-jis
入出力のエンコード方式を JIS に設定します。 エンコーディングとまったく同じ
ジスコマンド。

-sjis
入出力のエンコード方式を Shift-JIS に設定します。 エンコーディングとまったく同じ
sjisコマンド。

-v -バージョン
バージョン文字列を出力して終了します。

-ノルク
スタートアップ ファイルを読み取らないことを示します。

-rc file
デフォルトではなく、指定されたファイルが起動ファイルとして使用されます。~/.lookupえ。 それは
ファイルが存在しないというエラー。

-パーセント NUM
インデックスが作成されると、複数の文字に表示される文字 NUM パーセント (デフォルト 50)
行は索引から省略されます。 考えは、検索でほとんどをチェックする必要がある場合
とにかくファイル内の行のうち、インデックスに大量のスペースを節約することもできます
その情報を表すために必要なファイルと、時間/空間のトレードオフがシフトします。
頻繁に出現する文字を索引付けすると、収益が減少します。

より小さい数を使用すると、より小さいインデックスを作成できます。

-noindex
コマンド ライン経由でロードされたファイルは、どのようなファイルでもロードされるべきではないことを示します。
事前に計算されたインデックスですが、その場で再計算されます。

-詳細
インデックスが作成されるたびに大量の統計が吐き出されます。

-ポート ###
(文書化されていない) サーバー構成の場合のみ、どのポートでリッスンするかを指示します。

オペレーティング SYSTEM 考慮事項


I/O プリミティブと動作はオペレーティング システムによって異なります。 私のオペレーティング システムでは、
ファイルをメモリにマッピングすることでファイルを読み取ることができます。これはほぼ瞬時の手順です。
ファイルのサイズに関係なく。 後でそのメモリにアクセスすると、適切なセクションが表示されます。
ファイルの内容は、必要に応じてオペレーティング システムによって自動的にメモリに読み込まれます。

これにより 検索 非常に迅速に起動してプロンプトが表示されますが、最初の
ファイル内の多くの行をチェックする必要がある検索がほとんどないため、処理が遅くなります (検索の多くは
ファイルを読み込む必要があります)。 ただし、ファイルの大部分が入力されると、検索は非常に困難になります。
速い。 ここでの利点は、かなり長いファイル読み込み時間が最初の数回で償却されることです。
(状況によっては数十件の) 検索を常に行うのではなく、
コマンドの起動時間。

一方、マッピング機能のないオペレーティング システムでは、 検索 起動するだろう
すべてのファイルとインデックスがメモリに読み込まれるため、非常に遅くなりますが、検索は迅速に行われます。
最初から、すべてのファイルはすでに読み取られています。

特に多くのファイルが読み込まれている場合の起動の遅さを回避するには、 検索 使用されます 怠惰な
ローディング できる場合: ファイルは、実行時に実際にはメモリに読み込まれていません。 負荷 コマンドは
与えられた。 むしろ、実際に最初にアクセスされたときに読み取られます。 さらにファイルが読み込まれます
while 検索 ユーザー入力を待っているときなど、アイドル状態です。 を参照してください。 ファイル さらにコマンドを実行する
情報を表示します。

REGULAR 表現、 A BRIEF チュートリアル


レギュラー 表現 (略して「regex」) は、テキストの種類を示すために使用される「コード」です。
あなたが探しています。 これらは、人が物事を検索する方法です。
エディタ、「vi」、「stevie」、「mifes」など、または grep コマンドを使用します。 違いはあります
使用されているさまざまな正規表現フレーバーの中で、次で使用されるフレーバーについて説明します。 検索 ここ。 また、
一般的なケースを明確にするために、いくつかの嘘をつくかもしれませんが、それほど凶悪なことはありません。

正規表現「a」は、「a」が含まれる任意の行を意味します。非常に単純です。

正規表現「ab」は、「a」の直後に「b」「b」が続く行を意味します。 それで、ラインは
たるんだ感じがする
正規表現の「ab」に一致します。実際、その行に「ab」があるからです。 でもそんなことはないだろう
ラインを合わせる

この行には、直後に ab が続きません

なぜなら、そのセリフが言っていることは真実だからです。

ほとんどの場合、正規表現内の文字と数字は、単にそれらの文字を探していることを意味します。
と番号は指定された順序で表示されます。 ただし、中にはいくつかの特殊文字が使用されています。
正規表現。

簡単な例としてはピリオドが挙げられます。 生理を探していることを示すのではなく、
「任意の文字」を意味します。 したがって、愚かな正規表現「Ö.¡×」は、任意の文字が含まれる任意の行を意味します。
まあ、それほど愚かではないかもしれません...空白でない行を見つけるために使用できます。

しかし、より一般的には、より大きな正規表現の一部として使用されます。 正規表現「Ögray」を考えてみましょう。 そんなことはないだろう
ラインを合わせる

空は灰色で曇っていました。

スペルが異なるためです (グレーとグレー)。 しかし、正規表現「gr.y」は任意の行を要求します。
a¡Æg¡Ç、¡Ær¡Ç、何らかの文字、そしてa¡ したがって、これは「グレー」と「グレー」になります。
¡Æ.¡Çにいくらか似た特別な構造は次のようになります。 文字 class。 キャラクタークラス
a¡Æ[¡Çで始まりa¡Æ]¡Çで終わり、その間に指定された任意の文字と一致します。 アン
例としては

灰色

これは、a「g」、「r」、「an」の行と一致します。or 「a」「a」、そして「a」「y」。 内側
文字クラスには、必要な数の文字をリストできます。

たとえば、単純な正規表現「Öx[0123456789]y」は、数字が挟まれた任意の行に一致します。
「x」と「a」の間。

文字クラス内の文字の順序は実際には異なります。
件...「[513467289]」×は「[0123456789]」×と同じになります。

ただし、ショートカットとして、「[0]」の代わりに「[9-0123456789]」を入力することもできます。 それでキャラクターは
class「[az]」は任意の小文字に一致しますが、文字クラス「[a-zA-Z0-9]」は一致します。
任意の文字または数字と一致します。

文字「-」は文字クラス内で特別ですが、それが最初のものではない場合に限ります。
文字クラスの中で特別なもう XNUMX つの文字は、次のとおりです。 is 最初のもの。
任意の文字に一致するようにクラスを反転します。 リストされています。 の
class¡Ö[^a-zA-Z0-9]¡×は、スペースまたは句読点を含む行と一致します。

一部の一般的な文字クラスには、特別な省略シーケンスがいくつかあります。 の
シーケンス「d」は「数字」を意味し、「[0-9]」×と同じです。 「\w」×は「単語要素」を意味し、
「[0-9a-zA-Z_]」×と同じ。 「×」は「宇宙系のもの」を意味し、「」と同じです。
\t]¡×(¡Ö\t¡×はタブを意味します)。

何かを意味するために「\D¡×」、「\W¡×」、「\S¡×」を使用することもできます。 数字、単語要素、またはスペース -
タイプのもの。

もう XNUMX つの特殊文字は「¡Æ?¡Ç」です。 これは、おそらくその直前にあったもののうちの XNUMX つを意味します。
そうでなくても大丈夫です。 正規表現では ¡Öbikes? レンタルなら何でもいいので、
これは、「レンタル自転車」または「レンタル自転車」のいずれかの行と一致します。

括弧も特別であり、ものをグループ化することができます。 正規表現では

大きい(太ったハリー)? 対処

「何であれ、それはファット・ハリーでしょう。」 ただし、注意してください
詳細...この正規表現は一致します
ファット・ハリーとの大きな取引が何なのか分かりません!
焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
何が大したことなのか分かりません!

なぜなら、「何であれ」を取り去ってしまうと、最終的には次のような結果になるからです。
大した
があることに注意してください。 2 単語の間にスペースを入れることはできませんが、正規表現ではそれが許可されていませんでした。 の
上記のいずれかの行を取得するための正規表現は次のようになります
ビッグ(ファットハリー)?ディール
or
大きい(太ったハリー)? 対処
それらが本質的に同じであることがわかりますか?

¡Æ?¡
フロント¡ これは多かれ少なかれ、「*」でタグ付けされたものはすべて許可されますが、必須ではないことを意味します。
だから次のようなもの
私は(本当に)*エンドウ豆が嫌いです
「私はエンドウ豆が嫌いです」、「私はエンドウ豆が本当に嫌いです!」、「私はエンドウ豆が本当に嫌いです」などに一致します。

「??」と「*」の両方に似ていますが、「+」です。これは、「直前にあるものの少なくとも XNUMX つ」を意味します。
もっと多くても大丈夫です。 正規表現「ミス+ペリング」は、
一致するsペリング、¡ssペリング、¡SSSペリング¡Éなど、実は同じです
「スペルミス」と同様ですが、入力はより簡単です。 正規表現「Öss*」×は「an」「s」を意味し、その後にゼロまたは
「more」「s」、「s+」×は「XNUMX つ以上」を意味します。 どちらも本当に同じです。

特殊文字「|」は「または」を意味します。 物に作用する「+」、「*」、「?」とは異なります。
直ちに 以前は、もっと「グローバル」でした。
(これ|あれ) XNUMX つください
「これをくれた」または「あれをくれた」という行と一致します。

XNUMX つ以上を組み合わせることもできます。
(これ|あれ|もう)を一つください

どのように:
[Ii] 今日は (いい |晴れ |明るい |晴れ)*日です

ここで、「*」の直前の「何でも」は
(いい |晴れ |明るい |晴れ)
したがって、この正規表現は次のすべての行に一致します。
It is a .
私は思う it is a nice .
It is a クリア 日当たりの良い
If it is a クリア 日当たりの良い nice 日当たりの良い 日当たりの良い 日当たりの良い 鮮やか それから....
「[Ii]t」が「It」または「it」のどちらかにどのように一致するかに注目してください。

上記の正規表現も一致することに注意してください
FRUit is a
なぜなら、「it」が実際には一部であるにもかかわらず、正規表現のすべての要件を実際に満たしているからです。
「果物」という言葉の。 このようなよくある懸念に答えるには、「<」と「>」です。
「単語の区切り」を意味します。 正規表現初め a 単語,
while¡Öit>¡×は、¡Èit¡Éの任意の行と一致します。エンディング a 単語。 そしてもちろん、 ¡ ×一致します
任意の行   単語その中にあります。

正規表現に戻って grey/gray を見つけると、より意味が分かります。

これはのみに一致します 言葉「グレー」と「グレー」。 似ているのは「^¡Ç」と「Æ$¡Ç」です。
これはそれぞれ「行頭」と「行末」を意味します(ただし、文字内ではありません)
もちろんクラスです)。 したがって、正規表現「Ö^fun」は、で始まる行を検索します。
文字「楽しい」、一方「楽しい」>「×」で始まる行が検索されます。 単語「楽しい」。
「楽しい$」×は、まさに「楽しい」という行を見つけます。

最後に、「Ö^\s*fun\s*$¡」は、「fun」と一致する行に完全に一致しますが、先頭に行が含まれている可能性があります。
および/または末尾の空白。

それだけです。 もっと複雑なものがありますが、その一部についてはリストで説明します。
以下に説明しますが、これらのいくつかの単純な構造を使用しても、非常に詳細で複雑な仕様を指定できます。
パターン。

正規表現の特別な点をいくつかまとめてみましょう。

基本単位となる項目:
チャリオット 特殊文字以外の文字はそれ自体と一致します。
\チャリオット 特殊文字の前に \ を付けると、特殊文字ではなくなります。
。 任意の XNUMX 文字と一致します (\n を除く)。
\n 改行
\t タブ。
\r キャリッジリターン。
\f フォームフィード。
\d 数字。 [0-9] の単なる略記です。
\w Word 要素。 [0-9a-zA-Z_] の短縮形です。
\s 空白。 [\t \n\r\f] の単なる省略形です。
\## \### XNUMX バイトを示す XNUMX 桁または XNUMX 桁の XNUMX 進数。
[タンク] リストされている文字のいずれかである場合、その文字と一致します。
[^タンク] リストにない文字を照合します。

\チャリオット 上記の項目は文字クラス内で使用できます。
ただし、以下の項目は除きます。

\D \d 以外のもの。
\W \w ではないもの。
\S \s 以外のもの。
\a 任意の ASCII 文字。
\A 任意のマルチバイト文字。
\k 任意の(半角以外の)カタカナ文字(¡⁄//を含む)。
\K \k 以外の任意の文字 (\n を除く)。
\h 任意のひらがな文字。
\H \h 以外の任意の文字 (\n を除く)。
(正規表現) 親が作る 正規表現 XNUMXユニット。
(?:正規表現) [perl5 以降] グループ化のみの括弧 -- \# には使用できません (下記)
\c JISX0208 の任意の漢字 (区点行 16 ~ 84)
\C \c 以外の任意の文字 (\n を除く)。
\# 左から # 番目の括弧で一致したものと一致します。

上記のように XNUMX 単位を示すには、次のように使用できます。

¡ A ¡ は許可されますが、必須ではありません。
¡ù+ 少なくとも XNUMX つの ¡ù が必要ですが、それ以上でも構いません。
¡ù* いくつでもOKですが、必須ではありません。

状況に応じて次のような方法もあります。

\b 単語の境界。
< \b と同じ。
> \b と同じ。
^ 行の先頭と一致します。
$ 行末と一致します。

最後に、「or」です。

reg1|reg2 どちらかの場合に一致 reg1 or reg2 一致しています。

¡È\k¡Éなどは文字クラスでは許可されていないことに注意してください。
すべてのかなを取得しようとする「[\k\h]」のようなものは機能しません。
代わりに「(\k|\h)」を使用してください。

onworks.net サービスを使用してオンラインでルックアップを使用する


無料のサーバーとワークステーション

Windows と Linux のアプリをダウンロード

  • 1
    ディープクリーン
    ディープクリーン
    すべてのビルドを無効にする Kotlin スクリプト
    Gradle/Android プロジェクトからのキャッシュ。
    Gradle または IDE で使用できる場合に便利です。
    下。 スクリプトはテスト済みです
    macOSですが...
    ディープクリーンをダウンロード
  • 2
    Eclipse Checkstyle プラグイン
    Eclipse Checkstyle プラグイン
    Eclipse Checkstyle プラグイン
    Checkstyle Java コードを統合
    監査人を Eclipse IDE に追加します。 の
    プラグインはリアルタイムのフィードバックを提供します
    違反についてのユーザー...
    Eclipse Checkstyle プラグインのダウンロード
  • 3
    AstrOrzPlayer
    AstrOrzPlayer
    AstrOrz Player は無料のメディア プレーヤーです。
    ソフトウェア、WMP および VLC に基づく部分。 の
    プレーヤーはミニマリスト スタイルで、
    XNUMX を超えるテーマ カラー、および
    B ...
    AstrOrzPlayer をダウンロード
  • 4
    モビスタート
    モビスタート
    Kodi Movistar + TV es un ADDON para XBMC/
    Kodi que 許可ディスポンナー デ ウン
    IPTV のロス サービスの復号化機能
    モビスター インテグラド エン ウノ デ ロス
    メディアセンターマ...
    movistartv のダウンロード
  • 5
    Code :: Blocks
    Code :: Blocks
    Code::Blocks は無料のオープンソースです。
    クロスプラットフォームの C、C++、および Fortran IDE
    最も厳しいニーズを満たすように構築されています
    そのユーザーの。 それは非常に設計されています
    伸びる…
    コードをダウンロード::ブロック
  • 6
    中に
    中に
    中または高度な Minecraft インターフェイス
    データ/構造追跡は、
    Minecraft の概要を表示する
    実際に作成することなく、世界。 それ
    できる ...
    ダウンロード
  • 詳細»

Linuxコマンド

Ad