テキスト処理に関するコマンド

wc:指定された各fileのバイト数や空白で区切られた単語の数、行数など数える。
<書式> wc [option..] [file..]

fileが一つも与えられないと標準入力から読み込む。また FILE が `-' だった場合には、そのファイルには標準入力が用いられる。

-c, --bytes, --chars バイト数だけを出力する。
-l, --lines 改行数だけを出力する。
diff:2つのファイル間の違いを探す。
<書式> diff [option..] file1 file2
-b, --ignore-space-change 空白の数だけが違う場合には違いを無視する。
-i, --ignore-case 英大文字と小文字の違いを無視する。
-w, --ignore-all-space 行を比較するとき空白を無視する。
diff3:3つのファイル間の違いを探す。
<書式> diff3 [option..] file1 file2 file3
sort:ファイルの内容を行単位で順に並べて変えて表示する。
<書式> sort [option..] [file.].
-b 各行の比較の際に、行頭の空白を無視する。
-c 与えられたファイルがすでにソートされているかどうかをチェックする。ソートされていないものがあっ た場合は、エラーメッセージを表示してステータス 1 で終了する。それ以外の場合は正常終了する。
-d 「電話帳」順でソートする。アルファベット、数字、空白以外のキャラクタをすべて無視してソートす る。
-f ソートの際に、小文字を対応する大文字と同じに扱う。
-i 印字可能でない文字を無視する。
-m 与えられたファイル群をまとめてソートしてマージする。入力ファイルは事前にそれぞれソートされてい なければならない。マージ動作ではなく、ソート動作を複数ファイルにまとめて行うこともできる。マージ動作が提供されているのは、こちらの方が高速だから である。
-n 数値順に評価する。行先頭の文字列を数値文字列として比較する。
-r, --reverse 比較の結果を逆順にする。
-u 同一行を出力しない。
grep:grepはfileで名前を指定された入力ファイルを読み込み、与えられたPATTERNにマッチ する部分を含む行を探す。デフォルト動作では、 grepはマッチした行を表示する。
<書式> grep [option..] PATTERN [file..]

grep [option..] [-e PATTERN | -f file] [file..]

egrepはgrep -Eと同じで、fgrepはgrep -Fと同じで、zgrepはgrep -Zと同じである。

-A NUM, --after-context=NUM NUMで指定した行数だけ、パターンにマッチした行の後の行も表示しする。
-a, --text バイナリファイルをテキストファイルであるかのように処理する。これは--binary-files =text オプションと等価である。
-B NUM, --before-context=NUM NUMで指定した行数だけ、パターンにマッチした行の前の行も表示する。
-C[NUM], -NUM, --context[=NUM] NUMで指定した行数だけ、パターンにマッチした行の前後の行も表示する。
-b, --byte-offset 各出力行の前に、入力ファイルの先頭からのバイト単位のオフセットを表示しする。
--binary-files=TYPE ファイルの最初の数バイトが、ファイルの内容がバイナリファイルであることを示す場合、ファイルのタ イプをTYPEであると仮定する。デフォルトではTYPEはbinaryであり、grepは通常、バイナリファイルの一致を示す一行メッセージを表示する か、マッチしない場合にはなにも表示しない。 TYPEがwithout-match の場合、 grepはバイナリファイルはマッチしないものと仮定する。
-c, --count 通常の出力はせず、各入力ファイルについてマッチした行数を表示する。 -v,--invert-matchオプションと共に指定した場合は、マッチしなかった行数を表示する。
-d ACTION, --directories=ACTION 入力ファイルがディレクトリの場合に、 ACTIONを使ってその処理を行う。デフォルトでは ACTION は read であり、ディレクトリを普通のファイルであるかの様に読み取る事を意味する。ACTIONがskipなら、ディレクトリを黙って読み飛ばす。ACTION がrecurseなら、grepは各ディレクトリ下のすべてのファイルを再帰的に読み取る。
-E, --extended-regexp PATTERNを拡張された正規表現として扱う。
-e PATTERN, --regexp=PATTERN PATTERNをパターンとして指定する。 - で始まるパターンを保護するために有効である。
-F, --fixed-strings PATTERN を改行で区切られた固定文字列のリストとして扱う。その文字列のどれかとマッチするかを調べる。
-f FILE, --file=FILE パターンをFILEから1行ごとに読み込む。空のファイルはパターンを含まないので、何にもマッチし ない。
-G, --basic-regexp PATTERN を基本的な正規表現として扱う。(デフォルト)
-H, --with-filename 各々のマッチに対してファイル名を表示する。
-h, --no-filename 複数ファイルを検索した時に、出力の前にファイル名を付けることを抑制する。
-I バイナリファイルをマッチするデータを含まないかのように処理する。
-i, --ignore-case PATTERNと入力ファイルの双方で、英大文字と小文字の区別をしないようにする。
-L, --files-without-match 通常の出力はせず、このオプションを指定しなかったときに全く出力されない入力ファイルの名前を表示 する。スキャン動作は最初のマッチで終了する。
-l, --files-with-matches 通常の出力はせず、このオプションを指定しなかったときに出力される入力ファイルの名前を表示する。 スキャン動作は最初のマッチで終了する。
--mmap 可能ならば、デフォルトの read(2) システムコールの代わりに mmap(2) システムコールを使って入力を読み取る。
-n, --line-number 各出力行の前に、入力ファイルにおける行番号を表示する。
-q, --quiet, --silent 通常の出力を抑止する。
-r, --recursive 各ディレクトリ下のすべてのファイルを再帰的に読み取る。これは-d recurseオプションと等価である。
-s, --no-messages 指定されたファイルが存在しないことや読み込みできないことを示すエラーメッセージを抑止する。
-v, --invert-match 結果を反転し、マッチしなかった行を選択する。
-w, --word-regexp 完全な語にマッチする行のみを選択しする。マッチする部分文字列が行頭から始まっているか、単語構成 文字以外の文字が前にあることがテストされる。同様に、マッチする部分文字列が行末まであるか、単語構成文字以外の文字が後にある必要がある。単語構成文 字とは、レター・数字・アンダスコアである。
-x, --line-regexp 行全体と正確にマッチする行のみを選択する。
--null 通常ファイル名の後に続く文字の代わりにバイト 0 (ASCII NUL 文字)を出力する。
-Z, --decompress 検索を開始する前に入力データを伸長する。このオプションはzlibライブラリと共にコンパイルした 場合のみ使用可能である。
tr:文字の変換・削除や、連続する文字の圧縮を行う。
<書式> tr [option..] [string1 [string2]]
-c, --complement string1を、string自身の補集合(string1に含まれない文字すべて)で置き換え る。
-d, --delete string1にある入力文字を削除する。変換しない。
-s, --squeeze-repeats 同じ文字の繰り返しを1文字に置き換える。この操作は変換や削除のあとに行われる。string1に ある文字の繰り返しを、その文字 1 文字に置き換える。
-t, --truncate-set1 変換を行う前に、まずstring1をstring2の長さに切り詰める。
sed:ストリームエディタ
<書式> sed [-n] [-V] [--quiet] [--silent] [--version] [--help] [-e script] [--expression=script] [-f script-file] [--file=script-file] [script-if-no-other-script] [file...]

sed はストリームエディタである。ストリームエディタは、入力ストリーム (ファイルまたはパイプラインからの入力) に対して基本的なテキスト変換を行うために用いられる。 sed は編集スクリプトを使える (ed のような) エディタといろいろな面で似ているが、 sed は入力に対して 1 パスだけで動作するので、より効率的である。またsedはパイプラインのテキストに対してフィルタ動作を行うことができ、この点は他のタイプのエディタと はっきり違う。

-n --quiet --silent デフォルトでは、 sedはスクリプトの各サイクルの最後でパターンスペースの内容を出力する。これらのオプションを指定するとこの自動的な出力が行われなくなり、 p コマンドで出力することを指定された場合に限ってsedは出力を生成する。
-e script --expression=script script のコマンドを、入力の処理中に行われるコマンドセットに追加する。
-f script-file --file=script-file ファイル script-file に含まれるコマンドを、入力の処理中に行われるコマンドセットに追加する。
spell:単語のスペルチェックをする。
<書式> spell [option..] file..
-b British綴りをチェックする。
-v その綴りでスペリングリストに入っていないすべての単語を表示し、その単語から可能性のある派生語が 示される。