移動先 先頭, 前, 次, 末尾 セクション, 目次.
- Amazing
awk
Assembler
-
Toronto 大学のHenry Spencer が作成した全て
awk
で記述されている
retargetable assembler。様々な8ビットマイクロコンピュータのためのマシン記述
を含み、数千行ある。 gawk
と一緒に配布され(テストの一部として)、別の
プログラミング言語で記述されたプログラムのよい実例である。
- ANSI
-
American National Standards Instituteの略。この組織は多くの標準を制定し、
C言語もその中の一つである。
awk
言語
-
awk
プログラムを記述するのに用いられるプログラミング言語。
awk
プログラム
-
awk
プログラムは、ルールとして知られるパターンとアクションの集合の並
びからなる。プログラムに対して入力レコードが与えられる度に、プログラム中の
ルールは入力レコードに対して適用される。 awk
プログラムは関数定義を
持つ場合もある。
awk
スクリプト
-
awk
プログラムの別の呼び方。
- C
-
GNUソフトウェアを記述するときにもっとも使われているシステムプログラム言語。
プログラミング言語
awk
はCに似た文法を持っているので、このマニュアルで
は awk
とCの類似点を適当なところで指摘する。
- CHEM
-
pic
の為のプリプロセッサで、ある分子の記述を読み込み、その分子の図形
を描画するためのpic
の入力コードを生成する。これは Brian Kernighanに
よって書かれ、netlib@research.att.com
から入手できる。
gawk
-
GNUの実装による
awk
。
- GNU
-
"GNU's not Unix".
Free Software Foundation が 配布自由な POSIX準拠のコンピューティング
環境の完成を目指して行っているプロジェクト。
- POSIX
-
IEEEが策定を行っている可搬性のある
オペレーティングシステムインターフェースの標準規格の名称。
"IX"はこれらの標準がUNIXを継承していることを示している。
awk
ユーザーに深く関りがあるのは P1003.2の
Command Language and Utilities standardである。
- アクション
-
あるルールに適用する
awk
言語の文の並び。ルールのパターンが入力レコー
ドと一致したならば、awk
はそのルールのアクションを実行する。アクショ
ンは常にカーリーブレースで囲まれる。
セクション アクションの概観を参照.
- エスケープシーケンス
-
改行を`\n'としたり、ASCIIコードでのエスケープキャラクタを `\033'
とするような、直接印字できないキャラクタを記述するのに使われる特別なキャラ
クタ並び。 セクション 定数式を参照.
- カーリーブレース
-
`{'と`}'。カーリーブレースは
awk
プログラム中で、
アクションや、複文、関数本体を区切るのに使用される。
- 関数
-
よく使われる処理やプログラムの明確なタスクの特殊なグループ。
awk
は多くの組み込み関数を持ち、またユーザーは任意に関数を
定義できる
セクション 組込み関数を参照.
詳しくはセクション ユーザー定義関数を参照.
- キーワード
-
awk
言語でキーワードは特別な意味を持っている。キーワードは
予約されていて、変数名に使用することは出来ない。
awk
のキーワードは以下の通り
if
,
else
,
while
,
do...while
,
for
,
for...in
,
break
,
continue
,
delete
,
next
,
function
,
func
,
and exit
.
- 空白
-
入力レコード、または文字列中にあるスペースやタブの列。
- 組み込み関数
-
awk
言語は数値演算、タイムスタンプ関係、文字列操作などの組み込み関数
を持っている。例えばある数値の平方根を計算するsqrt
やある文字列から
部分文字列を取り出すsqrt
がある。 セクション 組込み関数を参照.
- 組み込み変数
-
ARGC
, ARGV
, CONVFMT
, FIELDWIDTHS
,
ENVIRON
, FILENAME
, FNR
, FS
,
IGNORECASE
,
NF
, NR
, OFMT
, OFS
, ORS
,
RLENGTH
, RSTART
, RS
, and SUBSEP
,
これらは特別な役目をする変数である。これらの変数のうち一部のものは
変更すると、 awk
の動作する環境に影響を及ぼす。
セクション 組込み変数を参照.
- 固定正規表現
-
固定正規表現は `/foo/'のように、スラッシュの間に書かれた正規表現である。
この正規表現は、あなたが
awk
プログラムを書いたときに選択され、実行
中にこれを変更することは出来ない。
- 再帰
-
直接、間接を問わず、関数の中で自分自身を関数呼び出しすること。もしこの説明
で解らなければ'再帰'の項目を参照すること。
- 左辺値
-
代入文の左辺に置くことの出来る式。大部分の言語では左辺値は変数か配列の要素
である。
awk
では、フィールド指示子も左辺値として扱うことができる。
- 条件式
-
三項演算子`?:'を使用した
expr1 ? expr2 : expr3
のような式。 expr1 を評価し、その結果が真であれば expr2 を評価し
た値が式全体の値となり、結果が偽であれば expr3 を評価した値が全体の値
となる。 expr2とexpr3のどちらかのみが評価される。
セクション 条件式を参照.
- 書式
-
書式指定文字列は
printf
文の出力を制御するのに使用する。
例えば、数値を文字列に変換するデータコンバートは、組み込み変数の
CONVFMT
中の書式文字列によって制御されている。
セクション 書式制御文字を参照.
- 数値
-
数値の値を持つデータオブジェクト。
gawk
の実装では
数値を表現するのに倍精度浮動小数点数が使われている。
- ストリームエディタ
-
入力ストリームからレコードを読み取り、読み込みが一回以上起きたときに操作を
行うプログラム。これは、何かの操作をはじめる前に入力ファイルを完全に読み込
むバッチプログラムやユーザーからの入力を要求する対話的プログラムと対照的で
ある。
- 正規表現
-
正規表現は、文字列の集合を意味するパターンであり、無限集合である。例えば
`R.*xp'という正規表現は、 `R'で始まり `xp'で終わる文字列全て
にマッチする。
awk
では、正規表現はパターンや条件式に使われている。
正規表現はエスケープシーケンスを含むこともできる。
セクション パターンとしての正規表現を参照.
- 代入
-
ある変数やデータオブジェクトの値を変更する
awk
の式。
代入できるオブジェクトは左辺値(lvalue)と呼ばれる。
lvalue. セクション 代入式を参照.
- データオブジェクト
-
数値かキャラクタの並び。数値は必要に応じて文字列に変換される。
逆の場合も同様である。
セクション 文字列と数値の変換を参照.
- 動的正規表現
-
動的正規表現は通常の式として記述された正規表現である。
"foo"
のような文字列であるが、値を変更することが出来る式である。
セクション 正規表現の使い方を参照.
- 特殊ファイル
-
オペレーティングシステム下にあるデバイス等を直接扱う代りに、
gawk
の内部で解釈されるファイル名。
例として、`/dev/stdin'がある。
セクション 標準入出力ストリームを参照.
- 入力レコード
-
awk
が読み込んだデータの一ブロック。
多くの場合は、awk
の入力レコードは一行のテキストである。
セクション 入力のレコードへの分割を参照.
- パターン
-
パターンは、(パターンが属する)ルールが入力レコードを処理の対象とするかど
うかを
awk
に通知する。
パターンはまた、入力をテストする際に使われる任意の条件式である。条件が満足さ
れたならば、パターンは入力レコードに対して'マッチした' と言われる。典型的な
パターンは、入力レコードと正規表現との比較であろう。セクション パターンを参照。
- 範囲(入力行の)
-
入力ファイルからの連続した行の並び。
パターンは
awk
に対する入力行の範囲を処理のために特定できる。
あるいはある一行を特定することもできる。セクション パターンを参照.
- 比較式
-
(a < b)
の様に、真または偽のどちらかの値をとる関係。比較式はif
文やwhile
文、またはand for
文、そして入力レコードの処理を選択す
るパターンに使われている。
セクション 比較式を参照.
- フィールド
-
awk
が入力レコードを読んだときに、入力レコードは空白を区切りとして分
割が行われる(もしくはFS
に設定することによって変更された区切りを示す
正規表現によって分割される)。分割された個々の固まりをフィールド、と呼ぶ。組
み込み変数の FIELDWIDTHS
に長さを代入することでフィールドの長さを固定
長とすることが出来る。 セクション 入力のレコードへの分割を参照.
- 複合文
-
カーリーブレースで囲まれた文の並び。複合文はネストさせることもできる。
セクション アクション中の制御文を参照.
- 副作用
-
副作用は式が値を作り出すときに一緒に発生する。
代入文、増加式、関数呼び出しは副作用を持つ。
セクション 代入式を参照.
- ブレース
-
"カーリーブレース"を見よ。
- 文字列
-
`I am a string' のような、キャラクタの並びからなるデータ。
awk
言語では定数文字列はダブルクォーテーションでくくられ、エスケープシーケンスを
含めることもできる。
セクション 定数式を参照.
- リダイレクト
-
標準入力ストリーム以外から入力を行ったり、標準出力ストリーム以外に出力を行
うこと。
`>'や`>>'、あるいは`|'といったオペレータを使用して
print
文やprintf
文の出力をリダイレクトすることが出来る。また、
`<'オペレータや `|'オペレータを使用して getline
文で読み込む
入力をリダイレクトすることが出来る。
セクション print
やprintf
の出力のリダイレクトを参照.
- ルール
-
awk
プログラムのsegment。一つの入力レコードに対してどのように処理する
かが記述されている。一つのルールは、一つのpatternと一つのaction
から構成される。 awk
は入力レコードを読み込むと、各ルールに対して、
入力されたレコードがルールの持つパターンを満足したときに、そのルールのアク
ション部を実行する。ということを繰り返す。そうでなければ、ルールは入力レコー
ドに対して何も行わない。
- 連接
-
片方の文字列の後ろにもう一つの文字列を連結して、二つの文字列を一つにまとめ
ること。例えば、 `foo' という文字列に `bar'という文字列を連結する
と `foobar'という文字列になる。
セクション 文字列の連結を参照.
移動先 先頭, 前, 次, 末尾 セクション, 目次.