はじめての C - sekiyo’s diary

C programming note*1
プログラムの扱う内容が少し複雑になってきたときは、

内部のしかけを考える前に、まず外部の仕様を考えよう。プログラムとその外側とのやりとりのことだ。

この場合の外部 (外側) とは「人間がそのプログラムをどう操作しどんな形式で入力を与え、そしてどんな出力を得るか」ということだ。

そこで以下のような外部仕様 (インターフェイス仕様) を考える。

1. find1.c を改良し、複数の文字列を探せるようにする。

2. 検索文字列リストは、別のテキストファイル (をつくり、そこ) に 1行あたり 1つの文字列として格納されているものとする。

3. 検索文字列リストのファイル名は -f filename のオプションでコマンドラインで指定できるようにする。

4. その場合の入力元の指定は find1.c と同様とする。

5. -f オプションの指定がなかった場合は、find1.c と同様の処理をするものとする (入力元の指定についても)。

6. 検索文字列リストのファイルに指定できる検索語は最大 256個以内とする (それと、検索語のサイズもきめておく)。

7. ある 1つの行が複数文字列にマッチしても、1度しか出力しない (ようにする)。(p168-169)

1 は当初の目的、3 から 7 までがいわゆるユーザインターフェイスとよばれるものです。
つまり find1 と同じく

$ ./find2 keyword file1 file2

と実行しても、あるいは

$ ./find2 -f search_list file1 file2

のようにリストで指定しても、どちらも検索が可能だということです。
まず最初に、関数 find() を「複数の文字列との照合」ができるよう変更を加えます。

void find(FILE *fp, char *word[], int n)

{

    char buf[MAX_SIZE];

    int i;    while (fgets(buf, MAX_SIZE, fp) != NULL) {

        for (i = 0; i < n; i++) {

            if (strstr(buf, word[i])) {

                fputs(buf, stdout);

                break;

            }

        }

    }

}

仮引数のところで、変数 word が文字列へのポインタから配列へのポインタに変更され、また検索文字列の数 n が追加されています。

n は比較すべき文字列の個数だ。

文字列を 1つだけ指定するやりかた (find1 と同じ形) で起動したときには、この n の値は 1 になっている。

検索文字列用のファイルの中に 3つの文字列が格納されていたのならば、n は 3 だ。

for文によるくり返しを使って文字列の個数分だけ比較を行なっている。

検索文字列はこの word という名前の配列に入っていて、word[0] には 1つめの検索文字列、word[1] には 2つめの検索文字列 ... のように文字列が格納されているので、この if文で比較ができるわけだ。(p174)

find() 関数に渡される各引数がどのように準備されるのかはちょっと置いといて、次はユーザインターフェイスの 7つめにあったしくみについて、

fputs() したあとの break に着目してほしい。

この break はループからの脱出のためのものだ。 break文を実行すると、for や while などのくり返しループを脱出し、ループの後ろの部分へ分岐する。

(関数 find() の) この部分では、while ループの中に for ループが入っているという二重のループが構成されている。

break文は 1つのループしか脱出しないので、この場合は内側の for ループから脱出して for の終わったところに分岐するわけだ。

この break にて、配列 word に入っている文字列のうちいずれか 1つにマッチしたならば、すぐにその行を出力して、次の行の照合に制御を移動させている。

すなわち、「同じ行に探している文字列が 2つ以上存在しても、出力は 1回だけ」を実現している (ことになる)。(p174-175)

*1:「作ってわかる Cプログラミング」