はじめての C - sekiyo’s diary

C programming note*1

たとえば、「入力テキストの中で "the" という文字列が含まれている行だけを選んで出力する (そうでない行は出力しない) という処理は、いろんな場面でありそうな処理だ。

入力がテキストであるときに、それを 1文字ずつ処理して言ったほうが都合のよい場面ももちろん多い。だが ... このテーマに関するようなプログラムでは「行単位」での入出力をするほうがずっと効率がよい。(p158)

UNIX のコマンド grep ですね。たしか grep は "global regular expression and print" の略だったと思うけど ...。
プログラム全体の骨組みは cat3r.c を使うことにして、

また、ここでは問題を簡単にするために、「1行は 80 Byte 以下でなければならない」という制限をつけてある。

まず、各行中にキーワード (この例だと "the") が含まれていれば標準出力する関数をつくっていきます、

#include 
#define KEYWORD "the"

#define MAX_SIZE (80 + 1 + 1) /* plus '\n' + '\0') */
void find(FILE *fp)

{

    char buf[MAX_SIZE];    while (fgets(buf, MAX_SIZE, fp) != NULL) {

        if (strstr(buf, KEYWORD))

            fputs(buf, stdout);

    }

}

fgets() で 1行ごとに標準入力から読み、(if の条件文でキーワードを探してから) fputs() で行単位で標準出力に書いている。

この関数ではじめて使われた標準ライブラリ関数の strstr() ですが、

この関数を使うときには、string.h をインクルードしなければならない。string.h の中には、

char *strstr(const char *cs, const char *ct);

というようなプロトタイプ宣言が含まれているはずだ。この const という C のキーワードについてはここでは説明しないので、

char *strstr(char *cs, char *ct);

とでも書いてあると考えてよい。

strstr() 関数は、文字列 cs の中から文字列 ct を探し、見つかれば最初に現れる位置へのポインタを、見つからないときには NULL を返す。

ということは、1つめの引数に 1行分のデータを、2つめの引数に探そうとしている単語を指定して strstr() 関数を呼び出せば、その単語が含まれている行かどうかを検査できる。(p160-161)

このままでもプログラムは組み立てられますが、少し改良を加えていきます。まずキーワードは #define で変更可能ですが、このままだと、

変更のたびにいちいちプログラムを修正してコンパイルしなおさないと、新しい検索対象に対応した実行用ファイルを作れないのだ。

つまり、

このようなときには、1つのプログラムで「実行時に指定した任意の文字列を探せる」ようにするべきなのだ。(p162)

そのためには、以前つくったように、main() 関数の中にパラメータを指定するためのコードを追加する必要があります。
始めは、オプションを使わずキーワードが 1つだけの場合、

検索語 (探すべき文字列) の指定は (コマンドラインの) 第1パラメータで行なうことにする。

つまり、実行時にそこに指定した文字列を探せるようにするのだ。

第2パラメータ以降が入力ファイル名で、その順に処理する。

またパラメータが 1つしかないとき (ファイル名の指定が 1つもないとき) には、標準入力を処理する。

パラメータが 1つもないときには使用法のヒントを標準エラー出力に表示して終了することにしよう。(p163)

こんなふうな指定のやりかたです、

$ ./find1 keyword file

または、

$ ./find1 keyword < file

続けてファイルを読み込むには、

$ ./find1 keyword file1 file2 file3

*1:「作ってわかる Cプログラミング」