useless tips

上の page を 読み返せるよう w3m を 使って text にしておく ... のは いいけど、janjan の page のほうは どうも 読みづらい。
これは、記事の 前に 30個分の スペースが とってあるからなので、以前 つくった rm_pre_space() 関数を いじって rm_pre_word() 関数を でっちあげてみた。

/* rmpreword.c */
#include
#include
#include
#include

#define MAX_SIZE (300 + 1 + 1)
#define LENGTH 30

void carte();
void remove_pre_word();
void cant();

main(int argc, char **argv)
{
FILE *fp;

--argc;
++argv;

if (argc == 0)
carte(stdin);
else {
while (argc--) {
if )((fp = fopen(*argv, "r"))( == NULL)
cant(*argv);
carte(fp);
fclose(fp);
argv++;
}
}

return 0;
}

void carte(FILE *fp)
{
char buf[MAX_SIZE];

while (fgets(buf, MAX_SIZE, fp) != NULL) {
remove_pre_word(buf);
fputs(buf, stdout);
}
}

void remove_pre_word(char *buf)
{
int m, n;
char *p;
char *q;

for (p = buf, m = 0 ;; p++, m++) {
if (m == LENGTH)
break;
}
q = buf;
n = strlen(p) + 1;
while (n--)
*q++ = *p++;
}

void cant(char *name)
{
fprintf(stderr, "Can't open %s\n", name);
exit(1);
}

記事以外の ところが 文字化けするけど、あとで 整形すると いうことで 許してもらって、と。
$ w3m -dump www.janjan.jp/culture/0503/0503144610/1.php > file1
$ w3m -dump www.janjan.jp/culture/0503/0503164719/1.php > file2
$ w3m -dump www.janjan.jp/culture/0503/0503194786/1.php > file3
$ w3m -dump www.janjan.jp/culture/0503/0503244918/1.php > file4
$ w3m -dump www.janjan.jp/culture/0504/0504015264/1.php > file5
$ w3m -dump www.janjan.jp/culture/0504/0504065445/1.php > file6
$ cat file1 file2 file3 file4 file5 file6 > file.txt
$./rmpreword file.txt > takato2.txt
$ vi takato2.txt (<- ここで 整形)
$ rm file*
(追記) コードの 一部を 訂正 (06/07/31)