Programming UNIX Sockets in C - Frequently Asked Questions: クライアントアプリケーションの作成 (TCP/SOCK

3. クライアントアプリケーションの作成 (TCP/SOCK_STREAM)

3.1 文字列をインターネットアドレスに変換するにはどうすれば良いのですか?

もしホストのアドレスをコマンド行から読んでいるのであれば、それが aaa.bbb.ccc.ddd スタイルのアドレスであるか host.domain.com スタイルのアドレスであるかを知ることはできないでしょう。私がこれに関して行う方法は、まず aaa.bbb.ccc.ddd タイプのアドレスであるとしてそれを使おうとします。そして、それが失敗したら、名前の検索を行います。以下に例を示します:


/* アスキー文字列を in_addr 構造体に変換する。アドレスがみつから
   なかった場合には NULL が返される。 */
struct in_addr *atoaddr(char *address) {
  struct hostent *host;
  static struct in_addr saddr;

  /* まず aaa.bbb.ccc.ddd 形式であるとして試してみる。 */
  saddr.s_addr = inet_addr(address);
  if (saddr.s_addr != -1) {
    return &saddr;
  }
  host = gethostbyname(address);
  if (host != NULL) {
    return (struct in_addr *) *host->h_addr_list;
  }
  return NULL;
}

3.2 私の作ったクライアントを、ファイヤーウォール/プロキシーサーバを越えて動作させるにはどうすればよいでしょうか?

もし各サービス用に独立したプロキシーを通しているのであれば、何もする必要はないはずです。sockd を通して使っているのであれば、あなたのアプリケーションを「socks 化」する必要があるでしょう。これを行う方法の詳細は socks パッケージ自身に入っています。これは以下の場所にあります:

ftp://ftp.net.com/socks.cstc/socks.cstc.4.2.tar.gz

socks の FAQ は以下で取得できます:

ftp://coast.cs.purdue.edu/pub/tools/unix/socks/FAQ

3.3 なぜ、サーバが accept() する前に connect() が成功するのですか?

Andrew Gierth 氏 ( andrew@erlenstar.demon.co.uk) より:

ソケットに対して listen() 呼び出しを行った後は、カーネルはそれに対してコネクションを accept する準備を行います。普通の UNIX の実装では、正当な SYN セグメント(コネクション要求)が到着すると、SYN ハンドシェイクを 即座に 完了させ、新しいコネクションのためのソケットを作成し、その新しいソケットを accept() 呼び出しですぐ利用できるように内部キューに保持しておく、というように動作します。ですから、ソケットは accept が行われる前に完全にオープンするわけです。

これに関するその他の要素は、listen() の「バックログ」パラメータです。これは、その完了したコネクションが同時にいくつまでキューに入れられるか、を定義します。もしその指定した数を越えてしまったら、新しく到着したコネクションは単純に無視されます(そしてリトライを起こさせます)。

3.4 どうして、一つ以上のサーバを使っているときにサーバのアドレスを失ってしまうことがあるのでしょうか?

Andrew Gierth 氏 ( andrew@erlenstar.demon.co.uk) より:

hostent 構造体をじっくりと眺めて見てください。その中のほとんど全てがポインタであることに気がつかない? これらのポインタの 全て は静的に割り当てられたデータとして参照されます。

例えば、こんな風にしたとすると:


    struct hostent *host = gethostbyname(hostname);

すると(もうお分かりのように)、次に呼び出される gethostbyname() が 'host' によって指し示されている構造体を上書きしてしまうでしょう。

ですが、このようにして:


    struct hostent myhost;
    struct hostent *hostptr = gethostbyname(hostname);
    if (hostptr) myhost = *host;

それが上書きされる前に hostent のコピーを作っても、やはりそれでも 次に呼び出される gethostbyname() によってぶち壊されてしまいます。なぜなら、 myhost は上書きされないけれども、それが指し示しているデータが全て上書きされてしまうからです。

これは hostent 構造体の正しい「深層コピー」を行うことによっても回避できますが、これは退屈な仕事です。私の推奨する方法は、 hostent の必要なフィールドだけを、独自の方法で格納することです。

Robin Paterson 氏 ( etmrpat@etm.ericsson.se) による追加:

マルチスレッドプログラミングに対応している MT safe なライブラリについて触れておいても良いかもしれません。私が今書いている Solaris のマシンでは、gethostbyname と gethostbyname_r (_r は再入可 reentrant のこと)というものがあります。主要な違いは、hostent 構造体の格納場所を あなたが 提供するということで、静的領域への単なるポインタではなく、常にローカルなコピーを持つことになります。

3.5 connect() システムコールにタイムアウトを設定するにはどうすればよいのでしょうか?

Richard Stevens 氏 ( rstevens@noao.edu) より:

通常はこれを変更することはできません。Solaris では ndd tcp_ip_abort_cinterval パラメータによって、カーネル毎にこれを行うことはできます。

connect の時間を短くする最も簡単な方法は、connect() の呼び出しの近くに alarm() を置くことです。より難しい方法は、ソケットを非ブロックに設定した後 select() を使うという方法です。また、コネクト時間は短くすることだけができるのであって、普通は長くする方法はない、ということにも気をつけてください。

Andrew Gierth 氏 ( andrew@erlenstar.demon.co.uk) より:

まず、ソケットを作成してそれを非ブロックモードにし、そして connect() を呼び出します。三つの可能性があります:

コネクト成功: コネクションの作成に成功した(これは通常、自分自身にコネクトしたときにのみ起こる)
コネクト失敗: 明らか
コネクトが -1/EINPROGRESS を返す。コネクション要求は始まったが、まだ完了していない。

もしコネクションが成功すれば:

ソケットは select() で書き込み可能となる(そしてデータが到着すれば読み込み可能にもなるでしょう)。

もしコネクションが失敗すれば:

ソケットは select で読み込み可能 *かつ* 書き込み可能となるが、read と write のどちらも要求コネクションからのエラーコードを返す。また、エラー状態を得るのに getsockopt(SO_ERROR) を使うこともできますが、これは注意してください。システムによっては getsockopt の結果のパラメータの中にエラーコードが返されますが、別の(正しくない)システムでは getsockopt *呼び出し自身* が失敗し、エラーとして値が格納されます。

3.6 ポート番号は、私の書いているクライアントプログラムにおいて bind() すべきでしょうか? あるいは connect() 呼び出しによってシステムに選ばせるべきでしょうか?

Andrew Gierth 氏 ( andrew@erlenstar.demon.co.uk) より:

** システムにあなたのクライアントのポート番号を選ばせてください **

例外は、どのクライアントのポートからのコネクションを許すかについて、サーバが選り好みするように書いてある場合です。rlogind と rshd は古典的な例です。これは通常、 UNIX 特有の(かなり貧弱な)認証機構の一部です。その意図は、サーバは root 権限を持つプロセスからのみのコネクションを許すということです(この機構が脆弱なのは、多くの OS (例えば MS-DOS) では誰でも好きなポートを bind できるからです)。

rresvport() ルーチンは、この機構を使っているクライアントを手助けするために存在しています。これは基本的には socket() + bind() でポート番号を 512...1023 の範囲から選ぶ、ということと同一です。

サーバが クライアントの ポート番号についてうるさく言わないのであれば、クライアントにおいてあなたが自分で割り当てようとはしないでください。単に connect() に選ばせてください。

もしクライアントにおいて、正常に動作するまでとして、固定ポート番号から開始する単純な機構を使って一貫した値で bind() を呼び出しているとすると、あなたはたくさんのトラブルの中に身を投じることになります:

問題は、あなたのコネクションのサーバ側がアクティブクローズを行った場合(例えば、クライアントが「終了」コマンドをサーバに送り、サーバはそのコネクションを閉じて応答する場合)です。これはコネクションのクライアント側を CLOSED 状態にして、サーバ側を TIME_WAIT 状態にします。ですから、クライアントが終了した後、クライアント側ではそのコネクションの形跡は残りません。

ここで、そのクライアントをもう一度実行します。するとそれは同じポート番号を選ぶでしょう。なぜならそのクライアントから見た限りでは、そのポートは空いているからです。しかし connect() を呼び出すと、サーバはあなたがすでに存在するコネクションに(TIME_WAIT 状態にはあるけれども)重複しようとしていると思い込みます。これは、この接続を拒否するための全く正当な権利があるので、あなたは connect()から ECONNREFUSED を受け取るんじゃないかと私は推測します(システムによっては、どんな場合でもコネクションを許すときもあるかもしれませんが、しかしそれをアテにしては いけません)。

この問題が特に危険なのは、これがクライアントとサーバが 異なった マシン上で実行されるまで現れないからです(もし同一のマシン上にあったとすると、クライアントは前と同じポート番号は 選びません)。それによって、(もしあなたが、多くの人がやってるんじゃないかと思われる方法のように、最初はクライアントとサーバを同一のマシン上で試験を行っているのだとすると)あなたは開発サイクルにさらに深く食い込むことになるかもしれません。

たとえあなたのプロトコルがクライアントからクローズする場合であっても、それでもまだこの問題を引き起こす方法はあります(例えば、サーバの停止させる)。

3.7 どうして、サーバが動いてないときは「コネクション拒否 "connection refused"」されてしまうのですか?

connect() 呼び出しは、コネクションの確立を待っているときのみブロックします。相手側に待っているサーバがいないときは、コネクションが確立できないことが通知され、あなたが見たエラーメッセージを返してあきらめるのです。これは、クライアントが存在しないサービスを永遠に永久に待ってしまうという場合が有り得ないので、良いことなのです。ユーザは単にコネクションが確立されるのを待っているだけだと思うでしょうし、そしてあきらめた後に、ぶつぶつと小声で、安っぽいソフトウェアだと文句を言うのです。

3.8 どれくらいの量の情報がソケットを通して入ってくるのか分からないときはどうすればよいのですか? 動的なバッファを持つ方法はあるのですか?

この質問は Niranjan Perera 氏 ( perera@mindspring.com) から尋ねられました。

入ってくるデータの大きさが分からないときは、可能な限り大きな(おるいは適当な)大きさのバッファを作ることも、また読み込み中に動的にバッファをリサイズすることもできます。大きなバッファを malloc() した時は、(全て、でなければ)ほとんどの UNIX の種類においては、アドレス空間だけを割り当てて、物理的なメモリのページは割り当てられません。バッファがだんだん使われてくるにつれて、カーネルは物理メモリを割り当てます。これの意味するところは、大きなバッファを malloc することはそのメモリを使うまで資源を無駄にすることはないので、数キロしか予想されていなくても1メガのメモリを要求することは十分許容できる、ということです。

一方、カーネルの内部動作に依存しない、よりエレガントな解決法は、 realloc() を使って、バッファを必要に応じて例えば 4 キロの塊(4 キロは多くのシステムでのメモリのページサイズ) で拡大するという方法です。いつの日かこれを sockhelp.c の例に追加するかもしれません。

Previous Next Table of Contents