Winsock Programmer's FAQ: Winsock 中級者向けの議論

Winsock Programmer's FAQ
第3章: Winsock 中級者向けの議論

3.1 - Winsock において { HTTP, POP3, SMTP, FTP, Telnet, NNTP, など} はどうやって喋れば良いの?

Winsock 自身はこれらのプロトコルを話すための方法は提供していません。というのも Winsock はこれらアプリケーションレベルプロトコルのより下層を取り扱うものだからです。しかし、あなたのプログラムにこれらのプロトコルを話させる方法はたくさん存在します。

最も簡単な方法は、サードパーティのライブラリを使う方法です。リソースの章にてこれらのいくつかを紹介しています。

もし HTTP、FTP、gopher プロトコルさえ使えればよいのであれば、 Microsoft Internet Explorer から提供されている WinInet ライブラリを使用することができます。新し目のバージョンの Microsoft の開発ツールには、WinInet に簡単にアクセスするためのコンポーネントが含まれています。

最後に、全て自分で作り出すことも当然ながら可能です。実装しようとしているプロトコルの仕様を読むことから始めたほうが良いでしょうね。ほとんどのインターネットのプロトコルは RFC に記述されています。重要な RFC のページには、よく参照されるアプリケーションレベルのRFC へのリンクがあります。プロトコルの複雑さは非常に様々であり、プロトコルを実装するための難易度を測る唯一の方法は、関連するRFC (複数であることも)を読むしかありません。例として HTTP の場合は、非常に単純なプロトコルではありますが、この RFC の著者は 176 ページをもこの説明に費やしています。ま、ほとんどの RFC ではこんなにもったいぶったりしてませんけどね。よかった。

RFC を読んだけれどもまだよくそのプロトコルのことが理解できないのであれば、Usenet で聞いてみるのも手です。特定のアプリケーションプロトコルに特化したニュースグループがたくさん存在しています: その多くは comp.protocols.* 階層にあります。そこに無くても、その他一般の Winsock、TCP/IP のメーリングリストとニュースグループの一つで聞いてみることもできます。

3.2 - TCP ストリームを SSL/TLS で暗号化するにはどうすればよいの?

現時点では、Windows NT 4.0 SP4 以上、Windows 2000、Windows CE では組み込みの SSL 機能を持っています。その他のオペレーティングシステムでは WinInet を使うか(さまざまな制約がありますが)、あるいはサードパーティ製のライブラリを使うことです。

Windows NT 4.0 SP4以降と Windows 2000 は、セキュリティ API を通して SSL が提供されます。この機能がどのように動作するかを示す簡単なサンプルコードが Win32 Platform SDK にあります。SSL のサンプルは、Platform SDK ディレクトリの "Samples\WinBase\Security\SSL" 配下にあります。

Windows CE では異なる SSL のメカニズムを持っています。この機能をどのように使うのかを記述した MSDN の記事があります。この記事は WinInet の方法にも触れています。

WinInet は Internet Explorer バージョン3 以降の機能で、これを使うことで Intenet Explorer のネットワークの機能の一部を自分のプログラムで利用することができようになります。IE3 は Windows 95 OSR2 以降に載っており、Microsoft は IE を Windows の機能の一部として残すことに多大な努力を払っているので、WinInet は妥当な選択肢の一つです。WinInet の主な欠点は、SSL 機能は HTTP 上でしか動作しないこと、また WinInet はあまり柔軟性がないということです。加えて、128-bit の IE は全世界で利用可能なわけではありません。MS Knowledge Base の記事 Q168151 ではこの機能を使う方法を示されています。

3.3 - Winsock プログラムで自分の IP アドレスを取得する方法は?

3種類の方法があり、それぞれに利点、欠点があります:

最も簡単な方法は、connect 済みのソケットに対して getsockname() を呼び出すことです。connect 済みのソケットが無ければ、その呼出しは失敗するか、あるいは無意味な情報が返されます。
ソケットを事前にオープンすることなしに自分のアドレスを取得するには、gethostname() の返却値に対して gethostbyname() を呼び出すことです。この例に示すように、この呼出しはそのホストが持つ全てのインターフェースのリストを返却します。 (この方式の問題点については、例のページを参照のこと。)
三番目の方法は Winsock 2 でのみ動作します。新しい WSAIoctl() API は SIO_GET_INTERFACE_LIST オプションをサポートしており、返却される情報の一部として、システムの各々のネットワークインターフェースのアドレスが返却されます。[C++ の例] (これも、注意点については例のページを参照のこと。)

後者二つの方式では、多くの TCP/IP ネットワークのマシンでは少なくとも二つのアドレスが返却されます。一つは「普通の」ネットワークインターフェースで、一つは「ループバック」ネットワークインターフェースになるはずです。通常、「普通の」ネットワークインターフェースはモデムかイーサネットカードです。ループバックインターフェース (IPアドレス 127.0.0.1)は、同一のマシン上で動作する二つのプログラムが、オペレーティングシステムのネットワークハードウェアレイヤを通過することなしに通信できるようにさせるものです。ループバックインターフェースを使用した通信は少なくとも普通のネットワークインターフェースと同じ程度の速度であり、ネットワークスタックによってははるかに高速になります。

一つのシステム上に二つ以上のネットワークインターフェースを持つこともあり得ます。多くのサーバでは、例えば二つ以上のネットワークインターフェースカードを持っていると、上記2番目、3番目の方法では4つ以上のエントリーが表示されます。さらに複雑な例はサテライト型インターネットルータで、これにはインターネットへの上流接続を行うモデムコネクション、インターネットからの下流接続を行うサテライトアダプタ、その他の LAN を通信するイーサネットカード、そしてもちろんループバックインターフェースが繋がっています。

もし同じマシン上で動作しているサーバとソケットを使って通信したいのであれば、ループバックインターフェースを使ってください。そうでなければ、普通のインターフェースのうちの一つを、頭をフル回転させて選ばなくてはなりません。全ての目的で使える決まりきった方法はありません。ほとんどのプログラムにおいては、実際にコネクションが使っている IP アドレスが返却されるので、上記の1の方法で十分です。もしこれが使えないのであれば、インターフェースにリストを表示して、ユーザに一つを選ばせる必要があるかもしれません。

PPPインターフェースのアドレスを知りたい、というときのように、より詳細な条件がある場合があります。この場合には上記の 3 の方式が使えます。これによって得られる情報の中には、PPP インターフェースのフラグが含まれるので、これで「ポイントto ポイント」インターフェースかどうかを知ることができるのです。

3.4 - TCPのようなストリームプロトコルで、パケット単位の処理を強制するための正しい方法は?

よく使われる方法は、区切り文字を使う方式と、長さの接頭辞を付加する方式の二つです。

区切り文字を使う方式の例は、例えばキャレット文字(^)を使ってパケットを区切る、ということです。もちろん、その区切り文字は通常データの中には決して出てきてはいけません。あるいは区切り文字を「エスケープ」する何らかの方法を用意しなければなりません。

長さ接頭辞を付加する方式の例は、パケットサイズをあらわす2バイトの整数値を、全てのパケットの先頭に付加する、というようなことです。整数値をネットワーク経由で送信するための正しい方法については、 FAQ の記事 TCP を有効に使うためにを参照して下さい。

これら両者を組み合わせた方式もあります。例えば HTTP プロトコルでは、ヘッダ行を CRLF の組で分離しますが(区切り文字方式の一種)、 HTTP の応答としてバイナリデータの塊を含める場合には、サーバはデータを送る前に Content-length ヘッダを送信します。これは長さ接頭辞方式の一種です。

次に何バイトのデータが来るのか、長さ接頭辞の値を読み込めばすぐわかるので、私は単純な長さ接頭辞方式の方が好きです。それに対して区切り文字方式では、パケットの終わりが来たとわかるまで、闇雲に読み出し続けなくてはならないのです。

3.5 - 今サーバを書いています。どのポート番号を使えばよいのですか?

今作っているサーバが、既存の一般的なインターネットプロトコルのサーバであれば、そのポート番号は既に割り当てられています。これらのよく使われる番号については、Internet Assigned Numbers Authority (IANA) のウェブサイトで知ることができます。

もし新しいプロトコルのサーバを作っているのであれば、サーバのポート番号を選ぶ上で、従うべきルールと慣習がいくつかあります。

ポート番号 1 ～ 1023 は、新しいプロトコルを作成する人は使ってはいけません。この範囲は「標準」プロトコルのために IANA によって予約されています。POP3 や HTTP といった重要なプロトコルにおいては小さい番号(それぞれ 110 と 80)が割り当てられますが、君の作った新しい K-RAD ゲームサーバで使うべきではないですね。id ソフトウェアの DOOM ネットワークサーバが 666 番ポートを使っているのは地獄に落ちるべきです。まあ Quake においては悪行を悔い改めたようですけど。
ポート番号 1024 ～ 49151 は登録用ポート番号で、この範囲からあなたのポート番号を選ぶのが正しいです。ただし、全世界の人がこの範囲からポート番号を選ぶので、使いたいポート番号を登録するか、少なくとも現在の登録ポート番号のリストのチェックくらいはするのが道理です。とはいえ、全ての人がその人のアプリケーションのポート番号を決めるときに、このリストをチェックしてくれる保証などどこにもない、ということには注意する必要があります。
ポート番号 49152 ～ 65535 は動的ポート番号で、オペレーティングシステムがランダムにポート番号を選ぶときに、この範囲のポート番号が使われます。(例えば FTP プロトコルでは、データ転送フェーズではランダムに決定したポート番号が使用されます。)この範囲からポートを選ぶのは良くない発想です。というのは、あなたのプログラムとOS がポート番号を奪い合う戦いが、いつかはかなりの確率で発生するであろうからです。
多くのOSでは、クライアントプログラムのローカルポート番号として、1024 ～ 5000 の範囲から選びます。ですので、あなたのサーバ用のポート番号は 5000 よりも大きい番号から選んだほうが良いのですが、これは前項のルールほど厳密なルールではありません。
ポート番号 5000 ～ 49151 の「安全な」範囲の中で、IANA が「未登録」としている番号がたくさんあります。この中で、パターン化しているポート番号やすぐ思いつきそうな番号は避けたほうが無難です。誰でも覚えやすい番号を選びがちなので、ポート番号が衝突する可能性が大きくなるからです。例えば、ポート番号 6969、5150、22222 といった番号は悪い選択例です。

また、あなたのプログラムを動作させるマシン上で、別のサーバが既にそのポート番号を使っている場合などがあり得るので、ポート番号を設定で変更可能にしておくことも考えておいたほうが良いです。一つの方法として、Winsock の getservbyname() 関数を使う方法があります: この関数がポート番号を返したらその番号を使い、そうでなければデフォルトのポート番号を使う、というようにします。するとユーザは、このプログラムで使用するポート番号を、SERVICES ファイルを編集することによって変更することができます。SERVICES ファイルは Windows NT/2000 上では %WINSYSDIR%\DRIVERS\ETC に、Win9x マシン上では c:\Windows\ に存在します。

3.6 - UDP って何? どんな制限があるの?

UDP (User Datagram Protocol) は TCP/IP プロトコル群の一部で、TCP に対する別の選択肢となるものです。("TCP/IP" と書いたときには UDP も含まれますが、時には"IP上の TCP"という意味でもあります。ここでの議論においては"UDP/IP" という用語も使います。) Winsock では、socket() の二番目の引数として SOCK_DGRAM を与えると UDP ソケットを使うことができます。

UDP は「信頼性のない」プロトコルです。スタックは、パケットの喪失、重複、到着順序の前後に対して、一切の制御を行いません。UDP パケットはデータが壊れているかのチェックはされますが、データの壊れた UDP パケットは黙って捨てられるだけです。

プロトコルスタックは、UDPデータグラムの大きさがネットワークの MTU より大きいときは、データグラムを分割します。通信相手側のスタックはその分割片から完全なデータグラムを再び組み立ててから受信側のプログラムに渡します。もし分割片の一部が失われたり壊れていたりしたときは、そのデータグラム全体が捨て去られます。このため、巨大なデータグラムを送るのはあまり実用的ではありません。例えば、8K の UDP データグラムは、Ethernet 上に送信されると、6つの塊に分割されます。もしこの6個の分割片のうち一つでも喪失したり壊れたりすると、8K のデータグラム全体が捨てられてしまうのです。

データグラムの喪失は、送信側あるいは受信側のプロトコルスタック内部で発生することもあります。たいていはバッファが足りなくなった場合などです。さらに、同じマシン上で動作する二つの通信プログラムでさえも、 UDPを使っている場合はデータを喪失してしまう可能性があります。(Windows 上では、高負荷の状態において実際にこれが発生します。スタック内のバッファが一杯になるとデータグラムが落とされるからです。) これはつまり、ローカルの IPC(訳注: プロセス間通信) の機能として UDP を利用するのは限度がある、ということです。

これら、いずれの原因で喪失が発生した場合でも、送信側および受信側には何の通知もされません。喪失がプロトコルスタック内部で発生した場合であっても、です。

重複したデータグラムを捨てることはありません。全部受信側に送られます。重複の問題を検出するのはアプリケーション側に任されており、重複したデータグラムをどう扱うかはそのプログラムが決めます。

UDPデータグラムはどんな順序で転送されるかわかりません。二つのデータグラムが別々のルートを経由して転送されて、二番目のデータグラムのルートの方がたまたま早かった場合など、データグラムの到着順序がネットワーク上で逆転することは時々発生します。

3.7 - UDPは何に使えるの?

上で議論してきたのを見ると、UDP は全く使えないように見えます。でしょ? まあ、TCP のような信頼性のあるプロトコルに比べての利点も、いくつかはあります。

UDPの方がよりスリムなプロトコルである: プロトコルヘッダの大きさは TCP では最低 20 バイトでそれ以上になることもあるのに対して、UDP では 8 バイトで固定です。
UDP は輻輳制御もデータの集約転送も行いません。これにより、ACKの遅延や Nagle アルゴリズムによって引き起こされる遅延が発生することがなくなります。(もちろん、これは多くの場面においては欠点にもなり得ます。)
プロトコルスタック中のコードの量は、UDP の部分の方が TCP の部分よりも小さいです。つまり、パケットがネットワークに到着してからアプリケーションに渡される間の遅延(レイテンシ)が小さくなるということです。
ブロードキャストやマルチキャストでは、UDP パケットしか使えません。

これらの特徴により、UDPは、時間的な制約と制御が信頼性よりも重要であるようなアプリケーションに適しています。また、ある種のアプリケーションにおいては、その性質柄、UDPの問題点を許容できるものもあります: ストリーミングビデオのプログラムにおいては、データが喪失しても単に一コマか二コマ落ちるだけのことです。

UDPにも利点はありますが、そのことで UDPの欠点を忘れてしまうことがないように注意してください。非常に多くのアプリケーション作成者が、最初 UDP でプログラムを書き始め、そして後で信頼性を確保する機能を無理矢理追加せざるを得なくなる、ということをやっているのです。UDP を使おうと検討しているときには、最初から TCP を使ったほうが、それを再発明するよりも良いのではないか、ということを自問自答してみてください。気をつけて欲しいことは、Winsock のレイヤでは TCP を完全に再発明することはできない、ということです。経路MTUディスカバリなどのいくつかのTCPの機能は、 OSのネットワークレイヤへの低レベルアクセスを必要とします。それ以外のTCPの機能は UDP上でも複製することができるかも知れませんが、正しく実装するのは難しいことです。TCP/IP とは20年来生き続けてきたものである、ということを忘れないで下さい。TCP/IP のプロトコル群には、その信頼性と性能のチューニングのために並々ならぬ努力が費やされてきているのです。

場合によっては RTP (RFC 1889)のようなものを使えば十分かも知れません。これはマルチキャストのマルチメディアアプリケーションのために設計されたもので、UDPの上に信頼性を持つレイヤを設けるものです。

3.8 - ブロードキャストパケットはどうやって送信するのですか?

UDP プロトコルを用いて、ネットワーク上の全てのワークステーションが受け取ることができるパケットを送信することができます。(TCP はブロードキャストを使用することはできません。)

ブロードキャストパケットを送信するには、まず最初に setsockopt() 関数を使って SO_BROADCAST オプションを有効にしなければなりません。次に、「このLAN上に接続されている全てのワークステーションにパケットを送れ」という意味の "directed broadcast" アドレスを得なくてはなりません。この directed broadcast アドレスを得るには、以下のような C コードを使用します:

                u_long host_addr = inet_addr("172.16.77.88");   // local IP addr
                u_long net_mask = inet_addr("255.255.224.0");   // LAN netmask
                u_long net_addr = host_addr & net_mask;         // 172.16.64.0
                u_long dir_bcast_addr = net_addr | (~net_mask); // 172.16.95.255

潜在的な問題: ブロードキャストは便利なときもありますが、ネットワーク上の全てのマシンに(パケットを受信しようとしていないマシンにおいても)負荷を発生させるということを意識しておいてください。この理由は、プロトコルスタックの中でパケットの受信を拒否することのできる部分は、レイヤが何層か下の部分にあるからです。この結果、多くのルータでは単純なブロードキャストパケットは通過させないようになっていますし、場合によっては隣のネットワークからの directed broadcast も通過させないようになっています。(単純なブロードキャストパケットとは、アドレス 255.255.255.255 に送られたパケットです。) その現実的な結果としては、ブロードキャストが全く動作しないこともあるし、また、たとえ動作はしてもネットワークに不必要な負荷をかけてしまうことがあります。これらの問題を回避するために、代わりにマルチキャストの利用を検討しても良いかもしれません。

3.9 - Winsock はスレッドセーフですか?

Winsock の仕様上は、Winsock の実装がスレッドセーフであることを要求してはいませんが、Winsock のスレッドセーフバージョンを実装することは許されています。

Bob Quinn 氏は、この件について以下のように述べています:

「Winsock は、それがどんな実装であれ、実装した本人がスレッドセーフに作ったのであればスレッドセーフである (たまたま偶然にスレッドセーフになるわけではない)。」
「Microsoft (あるいはその他どのベンダでも)の実装が、スレッドセーフではないということは聞いたことが無い。」
「Winsock アプリケーション開発者が、スレッド間でソケットを共有するマルチスレッドアプリケーションを作った場合、スレッド間の同期処理を行うのはその開発者の責任である。」

Bob氏のいう「同期処理」とは、例えば、二つのスレッドが連続して同じソケットに send() を呼び出すと問題が起こるかもしれない、という意味だと思われます。Winsock の仕様においては、このような状況においてデータがどのように挿入されるかについて、何の保証もありません。また、一方のスレッドがあるソケットに対して closesocket() を呼び出したとき、そのソケットを使っているもう一方のスレッドに対して、このソケットはもう無効であることを何とかして通知しなければならない、ということについても同様の問題があります。

一方のスレッドが send() を呼び出し、別のスレッドが同一のソケットに対して recv() を呼び出すのは安全である、という伝説があります。しかし私はこれを確認したことはありません。より堅固な情報やデモンストレーション用のコード、さらなる伝説などがあれば、教えていただけると幸いです。

複数スレッド間で一つのソケットにアクセスするよりも、一つのスレッドにソケットに対する単一の所有権を与えて、そしてネットワーク I/O 用のキューを用意することを考えたほうが良いかもしれません。このスレッドは I/O キューからのデータを送信し、受信したデータをキューに入れることを行います。そしてその他のスレッドはそのキューに(適宜同期処理を行いながら)アクセスするわけです。

非同期型ソケットの類を使うアプリケーションでは、通常なんらかの I/O キューを既に持っています。ここでの話に特に関係するのは、オーバーラップ I/O あるいは I/O 完了ポートです。これらの I/O 戦略はスレッドと親和性が良いからです。Winsock では、オーバーラップしたブロックをいくつか Winsock に与えると、Winsock はその一つを送り終えてから次のブロックに移動します。これはつまり、オーバーラップしたブロックの連なりがそれぞれ別のスレッドによって追加されたものだとしても、そのブロックの繋がりは崩れない、ということです。また、各スレッドは自分の追加したブロックに対して WSASend() を呼び出すこともできるので、メインループをより簡単にすることができます。

3.10 - もし二つのスレッドが同じソケットに対して `recv()` を呼び出すと、それぞれにおいて同じデータが得られますか?

いいえ。Winsock はスレッド間でデータを複製するようなことはしません。

二つの異なるスレッドから同一のソケットに対して同時に recv() 呼出しを実行してしまうと、大混乱が引き起こされると思ってください。より詳細については、前項の質問を参照して下さい。

3.11 - あるソケットにおいて何かが起こったとき、それを二つのスレッドに通知する方法はありますか?

いいえ。同一のソケットに対して二つのスレッドが WSAAsyncSelect() を呼び出したとすると、最後に WSAAsyncSelect() を呼び出したほうのスレッドだけが、それ以降の通知メッセージを受信することになります。同様に、同一のソケットに対して二つのスレッドが WSAEventSelect() を呼び出した場合は、後から呼び出された方のイベントオブジェクトに対してのみ、ソケットのイベントが発生が通知されます。また、一方のスレッドで WSAAsyncSelect() を呼び出し、もう一方のスレッドで同じソケットに WSAEventSelect() を呼び出すことはできません。これらの関数は一つのソケットにおいて排他的なものだからです。最後に、同一のソケットに対して二つのスレッドが select() を呼び出して、それぞれで同じ通知を受け取れるかどうかを信頼することはできません。一方のスレッドでイベントを発生させたりクリアしたりすると、他方のスレッドが監視しているイベントの状態を変化させてしまうかもしれないからです。

3.12 - インターネットに接続されているかどうかをどうやって検出できますか?

Winsockプログラムにとっては、コンピュータが既にインターネットに接続されているものとして処理をした方が便利なことがあります。多くの場合「インターネットに接続されている」とは、ダイアルアップネットワーク接続がある、という意味になります。こういった接続をチェックしたいときには、このサンプルのコードを参照して下さい。

しかし、これは全ての状況で有効なわけではありません。まず最初の問題は、全てのユーザがモデムを使ってインターネットに接続しているわけではない、ということです。コンピュータはLANにつながっていて、LAN上のどれかのステーションがインターネットへのゲートウェイの役割を果たしている、という場合もよくあります。この場合、システムのネットワーク設定を探し回ってゲートウェイが設定されているかどうかを調べることもできますが、今度はそのゲートウェイが単純にLANをインターネットに接続しているとは限らない、という問題に突き当たります。LANがインターネットへゲートウェイ接続されていたとしても、そのゲートウェイのインターネット接続が切れているかも知れませんし、アクセスを制限するように設定されているかも知れないからです。

他にも、PCにインターネット接続用のモデムがあったとしても 、通常は切断されていて自動ダイアルするように設定されているかも知れない、という問題があります。この場合、モデムが現在接続されていなくとも問題にはなりません。プログラムがとにかくコネクトしようとすれば、モデム接続が行なわれるからです。

この話の教訓は、普通はインターネット接続のチェックなどハナからやらない方が良い、ということです。プログラムを起動することによって何をやろうとしているのか、ユーザは分かっているものだ、と単純に仮定するのです。コネクションを張ろうとして、インターネット接続が無かったためにそれが失敗したら、ユーザにそのことを伝えて、問題の解決をユーザに委ねることができるのです。また、プログラムの接続制御を、ユーザ設定可能にしても良いかも知れません。つまり、ユーザにダイアルアップネットワーク接続をチェックした方が良いかどうかを尋ねて、プログラムがやみくもにコネクションを張ろうとするのが良いかどうかを判断するのです。プログラムが推測するよりも、ユーザの方がユーザ自身のシステムについてよく知っていることの方が多いのです。

3.13 - ローカルのユーザ名を取得するにはどうするのですか?

いくつかの方法があります。最も簡単な方法は、Win32 の GetUserName() 呼出しを使う方法です。[C++ の例]

他の方法として、Microsoft Knowledge Base の記事 Q155698 に示されている方法があります。これはやや複雑で、二つの全く違う方法を説明しています。一つは Windows 9x/Windows 3.1 用で、もう一つは Windows NT 用です。あなたが WIndows 3.1 をサポートする必要があるか、あるいは LAN マネージャのドメイン名を(DNS のドメイン名ではなく)必要としているのでなければ、この記事の方法は避けたほうが良いと思います。

3.14 - Windows 9x のダイアルアップ接続が、必要の無いときでも自動ダイヤルのウィンドウを出してきます。これを止めることはできますか?

ネットワークインタフェースを複数持っている Windows 9x のシステムの中には、明らかに不必要のときでも、ダイアルアップ接続が自動ダイヤルのウィンドウを出してくることがあります。その一例としては、 LAN に接続されていて、かつモデムを経由してもインターネットに接続できるマシンのような場合があります。

ダイアルアップ接続のダイヤルウィンドウが出てくる引き金となる原因として最も多いのは、Winsock プログラムが gethostbyname() を呼び出して DNS の参照を行おうとしたときです。たとえその名前が LAN 上のマシンで、DNS サーバが LAN 上に存在していたとしても、ダイアルアップ接続はまず Internet に接続しようとしてしまうのです。

Win9x マシンをマルチホームにしようとしてDNS 設定をいじってみると、ネットワークのシステムがリモートのDNS とローカルのDNSをサポートするようになんて設計されていない、というのがはっきりわかるでしょう。結局、最適な解決法は、IP アドレスを直接指定して、あなたのプログラムも IP アドレスを認識できるようにして、gethostbyname() を呼び出さないようにすることです。

ダイアルアップ接続のバージョン 1.3 あるいは Winsock 2 では、この問題が修正されている、と聞いたことがありますが、別の報告ではそれでも解決できない、と言っています。

3.15 - 非同期型ソケットは信頼できない、と聞いたことがあります。それって本当ですか?

あなたの書くプログラムが、Winsock 仕様に字義通り正しく従っていれば、非同期型ソケットは信頼することができます。

それでも時々、非同期の通知メッセージが喪失してしまうプログラムの話を聞いたことがあるでしょう。私が知っている限り、これらは全て、文句をつけている人のプログラムのバグか、もしくは Winsock のケチくさい通知ポリシーを誤解しているからです。

FD_WRITE の通知を考えてみましょう。FD_WRITE は、クライアントからのコネクションが通信相手に受理された時と、Winsock が WSAEWOULDBLOCK エラーを返した後に出力バッファに空きができた時にのみ、送信されます。別の言い方をすれば、FD_WRITE は「さっきまで、このソケットからデータを送る準備ができていませんでした。でも今 OK になりましたよ。」というときにだけ送られるのです。これを扱うための最も伝統的な方法は、送りたいデータがあるときは、FD_WRITE を受け取っているかどうかに関わらず、常にデータを送信しようとすることです。そうすると WSAEWOULDBLOCK エラーが返されることがありますが、これは無害ですし、扱うのは簡単です。FD_WRITE のハンドラは、単にキューに入っているデータを全て送信しようとするだけで良く、これを全てのデータを送信し終わるか、別の WSAEWOULDBLOCK が返されるまで繰り返すのです。

Win16 のメッセージキューは、長さは固定でかなり短いです。したがって、少なくとも 16ビットプログラムでは、通知を喪失してしまう可能性があります。メッセージキューが一杯で Winsock が通知を送ることができなかった場合、通知しようとし続けることになっているはずです。しかし経験的には必ずしもそうならないことが示されています。なお、一口に「16ビットの Winsock」と言っても、そのプロトコルスタックには、さまざまなベンダーからそれぞれいくつものバージョンが何年にも渡って出されているものがある、ということを忘れないでください。

私が関わってきた範囲では、ほとんど非同期型ソケットばかりを数年に渡り使ってきましたが、何の問題もありませんでした。私よりも長年、非同期型通知を使ってきた人たちも、これに同意してくれています。もしどうしても通知が喪失されているようだ、と思うのであれば、我々がプロトコルスタック内のバグを見落としているのか、あなたのプログラムにバグがあるのか、どちらであるのかをじっくりと考えてみてください。

3.16 - Nagle アルゴリズムとは何ですか?

Nagle アルゴリズムは、あるコネクションに送ったデータが全て確認(ACK)されるまで、次のデータの送信を待たせる、という方法で TCP の最適化を行うものです。例外としては、ネットワークのフレームを満たすのに十分なデータがキューに入っていれば、Nagle は ACK を待つようなことはしません。 (この例外が無いと、結果として Nagle アルゴリズムは TCP の移動ウィンドウアルゴリズムを無効にしてしまうからです。) Nagle アルゴリズムの全容については RFC 896 を参照して下さい。

さてそれで、君は Nagle アルゴリズムとは何のためのものなの? ってことが聞きたいんだよね。

ネットワークの理想的な状態では、全てのプログラムは全ての send() の呼び出しにおいて、常にフレーム一杯のデータを送っています。これにより、パケット中の有効なデータの割合は最大になります。

TCP の基本ヘッダと IPv4 ヘッダはそれぞれ 20 バイトです。したがって、プロトコルオーバーヘッドの最悪値は 40/41 つまり 98% です。Ethernet の一フレームに入るデータ量は最大 1500 バイトなので、プロトコルオーバーヘッドの最良値は 40/1500 つまり 3% 以下になります。

Nagle アルゴリズムは、データが通信相手から ACK されるまでプロトコルスタックを待たせるので、その間ローカルのプログラムはさらに send() を呼び出すことができます。TCP はストリーム型プロトコルであるので、これら複数の send() 呼出しのデータを一つの TCP パケットに集約させることができ、有効データの割合を増加させることができるわけです。

単純な telnet のプログラムを考えてみましょう。telnet 通信の大部分は、一個の文字を送って、その文字が通信相手からエコーバックされてくるのを受信する、という内容です。Nagle アルゴリズムが無ければ、これは TCP の最悪値: 数十バイトのプロトコルオーバーヘッドに包まれた一バイトのユーザデータ、という状況を引き起こします。 Nagle アルゴリズムを有効にすると、TCPスタックは、前に送った文字が確認(ACK)されるまで、telnet の一文字を送り出すことはしません。そのときまでには、ユーザは他の文字を何文字かタイプしているでしょうから、相対的にプロトコルオーバーヘッドは減少します。

この単純な効率化の仕掛けは、TCPプロトコル群の他の機能とも関係します。

多くのスタックでは遅延 ACK アルゴリズムを実装しています: これは特定の状況において、相手側のスタックからの ACK の返事を遅らせるというもので、こちら側で一個のパケット中にもう少しデータを "Nagle" する時間ができます。
Nagle アルゴリズムは、早いネットワークよりも遅いネットワークの方が、パケット中の有効データの割合を向上させる傾向を持っています。なぜなら ACK が帰ってくるまでの時間が長いからです。
TCP では、ACK パケットにデータを持たせることを許しています。もしこちら側のスタックが ACK パケットを送信する必要があると判断した時、Nagle アルゴリズムが出力バッファにデータを溜めていたとすると、その溜められていたデータは ACK パケットと一緒に送出されます。

Nagle アルゴリズムは Winsock においてはデフォルトで有効になっていますが、setsockopt() の TCP_NODELAY オプションによって、ソケット単位で無効にすることができます。このオプションは、ごく一部の場面を除いては、無効にするべきではありません。

Nagle アルゴリズムにあまり頼りすぎないように注意してください。 send() はカーネル関数であるので、 send() の呼出しは通常の関数呼出しよりも重い処理なのです。アプリケーション側においても、自分でデータをできる限り集約して、send() の呼出し回数を減らすようにするべきです。

3.17 - Nagle アルゴリズムをオフにすべきなのはどんなときでしょう?

一般論としては…ほとんど無いですよ。

未熟な Winsock 屋さんは、TCP データストリームでパケット単位の処理のようなことをさせようとして、Nagle アルゴリズムを無効にしようとしたがります。つまり、例えば 40バイトと 60バイトの二つのパケットを送信して、受信側においても 40バイトのパケットと、次に 60バイトのパケットを別々に受信させることを可能にしたい、というわけです。(Nagle アルゴリズムが有効になっていると、TCP がこれら二つのパケットを一個の100バイトのパケットに集約してしまうことがあるでしょう。) 残念ながら、この手法は全く無駄です。理由を以下に示します:

たとえ送信側がこれらのパケットを別々に管理したとしても、受信側の TCP/IP スタックが受信したパケットを一個のパケットに集約してしまうかもしれません。これは受信側が処理できる早さよりも送信側の処理の方が早い場合にはいつでも起こりえます。
Winsock の LSP(Layered Service Providers) が、ストリームデータを分割したり集約したりすることがありえます。特に LSP が転送時にデータを修正するときに起こりえます。
クライアント側のプログラムで Nagle アルゴリズムを無効にしても、サーバ側が送ってくるパケットには影響がありません。逆もまた成り立ちます。
ルータやその他のネットワーク上の中継系がパケットを分割するかも知れませんし、ストリームプロトコル上で「正しく」再構成される保証はありません。
スタック中で利用可能なバッファサイズよりも大きなパケットが到着したときに、バッファに入りきる分だけをキューに入れ、残りは捨ててしまう、というように分割されることがあります。(通信相手はその残りのデータを後で再送することになります。)
たとえ recv() 呼出し時に十分なバッファを Winsock に与えたとしても、ソケット上のキューに入っているデータを全て返却するとは限りません。ソケット上のキューに入っているデータを全て取得するには、呼出しを何度か行う必要があるかもしれないのです。

これらの問題点を除いても、Nagle アルゴリズムを無効にすると、ほぼ間違いなくプログラムの性能が低下します。このアルゴリズムを無効にしても良いのは、パケットのタイミング等、必要とされる要件が性能よりも重要である場合のみです。

リアルタイムなユーザの入力を扱うプログラムでは、できる限りきびきびとした応答を得るために、ネットワークの帯域と引き換えに Nagle アルゴリズムを無効にすることがあります。例として、X Window のサーバと、複数プレイヤーのいるネットワークゲームの二つがあります。これらの例では、ネットワーク帯域の節約よりも、パケットの遅延をできる限り小さくすることの方がより重要なのです。

このトピックについてはさらに、ザ・間違いリストと、論説記事TCP を有効に使うためにも参照して下さい。

3.18 - TCP の移動ウィンドウとは何ですか?

TCPを単純に実装すると、全てのパケットに対して、即時に ACK パケットによる確認を行うことになります。受信側から ACK が届くまでは、送信側は次のパケットを送信しません(あくまで単純な実装においては、ね)。ACK がある一定時間内に返ってこなければ、送信側のスタックはパケットを再送信します。

この実装においては、そういった待ち時間のせいでネットワークの性能が全く上がらない、という問題があります。この場合のパケット間の最小間隔は、少なくともネットワーク上を往復する時間の二倍の時間、すなわちパケットを送信する時間と受信側が ACK を送り返す時間になります。さらに両端での処理時間、一時的なハードウェアにおけるエラー (例えば Ethernet のコリジョンなど)、再送、ルーティングにおける遅延、その他想像もつかない理由、などなどが加わることにより、データを送信するための時間よりも、結局 ACK を待っている時間の方が長くなってしまうのです。つまり、一個のソケットでネットワークのパイプを効率よく埋め尽くすことはできない、という問題が起こってしまうわけです。

TCP ウィンドウはこの問題を解決するためのものです。TCPウィンドウは、ある時点においていくつかの「飛行中の」未確認パケットが存在することを許します。TCPコネクションが確立されるとき、お互いにコネクションに割り当てられたバッファ領域がどれだけあるかを教えあいます。これが最大ウィンドウサイズとなります。ウィンドウが埋まっていくに合わせて、受信側は残りのウィンドウサイズを ACK パケットによって送信側に送り返します。これによって、受信側のウィンドウがいつ溢れてデータが送信できなくなってしまうか、ということを送信側に伝えます。送信側は、受信側のウィンドウが満杯になった、ということがわかると、ウィンドウに空きができたよ、という意味の ACK を受け取るまでデータの送信を停止します。

え?「どうして移動ウィンドウって呼ばれるのか」ですか? 長ーいバイト列のTCPデータストリームがあると思ってください。送信側から受信側のバッファを見ると、固定サイズの「窓」がバイト列に沿って移動するように見えるので移動ウィンドウなのです。ウィンドウの一方の端は、受信側が読み込んだ最後のバイトと次に読み込もうとしてるバイトの間に位置します。もう一方の端は、受信側入力バッファの最後のバイトと送信側出力バッファから次に送り出されようとしてるバイトの間になります。受信側がバッファからデータを読み出すのにしたがって、ウィンドウはストリームを移動していきます。ウィンドウが送信側のバッファが移動してくると、送信側はそのウィンドウの空きを埋めるようにデータを送信していくのです。

次の二つの質問でも関連する議論があります。

3.19 - お馬鹿なウィンドウ症候群(silly window syndrome)とは何ですか?

「お馬鹿なウィンドウ症候群」は、送信側が、受信者が扱える限度を超えた速さでデータを送信し、さらに受信者が recv() を非常に小さいバッファサイズで呼び出したときに発生します。

高速な送信者は、受信者の TCP ウィンドウをあっという間に埋め尽くしてしまいます。そして受信者が N バイト読んだとします。ここで N はネットワークフレームサイズに対して比較的小さい数字とします。単純なスタックでは、すぐに送信者に ACK を送って TCP ウィンドウに N バイトの空きがあることを知らせるでしょう。これにより送信者は N バイトのデータを送信することになりますが、N はフレームサイズよりも小さい値であるため、フレームが一杯使われている状態に比べてプロトコルオーバヘッドは比較的大きくなってしまいます。そして受信側の処理が遅いので(かつ、なんと recv() を小さなバッファサイズでしか読み出さないくらいお馬鹿なので)、TCP ウィンドウの大きさは小さいままで留まり、結果としてアプリケーションデータに対するプロトコルオーバヘッドが大きくなり、性能に影響を及ぼすのです。

この問題に対する解決法が、遅延 ACK アルゴリズムというものです。これはウィンドウを通知する ACK をちょっとだけ遅らせ、処理の遅い受信者にもう少し溜まっているデータを受け取らせることが期待できます。この結果としてより大きなウィンドウサイズの通知が行われるので、処理の早い送信者は一個のフレームの中により多くのデータを詰め込むことができるのです。

なお、遅延ACKの解決法によっても、あなたのプログラムで小さなバッファでrecv()しても良くなるわけではありません。カーネル空間とユーザ空間のコンテキスト切替の数を減らすためにも、やはり一度の呼び出しで、できる限り多くのデータを読み込むべきなのです。

3.20 - 遅延 ACK アルゴリズムとは何ですか?

TCPを単純に実装すると、受信したパケットに対して ACK パケットはすぐに返されます。(ACK は TCP が保証している信頼性を提供するためのものです。)

現在のスタックでは、ACK は少しの時間(概して最大 200ms 程度)遅らせるようになっています。これには三つの理由があります。a) 「お馬鹿なウィンドウ症候群」を避ける。; b) ACK を返そうとしたときに返送するデータフレームの用意ができていれば、ACK をその返送フレームに相乗りさせることができる。; c) 遅らせた期間内にいくつかフレームが届いたら、その分の ACK を一回で返すことができる。

プロトコルスタックは、最大2フレーム分のデータまで遅らせることが許されています。

3.21 - 私のサーバをどのプラットフォーム上で運用させるべきでしょうか?

もしあなたが Windows をサーバとして使用すると決定したとすると、高い負荷で運用するための現実の選択肢としては Windows NT サーバしかありません(なお、ここでの話題の範囲では、Windows 2000 と Windows NT 系に違いはありません)。

Windows NT ワークステーションと NT サーバは、まったく同一のカーネルが使用されていることが暴露されています。しかし NT ワークステーションのカーネルは、NT サーバの実行時の動作に関連して、自分自身の一部を起動時に使えなくしてしまうのです。

最も大きな違いは、NTワークステーションでは、接続バックログが 5スロットに制限されているということです。これはつまり、ネットワークスタック内に接続バックログが5つ以上たまらないように、プログラムがさっさと accept() してあげなくてはならないということです。キューが一杯になっている間は、スタックは新しい接続を拒否してしまいます。きちんと作ってあるサーバであればこれは普通問題にはなりませんが、一斉に攻撃(SYN flood とか)されるとキューが一杯になってしまい、正当なユーザへのサービスが妨害されてしまうということは発生します。NT サーバ(動的バックログ機能が有効になっているとき)は、 SYN 攻撃に十分耐えられるように、バックログキューの長さは実質的に無限になっています。

これら両者の違いについて、Microsoft が皆さんに聞いてほしいと思っている点の一つは、ライセンスです。NT ワークステーション上では、同時に 10 接続より多く accept するサーバを実行することはできません。現時点では、カーネルがこれを強制的に制限することはしていませんが、NT 4.0 ベータ期間中は制限されていました。(世間からの抗議によって Microsoft がカーネルから制限を外したのです。) Microsoft は今後の製品において、これを強制的に制限しようとするかもしれません。SQL サーバなどの他の製品においては、Microsoft はこのような制限を行う、ということが知られているのです。

その他のサーバの選択肢 Windows 95/98/ME は致命的なほどの制限があります。たとえば NT ワークステーションと同様に 5 個までのバックログ制限があります。しかしもっと重要なことは、これらのカーネルは明らかに性能が劣っているのです。これを客観的に証明するのは簡単なことです。FTP サーバかウェブサーバを設定して、接続受付の速度やデータ転送速度を見てみればよいのです。 Win9x のカーネル上で動作しているサーバは、Windows NT 上で動作している同じプログラムに比べると、故意に不良品にしているかと思われるほどです。

Win9x をサーバとすることは他にも問題があります。もっとも明らかなものはその不安定性でしょう。また Win9x でサポートされているオーバーラップ I/O はカーネル外でエミュレーションされているものですし、I/O 完了ポートの機能は全くありません。これらの機能は、高負荷の状況においてネットワーク帯域を最大にするために必須の機能なのです。もっと証拠が必要であるというのであれば、Win9x は複数のネットワークカードを入れるといくつか問題が出てくるということも挙げられます。これは(ATM やギガビット Ethernet や FDDI といったカードを入れられないとき)安いネットワーク技術を使ってスループットを上げるためによく使われるテクニックです。

<< Winsock 初心者のための情報	Winsock 上級者向けの議論 >>
Last modified: $Id: intermediate.html,v 1.6 2002/11/09 20:40:29 ksk Exp $	Go to the original FAQ page

< Go to the main FAQ page

<< Go to the Home Page