Winsock Programmer's FAQ: Articles: The Lame List

Winsock Programmer's FAQ
第7章: 論説記事: ザ・間違いリスト

ザ・間違いリスト

はじめに

「ザ・間違いリスト」(The Lame List)は、非常に有用なものであるので、ここに再掲することにします。この文章は、Windows Sockets 2 アプリケーションプログラミングインターフェースバージョン 2.2.2 の付録C から直接カット&ペーストしたものです。このリストはもともと、Winsock スタックベンダ達が、お馬鹿なアプリケーションの数々(名前を出すことは控えておきます)について文句を並べたものが始まりです。にも関わらずこれらの内容は非常に有用なものです。というのは、新米の Winsock 屋さんは、やはり同じお馬鹿な間違いをしでかしてしまうからです。このリストに載っている内容を避けるようにすることが、あなたを Winsock の超プロに向かう長い道へと導くのです。

このリストのもともとのはしがき:

このリストを始めた功績は Microsoft の Keith Moore 氏によるものですが、他の面々達からも多くの貢献を頂きました。 sockets.com の Bob Quinn 氏は、これらの項目がなぜダメダメなのか、またどう対処すべきか、という説明について労力を割いていただいた中心人物です。このリストはあくまで、印刷に出したときのようなスナップショットです(ぎりぎり直前に詰め込んだ項目もいくつかあります)。

このバージョンのリストは、オリジナルのものとは若干違いがあります。句読点やちょっとした言い回しなどを修正してあります。そしてもちろん、全部を HTML フォーマットできれいにしてあります。

ウィンドウズソケット・間違いリスト
(または「今週の大馬鹿大賞」)

ウィンドウズソケットベンダコミュニティの提供でお送りします

非ブロック型ソケットに対して connect() を呼び出してWSAEWOULDBLOCK が返ってきた時、その直後に recv() を呼び出すと、必ずコネクションが確立する前の WSAEWOULDBLOCK が返されると期待すること。 間違い。
理由: これは、アプリケーションが recv() を呼び出すまでの間にコネクションが確立することはないだろう、という仮定に基づいています。それは間違った仮定です。
代案: そんなことはやらないこと。非ブロック型ソケットを使っているアプリケーションは WSAEWOULDBLOCK エラー値を処理しなければなりませんが、このエラーが絶対発生するだろうと当てにしてはいけません。
select()の引数に、三つの空fd_setと正しいTIMEOUT構造体を与えて呼び出し、短時間のディレイ関数として使うこと。許しがたい間違い。
理由: select()関数はあくまでネットワーク関数であり、一般的な目的のタイマ関数ではありません。
代案: 正当なシステムタイマサービスを使用すること。
非ブロックソケットにおいて、コネクションが確立されたかどうかを判断するために connect() でポーリングすること。 新米の間違い。
理由: Winsock 1.1 仕様では、非ブロックコネクションが確立途中のときの connect() のエラーを規定していません。つまり返却されるエラー値は異なることがありえます。
代案: コネクション完了の非同期通知を使うのが推奨できる方法です。同期操作モードを行いたいアプリケーションは select() 関数が使えます(が、項番 23 も参照して下さい)。
代案じゃない案: 非ブロックソケットをブロックモードに変更して、 send() や recv() でブロックするのは、 connect() でポーリングするよりもさらにもっとダメダメです。
ソケットハンドル値は必ず 16 以下だと仮定すること。恐ろしく間違いの泥沼。
理由: ソケットハンドル値として取りうることのない値は、 winsock.h で定義されている INVALID_SOCKET だけです。その他の SOCKET 型の取りうる値は全て正しい獲物であり、アプリケーションはこれを取り扱わなくてはなりません。いずれにせよ、ソケットハンドルの値は隠蔽されるべきものであり、アプリケーションはいかなる理由があっても、特定の値に依存してはいけません。
代案: ソケットハンドルの値は、0 も含めて全ての値を取りうるものとして扱う。また、socket() や WSASocket() の呼出しごとに違ったソケットハンドル値が返ってくることを期待しないこと。ソケットハンドルは、Winsock の実装によっては再利用されることが有り得ます。
Win 16 の非プリエンプティブ環境において、 select() をタイムアウト 0 でポーリングすること。 吐き気がする間違い。
理由: 0以外のタイムアウトであれば、select() はブロックフック関数を呼び出すので、イベントを受け付けるアプリケーションは、16ビットWindows環境上の他のプロセスに実行を移します。しかし、タイムアウトが 0 であると、アプリケーションは他プロセスに実行を譲ることはせず、ネットワーク操作さえも発生しないかもしれません (つまり無限ループになってしまう)。
代案: 0 以外の小さな値のタイムアウトを使う。もっと良い方法は、 select() の代わりに非同期通知を使う。
ソケットを非ブロックにするためだけに、 WSAAsyncSelect() を 0 イベントマスクで呼び出す。 間違い! 間違い! 間違い! 間違い!
理由: WSAAsyncSelect() は、ネットワークイベント操作をアプリケーションに非同期に通知させるように登録するために設計されたものです。Winsock 1.1 では 0 イベントマスクに対するエラーは規定していませんが、不正な入力引数として扱われるかもしれませんし (つまりWSAEINVALを返却して失敗する)、要求が黙って無視されてしまうだけかもしれません。
代案: 非同期イベント通知を登録せずに、 ioctlsocket(FIONBIO) を使ってソケットを非ブロックにする。これは正にそのためのものです。
Telnet アプリケーションで、 SO_OOBINLINE も有効にせず、OOB データを読み出すこともしない。暴力的な間違い。
理由: Telnet サーバが緊急データ(OOBデータ)を生成することは珍しいことではありません。Telnet クライアントが Telnet BREAK コマンドやプロセス割り込みのコマンドを送るようなときです。このときサーバは、 TCP 緊急通知と Telnet DATA MARK コマンドを組み合わせて、「同期」をとります。もし telnet クライアントが緊急データを読み出さないと、通常のデータもそれ以上読み込まれなくなってしまいます。ずっと、絶対、永遠に。
代案: いかなる telnet クライアントも、OOB データの読み込み、または検出ができなくてはなりません。この方法として、 setsockopt() SO_OOBINLINE を呼び出してインライン OOB データを有効にするか、WSAAsyncSelect() (あるいは WSAEventSelect()) においてFD_OOB を使うか、select() の呼出しでexcept_fds を使うかのいずれかの方法で OOB データの到着を検出し、それに応じて recv()/WSARecv() にMSG_OOB を与えて呼び出します。
不正なソケットハンドル値が 0 であると仮定すること。手に負えないほどの間違い。
理由と代案: 項番 4 を参照のこと。
ブロッキングAPI の処理中にユーザがメインウィンドウを閉じた場合に、きちんとシャットダウン処理を行わないアプリケーション。 完璧に間違い。
理由: Winsock アプリケーションが、ソケットを close しないで WSACleanup() を呼び出した場合、Winsock の実装によっては、アプリケーションで使用されたリソースが正しく返却されないことがありえます。リソース漏れは結果として、他の全ての Winsock アプリケーションから奪い合いとなるリソース不足(すなわち、ネットワークシステムの異常)が引き起こされます。
代案: 16ビット Winsock 1.1 アプリケーションにおいて、ブロッキングAPI が処理中のときの正しい中断方法は以下のようになります。
1. WSACancelBlockingCall() を呼び出す。
2. 処理中の関数が帰ってくるまで待つ。もし処理が完了する前にキャンセルが発生したのであれば、その処理中の関数は WSAEINTR エラーを返します。しかし、キャンセル時の競合状態によっては処理成功が返るので、アプリケーションは成功の場合にも対応しなければなりません。
3. 処理中のソケットもその他のソケットも全て閉じる。注: 接続済みのストリームソケットを正しく閉じるには、以下が必要になります。
  1. shutdown() を how の引数を 1 にして呼び出す。
  2. recv() が 0 もしくは何らかのエラーを返すまでループする。
  3. closesocket() を呼び出す。
  4. WSACleanup() を呼び出す。
ここで述べた手順は、Winsock 2 アプリケーションでは関係ありません。なぜなら、Winsock 2 では本当にブロックしてしまうので、同じスレッドから WSACancelBlockingCall() を呼び出すことは不可能だからです(このため、WSACancelBlockingCall() 関数は Winsock 2 では非推奨となりました)。ただし、上記の手順 3 の、ソケットをきれいにシャットダウンする方法は今でも有効です。
帯域外データ。激しく間違い。
理由: TCP の帯域外(OOB: Out of Band)データは信頼性がありません。この説明で不十分であればこうです。実装によってはプロトコルレベル (緊急ポインタオフセットに関して)において互換性のない違いが存在します。バークレー(BSD) Unix は RFC 793 を字義どおりに実装しており、その他多くのものは修正版の RFC 1122 を実装しています(ある種のバージョンでは、MACフレームの開始位置をオフセットの開始位置として使うことで複数バイト数の OOB データを扱うことができるものもあります)。もし二つの TCP ホストが違った OOB のバージョンを使っているとすると、これらのホスト間でお互いに OOB データを送信することはできないのです。
代案: 理想としては、緊急データ用に別のソケットを使うことですが、現実にはそういう逃げを打てないこともあります。プロトコルによっては OOB は必須であるので(項番 7 参照)、その場合には依存性を極力最小化するか、もしくはユーザからの問い合わせに答えられるようにテクニカルサポートのスタッフを増員するしかないでしょう。
hostent 構造体の IP アドレスに対して strlen() を呼び出して、長さを 4 バイトに切り詰める。そして malloc() のヒープヘッダの一部を上書きする。長年間違いを観測してきた私にとっても、ここまで大馬鹿な間違いはめったに見られない。
理由: 理由なんて書く必要もないよねえ?
代案: 代案はただ一つ、脳みそを入れ替えるしかない、というのは明白です。
メッセージが全部到着したかどうかを判断するために、recv(MSG_PEEK) でポーリングすること。間違いの海でのたうちまわる。
理由: ストリームソケット(TCP)はメッセージ境界を保存しません(項番 20 参照)。アプリケーションが、メッセージが全部到着するのを待つために recv(MSG_PEEK) や ioctlsocket(FIONREAD) を使うと、いつまでたっても成功しないこともありえます。この理由の一つは、サービス提供側の内部でバッファリングされるかもしれないということがあります。このとき「メッセージ」のバイト列がシステムバッファの境界を跨っている場合、 Winsock は残りのバッファ側に入っているバイト数を数えないことがあるからです。
代案: peek 読み込みは使わない。常に自分のアプリケーションのバッファにデータを読み込んで、そこで必要なデータが来ているかどうかを調べるようにする。
実際のバッファサイズ以上のデータを受け取ることがないとわかっている場合、実際のバッファサイズよりも大きな長さをバッファサイズとして与える。例外なく間違い。
理由: Winsock の実装において、メモリ保護違反を避けるために、実際にバッファを使う前にそこに読み書きができるかどうかをチェックすることがよくあります。与えられたバッファサイズが実際のバッファサイズよりも大きい場合、このチェックに失敗するので、関数呼出しは WSAEFAULT を返して失敗してしまうでしょう。
代案: 常に正しいバッファサイズを与えるようにする。
一連の Winsock 処理を実行するたびに毎回 WSAStartup() と WSACleanup() を呼び出す。間違いの包囲網を突破してる。
理由: WSAStartup() と WSACleanup() の呼出しがそれぞれ対応している限りは、これは不正なことではありません。しかし必要以上の処理を行っていることになります。
代案: DLL、カスタムコントロール、クラスライブラリでは、ユニークなタスクハンドルやプロセスIDを基にして、呼出し元クライアントを登録することが可能です。これによって重複が起こらないように自動登録を行うことができます。プロセスが最後のソケットを閉じると、自動登録抹消を発生させることもできます。32ビット環境でのプロセス通知機構を使っているのであれば、これはずっと簡単になります。
API エラーを無視する。光り輝く間違い。
理由: エラー値はあなたのお友達なんですよ! 関数が失敗したとき、 WSAGetLastError() で返却されるか、または非同期メッセージ中に含まれるエラー値は、それがなぜ失敗したかを教えてくれます。失敗した関数やソケットの状態に応じて、何が、どうして起こったか、そして次にどうするべきかを推測することができるのです。
代案: エラー値をチェックし、それに備えてアプリケーションを書き、必要なときにはそれを優雅に処理する。重大なエラーが起こったときは、以下の内容を示すようなエラーメッセージを表示する。
- 失敗した関数名
- Winsock エラー番号、あるいはマクロ名
- エラーメッセージの意味についての簡単な説明
- 可能であれば、改善する方法についての提案
非同期通知メッセージの FD_READに対応して recv(MSG_PEEK) を呼び出す。大いに間違い。
理由: 無駄無駄ァ。
代案: FD_READ メッセージに対しては、普通の recv() 呼出しを行う。もし WSAEWOULDBLOCK が返ってきたとしても、このエラーを無視するのは簡単ですし、また処理中のデータがまだあるので、後でもう一度 FD_READ を受け取ることが保証されています。
単に FALSE を返す、空のブロッキングフックをインストールする。終わり亡き砂漠でのたうちまわる間違い。
理由: ブロッキングフック関数の一番の目的は、ブロッキング処理途中のアプリケーションから処理を譲り渡すための機構を提供することでした。ブロッキングフック関数から FALSE を返すということは、この目的を無かったことにしてしまい、16ビット Windows の非プリエンプティブ環境において、マルチタスクを行わないようにする、ということです。これは、Winsock 実装によっては、処理中のネットワーク操作が完了できなくなるものもあるのです。
代案: 通常このハックは、再入可能メッセージを避けようとしてやってしまうことです。これを行うには、アクティブウインドウをサブクラス化する、といったもっと良い方法があります。しかし再入可能メッセージを防ぐ、というのは、実のところ簡単な問題ではありません。
なお念のためですが、Winsock 2 アプリケーションにおいてはこれは問題にはなりません。なぜなら、ブロッキングフックはもはや過去の遺物だからです(いい厄介払い)!
クライアントアプリケーションにおいて特定ポートに bind する。自分の首を締める間違い。
理由: 定義上、クライアントアプリケーションは自分の方からネットワーク通信を開始します。対照的に、受動的に通信を待つのがサーバアプリケーションです。サーバは、そのサービスを必要としているクライアントに知られている、特定のポートに bind() しなければなりません。しかし、クライアントは、サーバと通信するために、特定のポートのソケットに bind() する必要はありません。
これはごく僅かのアプリケーションプロトコルを除いて、全く不必要であるばかりでなく、クライアントが特定のポート番号に bind() するのは危険でさえあります。すでに同じポート番号を使っている他のソケットと衝突してしまい、 bind() 呼出しが WSAEADDRINUSE エラーで失敗する危険があるのです。
代案: 単純に、ローカルのポート番号は connect() (ストリーム型ソケットおよびデータグラム型ソケット)、または sendto() (データグラムソケット) 呼出し時に、 Winsock 実装に割り当ててもらう。
Nagle に異議を唱えるアプリケーション。 巨大な深い割れ目の縁をふらふら歩くような間違い。
理由: Nagle アルゴリズムは小さなネットワークトラフィックを減少させるものです。簡単に言うとこのアルゴリズムは、
- 送信中の TCP セグメントの到達確認が全て行われた。または
- 送信待ちのデータが TCP セグメント一杯になった
のいずれかになるまで、 TCP セグメントの送信を行わないようにする、というアルゴリズムです。「Nagle に異議を唱えるアプリケーション」とは、時間の制約が厳しく継続して送信しなければならないようなデータがあり、上記の条件が満たされるまで待つことはできないようなアプリケーションのことをいいます。このようなものは結果としてネットワークトラフィックを無駄遣いしてしまいます。
代案: 通信相手の TCP ホストから、データの反応がすぐに返ってくることに依存するようなアプリケーションを書かないこと。
ストリームソケットで、メッセージフレームの区切りが保持されると仮定すること。まさか、そんな、とても信じられないような間違い。
理由: ストリームソケット(TCP)は、どうしてストリームソケットと呼ばれるかというと、えーと、それはデータストリームを提供するからです(ああ、もう!)。そういうわけだから、アプリケーションが依存することのできるメッセージの長さは、最大でも一バイトの長さなのです。それ以上でも以下でもありません。つまり、send() または recv() の呼出しを行ったとき、Winsock 実装は指定されたバッファ長よりも少ないバイト数しか転送しないということは、いつでもありえるのです。
代案: ブロック型ソケット、非ブロック型ソケットのどちらを使っているかに関わらず、send() または recv() の成功時に、その返却値と期待している値を比較するべきです。もし期待している値よりも小さければ、バッファ長やポインタの位置を調整して、次の関数呼出しに備える必要があるでしょう(もし非同期操作モードを使っているのであれば、これは非同期に行われるかもしれません)。
WEPの中から WSACleanup() を呼び出す 16 ビット DLL。想像も及ばぬ間違い。
理由: そもそも WEP() が間違い。ゆえに WEP() に依存するものも間違い。真面目な話、16ビット Windows は、WEP() が必ず呼び出されるとは保証していませんでした。そして、Windows サブシステムは、WEP() 中のいかなる処理も危機にさらされるような危なっかしい状態に、しょっちゅう陥るのです。
代案: WEP() に関わらぬこと。
一バイトずつ send() または recv() する。嫌になっちゃうほど間違い。
理由: Nagle を無効にして一バイトずつ送信すると、オーバーヘッド対データ比は、最大 40:1 にまでなります。帯域をどれくらい無駄にするかわかるかい? 君ならわかってくれると思うけど。
一バイトごとの受信に関しては、ギネス・スタウトビールを点滴の注射針で飲もうとしている、そのときの労力と非効率性を考えてみて欲しい。それがまさに、データを一バイトずつ「飲んでいる」ときにアプリケーションが感じることなのです。
代案: Postel 氏が RFC 793 で述べた、以下の人生訓を尊重して欲しい。「自分のやることは保守的に、他人のすることには寛大に。」言い方を替えれば、送信の量はほどよく、受信は可能な限りたくさん、ということです。
select()。自虐的な間違い。.
理由: select() を使うときに必要なステップを考えてみてください。まずマクロを使って三つの fd_set をクリアし、それぞれのソケットに対して適切な fd_set をセットし、そしてタイマーを設定し、そして select() を呼び出す、という手順が必要です。
select()から戻ると何かの処理が終わったソケットの数が返されるので、その次に全ての fd_set を見て回って、全てのソケットの中からマクロを使ってイベントの発生したソケットを見つけ出す必要があり、そしてそのイベントが何であるかは、それまでのソケットの状態から推測するしかないという程度のことしかわからないのです。
代案: 非同期操作モードを使う(WSAAsyncSelect() や WSAEventSelect() など)。
inet_addr() を呼ぶ前に gethostbyname() を呼び出すアプリケーション。あまりの無駄さ加減に言葉も出ないほどの間違い。
理由: 時にユーザは、ホスト名ではなくネットワークアドレスを使いたくなるときがあります。Winsock 1.1 仕様では、IPアドレスを標準的な ASCII ドット表記を与えた場合の gethostbyname() の動作については何も定めていません。それを行った場合、処理が成功して (不必要な)逆引きを行うかもしれないし、処理に失敗するかもしれません。
代案: ユーザから入力された通信相手先ホスト名であるかも知れないし、あるいはドット表記のIPアドレスかもしれないに対しては、まず最初に inet_addr() を呼び出して IP アドレスかどうかをチェックして、もしこれが失敗したら gethostbyname() を呼び出して、名前解決を試みるようにするべきです。
さらに、アプリケーションによっては、入力された文字列がブロードキャストアドレス "255.255.255.255" であるかどうかを個別にチェックした方がよいかもしれません。というのは、このブロードキャストアドレスをinet_addr() に与えたときの返り値が SOCKET_ERROR と同じ値だからです。
ブロッキングフックをインストールする Win32 アプリケーション。 激しく間違い。
理由: ブロッキングフック関数は、処理を他のアプリケーションに譲り渡す(項番 17 参照)ということを除いて、本来一つのタスク内でのブロッキング処理の途中において、平行して他の処理が行えるようにするために用意されたものです。しかし Win32 においては、スレッドというものがあるのです。
代案: スレッドを使う。
ソケットストリーム上で、「メッセージ」が全部到着するまで ioctlsocket(FIONREAD) でポーリングする。この世のものとは思えぬ間違い。
理由と代案: 項番 12 を参照のこと。
どんな長さの UDP データグラムでも送信することができると思い込む。犯罪的に間違い。
理由: さまざまな種類のネットワークには全て、最大転送単位(MTU)という制限があります。その結果断片化(フラグメンテーション)が発生し、データグラムが壊れてしまう可能性が増加してしまいます(断片が増えると、その分喪失や転送誤りが発生する)。さらには、受信者側の TCP/IP サービス提供層では、断片化された巨大なデータグラムを再構成する能力があるとは限らないのです。
代案: 最大データグラムサイズを SO_MAX_MSG_SIZE ソケットオプションを使ってチェックし、それ以上の大きさを送信しないようにする。さらにもっと余裕をとればなお良いです。経験則では最大 8K 程度までが良いです。
UDP転送に信頼性があると思い込むこと(特にマルチキャスト転送のとき)。泥沼にはまる間違い。
理由: UDP には信頼性を確保する機構はありません(だからこそ TCP があるのです)。
代案: TCP を使って、自分で独自にメッセージ境界を判断する。
ベンダ依存の拡張を必要とし、それ無しでは実行できない(ひどいときにはロードさえできない)アプリケーション。思わず言葉を失ってしまうほどのどん底の間違い。
理由: もし理由を自分で思いつけないというのなら、さっさとキーボードを捨てて足を洗ったほうが良いです。
代案: 拡張機能が使えないときには、基本機能だけを使った代替方法等を用意すること。
UDPデータグラムが喪失したとき、送信者、受信者、途中のルータのいずれかからエラーが通知されると期待すること。割れ目や亀裂からじわじわと浸透してくる間違い。
理由: UDP に信頼性はありません。TCP/IP スタックは、データグラムを捨ててしまっても、それをあなたに教えてくれる義務はないのです (送信者あるいは受信者で十分なバッファサイズが無かった場合や、受信者側で巨大なデータグラムの断片を再構成できなかった場合などに、データグラムを捨ててしまうことがあります)。
代案: データグラムは喪失してしまうことを想定し、それに対処する。もし必要であれば、自分のアプリケーションプロトコルで独自に信頼性を確保する実装を行う(あるいは、もし可能なら、TCP を使う)。

この文章の著作権は、「ザ・間違いリスト」の各項目の著者に帰属します。これには、この文章の最初の前書きで触れた方々も含みますが、この方々だけに限定するものでもありません。

<< TCP を有効に使うために	TCP/IP のデバッグ >>
Last modified: $Id: lame-list.html,v 1.6 2002/11/09 20:40:33 ksk Exp $	Go to the original FAQ page

< Go to the main FAQ page

<< Go to the Home Page

ザ・間違いリスト

はじめに

このリストのもともとのはしがき:

ウィンドウズソケット・間違いリスト (または「今週の大馬鹿大賞」)

ウィンドウズソケット・間違いリスト
(または「今週の大馬鹿大賞」)