for - みる会図書館

1. UNIX MAGAZINE 2003年9月号

特集・プログラミング入門図 13 基列法と挿入整列法を用いて整列するプログラム #define BSIZE 8 #define CSIZE ( 1 くく BSIZE) #define CMASK (CSIZE ー 1 ) arr ; tO = brr; from int i , j , k ; int *from, *to, int scale ; sort(void) VOid int c [CSIZE] ; for (scale 16 ; scale く BSIZE * sizeof(int) / sizeof(char) ; > > scale) & CMASK] CSIZE; j + + ) scale) & CMASK] + + ; CSIZE; j + + ) 0 ; i く f0 て (i ! = arr) if (p from = p; tO from; p = t0 ; to [c C(fromCi] for (i = N ー 1 ; c [j ] + = c Cj ー 1 ] ; 1 ; j く for (j c [ 0 ] ー c [(from[i] > > for (i = 0 ; i く 0 ; j く for (j arr [j ] ; arr Cj + 1 ] arr[j + 1 ] break; if (arrCj] く = k) 1 for (j k = arr Ci] ; for (i 1 ; i く N ; i + + ) { arr Ci] = brr [i] ; scale 十 = BSIZE) { ではなく 24 ビットとする (for 文の初期化部で scale を 8 とする ) ことで、より高速に処理することができます。今回は、上交によらない整列法の例として基委各列法を紹介しました。キーとしてとりうる値の観月と同じ大きさの配列か準備できれは、きわめて高速に動作する当」法があります。また、同しサイズの配列か準備できなくても、部分的に利用することで高速な整列法とすることができました。整列をおこなう場合、キーの値の範囲があらかじめ分かるような局面では、これらの整列法も考慮に入れるとよいでしよう。 ☆ 128 9 回にわたってアルゴリズムとデータ構造の基礎について説明してきましたが、代表的なものをほんのすこしとりあげた程度です。もちろん、こで紹介したもの以外にも有用なアルゴリズムはありますし、アルゴリズムを必要とする間題も探索や整列だけではありません。新たな間題に直面したとき、この記事がはんのすこしでも役に立ったこまで書いてきた甲斐があるというものです。頭のら、片隅にでも入れておいて、新たなアルゴリズムについて考えなけれはならなくなったとき、思い出していただけれはさいわいです。 UNIX MAGAZINE 2003.9 ( いまいすみ・たかし千葉大判

2. UNIX MAGAZINE 2003年9月号

特集・プログラミング入門図 8 基数交換法を用いたプログラム void sortsub(int 10W , int high, int base , int i , 」 , cur ; int cnt [ 10 ] , save [ 10 ] ; for (j 0 ; j く 10 ; j + + ) cnt [j ] for (i 10W ; i く high; i + + ) cnt[(arr[i] base) / step] + + ; save [ 0 ] cnt [ 0 ] ; cnt [ 0 ] ー for (j 1 ; j く 10 ; j + + ) { int step) cnt Cj ] ; save [j ] cnt [j] + = cnt Cj for (i = high ー 1 ; i > = brr C10w + cnt [(arr [i] for (i 10W ; i く high; arr Ci] brr[i] ; cur = 10W ; 10W ; 十十 ) base) / step] ーー ] arr Ci] ; for (j 0 ; j く 10 ; j + + ) { if (save[j] > 1 & & step > 1 ) { ます、最後に定義している s 。 rt 関数からみていきましのようになります。これらの条件を考慮してプログラムを作成すると、図 8 ことにします。にするために、処理対象の範囲の最小値も引数として渡す桁目なら 10 といった値で表現します。また、引・算を簡単うは桁数で直孑旨定するのではなく、 3 桁目なら 100 、 2 を渡すことにしましよう。一方、処理の対象とする桁のほはすです。そこで、その添字の範囲の最小値と最大値 + 1 グループに入るデータは連続して並んた ) 伏態になっているード群は配列にオ内されていて、直前の処理によって同しどの桁に注目するのかといった情幸ゞ必になります。カどのカード群を分類しなけれはならないのか、そのとき、ら、再帰的な関数として実現するのが簡単です。関数では、 sortsub(), N, 0 , M / 10 ) ; sort(void) VOid cur + = save [j] ; sortsub(cur, cur 十 save [j] , base 十 j * step, 120 step / 10 ) ; ょっ。これは直前で定義している sortsub 関数を呼び出すだけの関数ですが、その際、配列全体を扱うために 0 から N ー 1 までの要素を処理する必要があります。そこで、 0 と N を引数として渡します。また、対象範囲のキーの値の最小値は 0 ですからそれを指定し、桁数を表す値として M / 10 を渡しています。この M は、レコードのキーの匆月値を決めるときに、 rand() % M という形式で用いているものです。つまり、 M / 10 という値を使うことで、ちょうど 10 個のグループに分割できるようになります。テストのために、 M の値を 1000 としてこのフログラムを実行してみました。したがって、桁数を表す値には 100 か渡されます。このとき、 0 ~ 99 、 100 ~ 199 、・・・ 900 ~ 999 という 10 個のグルーフに分かれ UNIX MAGAZINE 2003.9

3. UNIX MAGAZINE 2003年9月号

特集・プログラミング入門よいので、 drr 配列のその値の添字の場所にコピーしておきます。これをすべてのカードに対しておこなうだけです。最後に、 drr 配列から crr 配列にコピーしなおすことで、 crr 配列自身か整列された状態になるようにしています。あまりに簡単すぎて拍子抜けしたかもしれませんが、ちゃんと順番どおりになるのですから、これも立派な整列法の 1 つです。なお、この条件であれば、 0 ; i く NCARD; i + + ) fo て (i crr [i] としても正しい状態のものか得られます。しかし、これは整列しているわけではありません。レコードのサイズが大きく、一部の値がキーとなっている場合を考えれは、たんに数値を並べるだけでよいというものではないことが分かるでしよう。トランプを例に説明しましたが、もちろんこのガ去はトランプを並べるとき以外にも使えます。とくに、キーの値が一一 - ・定範囲内にあることが分かっている場合は有効です。たとえば、あるクラスで実施した試験の結果を出席番号順に並べ替えるといったときにも使えます。この場合、試験がカードで、出席番号がカードに書かれた数字に対応するわけです。さて、この方法にかかる手間を考えてみましよう。 for ループが 2 つありますか : どちらも要素数、すなわちれ回ループしています。つまり、このガ去であれは 0 ( れ ) の手間で整列が可能ということになります。上記の七並べの例からも分かるとおり、キーの値の示回川内にびっしりと 1 つすつの要素がある場合には ( 実際には、たかだか 1 つの要素がある場合 ) 、通常の整列法の限界を超えるような整列が可能だということが分かります。この制限をすこし緩めることもできます。どのキーの値に対しても要素がたかだか 1 っという制限を外し、それぞれのキーにいくつの要素があってもかまわないことにしましよう。つまり、キーの値が NI までであり、要素数が N 個だとすると、、 > NI のケースにも対応するのです。この場合には、前記の方法をそのまま適用するわけにはいきません。こで、整列法の見方を変えてみましよう。分配計数法 116 図 1 分酉十去を用いたプログラム VOid sort (void) int i , j ; for (j 0 ; j く M; for (i 0 ; i く for (j 1 ; j く M; m Cj ] + = m [j ー 1 ] ; for (i = N 1 ; brr[m[arr[i]]- for (i 0 ; i く十十 ) i > = 0 ; arr[i] ; UNIX MAGAZINE 2003.9 回までと同様ですが、キーの値は M までに制限されておムを作ってみましよう ( 図 1 ) 。配列などの前提条負 : は前 counting) などと呼ばれます。この手法を用いてプログラこのようなアルゴリズムは、分配引嚶去 (distribution いことになります。目的のレコードは 40 番目から 49 番目の要素とすればより、 150 というキーをもつレコードが 10 個あるのなら、る場合、これよりも小さいキーをもつレコードが 40 個あとするわけです。 150 というキーをもつレコードに注目すあるかを数え、そこからレコードを各内する・あるキーの値よりも小さいキーをもつレコードがいくつ数ある場合も簡単に拡張できます。つまり、このような見方をすれは、あるキーをもつレコードか複は 50 番目の要素とすれはよいことカ吩かります。から 149 までの 50 個があります。そこで、このレコードーをもつレコードよりも小さいキーをもつレコードは 100 と読み替えることができます。たとえは、、 150 というキあるかを数え、そこにレコードをイ褓内する・あるキーの値よりも小さいキーをもつレコードがいくつれは、 100 を引いた位置に↑内しなけれはならないからです。ーの値の範囲が 100 から 200 であれは、キーの値からことを書きましたが、これは正確ではありません。もしキさきはど、、キーの値と同じ場所にオ褓内する " という意味の brr[i] ; arr[i]

4. UNIX MAGAZINE 2003年9月号

特集・プログラミング入門図 4 配列て表現したリスト図 6 ビンソートを用いたプログラム void sort (void) 003 20 30003 ■ int i , j , k ; for (j 0 ; j く M; j + + ) m[j] for (i N 1 ; i > = 0 ; m[arr[i]] i = 0 ; 0 ; j く M ; j + + ) for (j for (k = m Cj ] ; k > = 0 ; k = a Ck] ) brr [ i + + ] arr Ck] ; fo て (i 0 ; i く N ; i + + ) arr[i] brr[i] ; 図 5 配列て表現した 2 つのリスト ■ 30 300 0 ■ するための配列もこの全体のレコード数ぶんを用意すれはよく、このサイズもあらかしめ判明しているために都合がよいわけです。す。これは、再丿髄勺データ構造をとりあげたときに、配列からの導入として紹介したガ去です。この考え方を使ってプログラムを作成すると、図 6 のようになります。データは arr に入っているので、これたとえは、添字が 0 から始まる配列に 3 、 4 、 6 、 7 、 5 、 2 というデータかオ内されているとします。この場合、これをキーの値にもとづいて M 個のリストに分割します。を昇順に並べたリストを表現するために、 1 、 4 、 3 、のとき、リストの頁を M 個の要素をもつ酉冽 m にオ褓内 2 、 0 というリストを用意します。すると、 : 頁が 5 番目のし、それ以降の要素はさきほど紹介した次の要素尉寺する形式で a という配列にオ褓内します。最後に、 M 個のリス要素だという情報さえあれは、そこから順に 5 、 0 、 1 、 4 、トの要素を順番に配列にオ内して整列します。ただし、要 2 、 3 番目の要素をたどっていくことができます ( 図 4 ) 。素は別の酉改」にオ内したはうか簡単なので、いったん brr そして、配列にイ褓内されているデータをみれは、 2 、 3 、という配列に褓内し、最後に arr 配列にデータを戻すよう 4 、 5 、 6 、 7 と昇順に並んだデータか得られます。さらににしています。このガ去なら ( 独立した ) 複数のリストを表現するのも簡単です。今度は、偶数と奇数の昇順のリストを表現してみ最初の for ループでは、各キーの値に対応するリストましよう。偶数と奇数の 2 つの麪頁 &f 尉寺する必要があの地頁をイ尉寺する配列を匆化します。すべての要素に対りますが、これは 5 と 0 になります。このとき、次の要し、レコードがないことを示す一 1 を代入しています。次ー 1 、 3 、 1 です。こうするのループでは、キーの値にもとづくリストにレコードを追素を表す配列は 4 、 2 、と、偶数の配列は要素の番号でいえば 5 、 1 、 2 に、奇数加します。ここでは、新たにみつけたレコードをリストののリストは同しく 0 、 4 、 3 になります。実際の値にする地頁に追加するため、レコード全体を末尾から頁に向かと 2 、 4 、 6 と 3 、 5 、 7 ですから、正しく表現できているって処理しています。これによって、各リストに悩求されことが分かります ( 図 5 ) 。る順番がもともとの順番と同じになるようにしています。実際のリストへの追加処理では、ます、注目しているレコこの場合には、それぞれのリスト : されるレコードードの次を指すものとして、その時点でリストの地頁にな数は不明だが、全体のレコード数は分かっていることが前っているレコードを指定します。その後、注目しているレ提条件となっています。つまり、すべてのリストにイ求さコードを頁に指定するだけです。れるレコード数は事前に分かっています。次の要素を各内 118 UNIX MAGAZINE 2003.9

5. UNIX MAGAZINE 2003年9月号

特集・プログラミング入門図 2 サンカレデータ 0 2 3 1 3 4 3 2 0 4 図 3 レコード数の計算と配列の格納位置り、要素数 M の配列 m が宣言されていると仮定しています。 for ルーフ。がたくさん並んでいますが、それそれの内容はごく簡単です。最初の for ループは、キーの値の範囲と等しい要素をもっことができる配列 m をすべて 0 に初期化しています。次の f 。 r ルーフで、それぞれのキーの値をもつレコードがいくつあるのかを数えています。この処理は簡単で、キーの値を添字にして配列の要素を j 尺し、それをインクリメントすれは計算できます。この処理をおこなうと、図 2 のようなデータカえられたときには、それぞれのキーの値のために図 3 の上段のような値カ引・算されることになります。次の for ルーフでは、あるキーの値よりも前に要素がいくつあるかを数えるために、その値よりも前のものをすべて合計しています。といっても、 1 番目の要素から順番に直前の要素の値を加えているだけです。値を加えようとする点では、すでにその位置までの値は合計されているため、直前の要素を加えるだけでそのキーの値までのすべての要素数を表すことができます。なお、 0 番目に関しては 1 つの要素があるのなら、それは 0 番目に入れなけれはならないので、処理を開始する前にデクリメントしています。この処理をおこなうと、配列 m の内容は図 3 の下段のようになります。 4 番目の for がもっとも重要な部分です。配列 rn に格納されている値には、、そのキーをもつ値を入れるべきもっとも後ろの場所 " が入っています。ですから、キーの値にもとづいて、配列 m が示す場所にデータを入れれば正しい位置に褓内できます。ただし、いったんデータ翻勺したら同じ場所にはデータを入れることができないので、次はその前の位置にデータを↑絲できるようにデクリメントしています。 0 1 2 3 4 2 202 02020 UNIX MAGAZINE 2003.9 こだけ for ルーフ。の向きか異なりますか : これには大切な理由があります。ほかのループは頁から順に調べていますが、こだけは末尾からう曰頁に向かってのループになっています。これは、配列 rn が、、そのキーをもつ値を入れるべきもっとも後ろの場所 " を表現しているため、後ろから処理することて整列の安定性カ躱てるからです。こまでの処理で、 brr 配列には正しいレコードが並んでいます。そこで、最後のループでこれを arr 配列に戻して整列処理を終了します。この整列法は、キーの値の範囲が限定されていれは利用できるため、さきほどの方法よりも適用範囲が広くなります。それでは、この整列法の手間を考えてみましよう。ループは 4 つあり、 2 つは N 回、残りの 2 つは M 回のルーフになっています。ところが、この M は固定になるため、けっきよくは N だけが残り、 0 ( れ ) となります。ただし、注意しなけ川まならないのは、さきほどの方法と上は交して M に比例する領域が必要になる点です。場合によっては、 N よりも M のはうがはるかに大きいこともあります。 M がきわめて大きいときは、これは現実的な鮹去とはなりえません。さて、同じ間題をすこし違った去て解決してみましょう。さきほどは、各キーの値をもつレコードの個数を数えましたが、今度は M 不鶤頁のキーの値しかないのなら、そこに並べてしまおうというものです。ちょうど、ハッシュにおいて、ハッシュ値か衝突したとき、ノ、ツン - ュノヾウ - ットにリストを作ってレコードをつなげていったう地旧些饋法とよく似た考え方です。複数のレコードを並べる可能生があるため、これをなんらかの方法て表現しなければなりません。分旧鎖法では、糸彡リストを用いてレコード : 早しました。求されるデータの量か事前には分からないため、重加勺にサイズの変史ができるデータ構造の利用は理にかなっていたのです。せつかくなので、今回はすこし異なる形式を利用してみましよう。配列を用いてリスト構造を表現するのです。あるレコードに注目したとき、リスト構造の次の要素 : ゴ翻タされるレコードを表す配列の添字をデータとしてもつ配列を用意すれは、配列だけでリスト構造が表現できまビンソ - ト 117

6. UNIX MAGAZINE 2003年9月号

特集・プログラミング入門つのデータに注目します。これらのデータの下 1 桁目は、昇順に整列しています。これはたまたまこのように整列したわけではなく、しかるべき理山があります。しつは、こでそれぞれの桁について当リをおこなうために安定性のある整列法を使っています。つまり、下 2 桁目を整列しているとき、同じキーの値をもつものについては整列前の段階の順序かイ尉寺されているのです。、、整列前の段階 " というのは下 1 桁目て整列した状態ですから、けっきよく、下 2 桁目が同しキーとなっているデータは下 1 桁目で整列した状態になっているわけです。これは、とりもなおさす、下 2 桁を数値とみなして整列しているのと同じ結果になります。これをさらに 3 桁目でも繰り返すと、今度は下から 3 桁ぶん ( つまり全体 ) を数値とみなして整列することができます。かって、言算機にデータを入力するときにカードを利用していた日罸にがありました。各カードには、 1 つのデータか書かれています。このカードの束を整列するのに、この整列法はたいへん便利だったのです。カードを入力する場所は 1 カ所ですが、カードを出力する場所は図 7 のように 10 カ所あります。最初に、下 1 桁目でカードを分類します。すると、それぞれの場所に何枚かすっカードがう嶽頁されることになります。このように分類されたカードを、 0 の箱に入ったものが一番上に、 1 の箱のものがその次に、・・・ 9 の箱に入ったカードが一番下になるようにまとめます。これで、下 1 桁の整列ができたことになります。次は、下 2 桁目を使った分類です。ここでも同しように、う嶽頁されたカードを順番にまとめます。この処理を必要な桁数ぶん繰り返すと、ぶじにカード全体か整列した状態になります。この直接基去をフログラムとして組むと、図 11 のようになります。このプログラムの基本も、やはりう・颪去です。一番下の桁から順に、各桁についてう・去を適用しています。中身については、とくに難しいところはないでしよう。ある範川の要素数を数えるのに、 m[(fromCi] / scale) % 10 ] + + ; という式を用いています。このとき、 scale 変数は下 1 桁目なら 1 、下 2 桁目なら 10 となっています。つまり、ま UNIX MAGAZINE 2003.9 図 11 直接基去を用いたプログラム VOid sort (void) int scale; int *from, *to, int i , j ; from = ; tO = brr; f0 て (scale 1 ; for (j 0 ; j mCj] scale く 1000 ; く 10 ; j + + ) ー 1 の { f or ( i = 0 ; i く N ; i + + ) mC(fromCi] / scale) % 10 ] + + ; mCO] ー for (j 1 ; j く mCj] + = m[j for (i = N 1 ; to[m[(from[i] fromCi] ; P = t0 ; t 0 from = p; if (p for (i 0 ; i く 10 ; j + + ) / scale) % 10 ] 十十 ) arr Ci] brr [ 幻 ; 125 て重要です。これは無視できないので、やはり別の配列をした。一方、今回の直接基去では整列の安定性はきわめを犠牲にしてよけいな領域を使わすにすむようにしていまので、ビットごとのプログラムを作成するときには安定性ただし、基数交換法では整列の安定性は重要ではなかった場合と同様、ビットごとの処理を考えることもできます。さらにプログラムを張するのであれは・、基数交去の注意が必要です。一番外側の for ループの条「牛がかなり書きにくくなるのでら対応可能とすることもできます。ただし、その場合には満に限定していましたが、この限定を取り払って int 型なさきほどのプログラムでは、キーの値の範囲を 1 , 000 未に書き戻す処理が省けます。ている点です。これにより、ある桁を整列した時点で arr いう 2 つのポインタを用いてデータの入った配列を指定しもう 1 つ、ちょっと工夫しているのは、 to と from とは、目的の 1 桁の値を取得できるわけです。ることになります。そこで 10 による剰余演算をおこなえすこの値て割ることで、調べたい桁が一番下の桁に移動す

7. UNIX MAGAZINE 2003年9月号

連載 / UN Ⅸの道具箱ーの図 5 permitopen オプション付き公開鍵によるポートフォワード・ポートフォワードの準備 10Ca1 ost % slogin -L 10110 : pophost : 110 remotehost Enter passphrase for key ' /home/local/hoehoe/ . ssh/id—rsa' Escape character iS Connected to localhost . Trying : : 1 ・ localhost% telnet localhost 110110 ・作成されたトンネルで pophost の 110 番ポートにアクセス remotehost% We1come to FreeBSD ! 図 6 permitopen オプション付き公によるポートフォワード ( 許可されていない車医 ) —nara. ac . JP> + OK Qpopper (version 4.0.4 ) at pophost. aist—nara ・ ac. jp starting. く 31947.1057652588@pophost.aist Enter passphrase for key '/home/local/hoehoe/ . ssh/id—rsa' localhost% slogin —L 10080:webhost : 80 remotehost ・ポートフォワードの準備 Connection closed by foreign host . Escape character iS Connected to localhost . Trying : : 1 ・ localhost% telnet localhost 10080 ・作成されたトンネルで webhost の 80 番ポートにアクセス remotehost% We1come to FreeBSD! 図 7 command オプション付き公開鍵によるパックアップ 10Ca1 五 ost % slogin remotehost Enter passphrase for key ' /home/local/hoehoe/ . ssh/id—rsa Backup start . Backup /home ー > /Backup/home Connection tO remotehost closed . localhost% トを図 8 に示します。工スケープ・シーケンス SSH でポートフォワードを使用している場合、途中で転送するポートを追加したくなることがあります。しかし、そのたびに新たに一 L オプション付きでログインするのは面倒です。また、一印判勺にローカルホストのシェルを利用したい場合などもあるでしよう。そのような場合のために、エスケーフ・シーケンスによるいくつかの機能が用 92 図 8 パックアップ・スクリプト列 # ! /bin/sh echo "Backup start . if [ -f /usr/local/bin/rsync ] ; then /usr/local/bin/rsync —a - —delete /home /Backup echo "Backup /home ー > /Backup/home" echO fi echO 意されています。ェスケーフ・シーケンスとは端木を制征卩する牛朱文字のことで、子の直後に入力することによりなんらかの制御 ( チルダ ) がエスケーフがおこなえます。 SSH では文字で、この後ろにいくつかの文字を入力することて制御が可能です。これは設疋ファイルの EscapeChar ノヾラメータや ssh の -e オフションで変更できます。チルダそのものを入力するには、、 " とします。 SSH でサポートされているエスケーフ・シーケンスの一覧を表 UNIX MAGAZINE 2003.9

8. UNIX MAGAZINE 2003年9月号

特集・プログラミング入門図 12 直接基去を用いたプログラムの改良版 = 0 ) arr ; to = brr; from int i ; int *from, *tO, illt zero, one; unsigned bit ; sort(void) void 1 ; bit; bit くく一 0 ; i く N ; i + + ) for (i zero = 0 ; for (bit if ((from[i] 十十・ one = N ; for (i = N ー 1 ; to [from[i] & fromCi] ; p = t0 ; from; t 0 from = p; if (p ! = arr) { & bit) bit? for (i 0 ; i く N; arr [i] = brr Ci] ; 0 ; —zero] —one : 十十 ) 利用することになります。ただし、ある範囲内にある値の個数を言 1 算するのに配列は不要になります。ビットごとの処理になるため、 0 か 1 のどちらかしかありません。したがって、片方の数を数えればもう一方の数も分かります。これらの工夫を施したプログラムは、図 12 のようになります。この関数では、変数 zer 。に注目しているビットが 0 の要素の数を数えています。要素数を数え終えると、一番後ろの要素から順に正しい位置へとコヒーしていきます。注目しているビットが 0 の要素は、この変数の値が示す場所の直前の位置か引内していけはよいはすです。また、 1 の要素の場合は、末尾から順番に各内していけばよいでしよう。そのため、 one を要素数を示す N に初期化し、 one や zero をデクリメントしつつデータをオ褓内していきます。全体のルーフ。の終了条件はすこし変わっています。プログラムに書かれた条件は、 bit 変数の値が 0 になったところでループを終了するようになっています。普通に考えれは、 1 をいくらシフトしたところで 0 にはなりませんが、 126 変数が使用する領域をはみ出るほどシフトしてしまうと、けっきよくは値が残らないことになるため、オーノヾーフローしたときに 0 になるわけです。つまり、このループは、もっとも右のヒ、ツトからみていって、ヒ、ツトが存するあいだは左に進みながらループを繰り返すことを表しています。さて、この妾基去の手間は、フログラムを見ても分かるとおり、 0 ( れ ) となります。ただし、基数交去と同しく、定数部分には注意が必要です。配列として用意できる程度のれに対する logn と上交すると、大きな値 ( たとえば、ビットごとの言算をしていて int が 4 バイトなら 32 ) カ症数部分として掛けられています。基数交換法では、グループにうリされたデータ数が少ないとき、処理をそこで終了することができましたが、直接基新去では困難です。どのような場合にも、すべてのビットや桁について処理をしなけ川まなりません。そのため、調べるべきビット数が多いときなどは、けっきよくは遅くなってしまうので注意してください。基数整列法の改良基数交去と妾基颪去は、どちらも基数整列法と呼はれる整列法の一重です。この手法では、調べるビット数が多いと時間がかかってしまいます。これは、 1 ビットを調べるために、すべての要素を処理しなけれはならないからです。つまり、調べるビット数をわとすると、回の処理が必喫となってしまうのです。処理の回数を減らすには、複数のビットをまとめて処理する力法か有効です。たとえば、 2 ピットすっ処理したとすると、もともとはわ回繰り返さなけれはならなかったものが、り 2 回繰り返すだけて処理を終えられるようになります。もちろん、 4 ビットすっ処理をすれは、全体の区しの回数はり 4 となります。これだけをみると、できるだけ多くのビットをまとめて処理したほうか彳お区しの回数を減らせるため、処理か高速におこなえると期待できます。極端にいえば、 32 ビットをまとめて処理すると、 ( int が 32 ピットであれは ) たった 1 回の区しで整列することができます。しかし、これは無制限におこなえるわけではありません。多くのビットをまとめて処理しようとすると、それに UNIX MAGAZINE 2003.9

9. UNIX MAGAZINE 2003年9月号

SC 翡 FREEBSD/NET 日 SD/ ロ PEN 日 SD/ 日 SD/ ロ S AND OTHERS BSD ハッカーになる。 2003 NO 15 繧売中 ! ! 特集 1 目指せ ! *BSD ハッカー特集 2 Mac OS X システム管理者虎の巻 SpeciaI RAVAntiVirus for Mail Servers 841 株式会社アスキー〒 160-8584 東京都新宿区信濃町 34 番地 J 日信濃町ビル電話 ( 03 ) 5362-3300 http://www.ascii. CO. jp/

10. UNIX MAGAZINE 2003年9月号

プログラ第ング入門今泉責史アルゴリスムとデ - タ構造の基礎知識ー整列 ( 3 ) 0 前回は、整列に要する手間の理論的な限界値である 0 ( れ log れ ) て整列が可能なアルゴリズムとして、マージソートとヒープソートを紹介しました。この 0 ( れ 1 。 g れ ) は、値を上交しながら整列する場合の限界です。 1 ~ 4 月号でとりあげた、、探索 " で普通に上交操作をおこなうと、かならす〇 ( I 。 g れ ) の手間がかかってしまいました。しかしハッシュ法では、要素数とバケット数の関係によって 0 ( 1 ) に抑えられます。整列についても、これとよく似た状況が考えられます。今回は、おもに上師交によらない整列法をとりあげます。これらの当リ法は、条件か限定されたき竟では、より高速に動作する場合もあります。これまでは、任意のキーが含まれるレコード集合の整列 Ⅲ題を考えてきました。こで、ちょっと条件を限定してみることにしましよう。ジョーカーを除いた 52 枚のトランフ ( カード ) の整列に間題を限定します。スーツの順番は適当でかまいませんが、曰列としてスペード、ダイヤ、クラブの順であるとしておきます。このように条件を限定すれは・、これまでとは違ったアフローチて整列を実現することができます。トランプを用いた、、七並べ " というゲームはご存しだと思います。七並べでは、最糸勺にはすべてのカードを場に並べることになります。この状態になっていれは、並んでいるカードを順番七並べで整列 UNIX MAGAZINE 2003.9 に取り出すだけて整列した状態の 1 組のトランフ。か得られます。これを使ってみることにしましよう。実際の整列方法は、カードの集合から 1 枚取り出したら、七並べですべてのカードか並べられた様子を思い浮かべながら、そのカードがあるべき箇所に置いていきます。これを繰り返すだけです。そして最後に、並んだカードの順番を崩さないように集めます。それでは、この間題を言機で実現してみましよう。簡単のために、各カードに 0 から 51 の番号を付けたとします。つまり、それぞれのカードを 0 から 51 という値て表現するわけです。そして、その直の順番にカードを並べ替えることか整列に相当します。フログラムとして作成するのは簡単です。カードのもともとの状態は、 crr 配列 ( ゴ尉寺されているものとします。カードの枚数は NCARD マクロて袂められています。また、言 t 算に使える crr と同サイズの配列 drr を用意しました。この条「牛に沿ってフログラムを書くと、次のようになります。 VOid sort—cards (void) crr[i] という値をもつカードは、その値の順番にすれは・ int i ; for (i 0 ; i く NCARD; i + + ) drr Ccrr Ci] ] crr Ci] ; for (i 0 ; i く NCARD; i + + ) crr Ci] drr[i] ; 115