場合 - みる会図書館

1. 月刊 C MAGAZINE 1990年4月号

五ロく第 5 回〉キーポー圦カプログの作成 ( 1 ) 高橋良明と次回の 2 回にわたって , 前回作成した関前回は , 画面上の任意の場所にテータを数を利用して , キーボード入力プログラ表示する関数をはじめ , いろいろなテキムを作成します。スト画面表示関数を作成しました。今回ライプラリのキー入力関数は , 挿入 / 削除 , 上書きなど細かい仕様になっていません。そこて , 今回作成するキーボ、一ド入力関数の仕様は , 次のようにしました。キー入力関数の基本仕様 ( 1 ) 画面上の任意の場所で入力する前回作成した , カーソルのポジショニング関数 , 画面表示関数を利用することて、実現て、きます。一部のキーコードなお , すべてをプログラムて、制御するは内部で処理するため , 1 文字入力関数はエコーなしの関数 ( [ で 0 社〕など ) (MS-DOS て、は , getch) を使用します。これは , DOS のファンクションを呼び出す関数を自作してもかまいません。 ( 2 ) 漢字の入力ができることとくに , 全角文字のデータを上書きすかを判別することて、 , 対応て、きます。る場合や挿入 / 削除する際の扱いがポイン漢字は 2 バイトコードて、す。そのため , ( 4 ) 挿入 / 上書きモード切り換え ANK ( 1 バイトコード ) を入力するときとトとなります。亠キーを押すことて、 , 挿入モード / こて、は , 文字列データの任意の 1 バイは , 別な処理を行います。上書きモードの切り換えを行います。挿幸い , 漢字の第 1 バイトコードと ANK トが ANK なのか全角文字の 1 バイトなの入の場合には入力域内に挿入てきる余地の文字コードとは区別て、きるのて、 , 1 バイ Fig. 2 ESC コードで始まるキーテータの入力ト入力があった時点て ANK と漢字の処理を分けます。亠を押す ( 3 ) 漢字の処理ができること・・・ 0X1b55 が入力されてくる ~ を押して , 続いて回を押す・・・・ 0X1b55 が入力されてくる入力データ中 ( バッフアの中 ) に , ANK ↓ このため , 0xIb が入力された時点では , 押されたキーがなのか ~ なのかが判断できない ( 1 バイトコードの英字 , 数字 , カナ ) と全角文字が混在するのて , そのカーソルとポインタの処理を行います。 110 CMAGAZINE 19 4 Fig. 1 キー入力の模式図通常の場合日本語 FEP が動作している場合キー入力 ↓ BlOS(Basic I/O System) ↓ハードウェア独自のキーコードを返す ↓ 日本語 FEP OS ↓ OS / 日本語の文字コードを生成して返す ↓ コマンドインタブリタ / アプリケーション一部のキーコードは内部で処理する ( [ 変キーなど )

2. 月刊 C MAGAZINE 1990年4月号

ライフホート 0 「 m 面 on from (ompiler Ma 「 5 Lattice C 0 警告メッセージ、 w 。。。 ig : cannot open library s \ . lib. ″が出て , リンクできないのですが , どうしてですか ? A コンパイラはオプジェクトコードを生成するとき , デフォルトのライプラリ名をオプジェクトファイルに出力します。このデフォルトのライプラリ名は , Lattice C のインストールプログラムによって作成されるツリー構造になっていることを前提としています (Fig. 1 参照 ) 。しかし , インストールプログラムを使わないて、 , ライプラリをそのままフロッピーディスクからコピーして使用している場合て、も , コンパイラはオプジェクトファイルにメモリモデルに対応したディレクトリ名を頭につけたライプラリ名を出力しています。リンカは , コマンド引数や応答ファイルて、指定されているライプラリを最初に探しにいきますが , その中て見つからないシンポルがある場合 ( タイプミスて , 関数名がまちがっている場合など ) , デフォルトのライプラリを探しにいくために *VVarnig : cannot open library s \ lc. lib. クが表示されることになります。これを防ぐには , ①コンパイル時に一 1 オプションを指定してデフォルトライプラリ名をオプジェクトファイルに出力しないようにする。 ②リンカオプション / NODE FAULTLIBRARY を指定し 0 &A て , デフォルトライプラリを探しにいかないようにする。 ③ファイル構成を Fig. 1 のようにして , デフォルトライプラリ名を使用する。以上 , 3 つの方法があります。なお , デフォルトライプラリを使用する場合には , 環境変数 LC と LIB に各メモリモデルのディレクトリの親ディレクトリバス名をセットしておく必要があります。 *Error 3 : ″が出て , イルできません。 0 コン′ 、、 Error 3 : クは , 指定されたインクルードファイルが見つからないというエラーて、す。この場合 , ふたつの可能性があります。 ①入力したファイル名がまちがっている。 ②インクルードのネストが深すぎまず , ①の場合は , プログラム中の # include 文の引数がまちがっ Fig. 1 Lattice C ティレクトリ構造ルートティレクトリ LC A ているか , インクルードファイルを作成するときに , 工デイタに指定するファイル名を打ちまちがえたかて、す。②の場合 , Lattice C< は , 最大 16 レベルのネストが可能なようにコンパイラは作られていますが , MS-DOS て、は , 同時にオープンて、きるファイル数が最大 20 個に限定されているのて、 , 実際には , 13 レベルまて、になってしまいます ( コンソール入出力などて、 5 個 , . C のソースファイルて 1 個 , コンパイラのワークファイルて、 1 個のファイルを使っているため ) 。また , CONFIG. SYS ファイルて FILES を指定していなかったり , 20 より小さい値を指定していると , のメッセージが表示されます。② んくインクルードファイル名 > 〃いて , ファイルが見つかりませ ①の場合は , *Error 3 : クに続のエラーは出なくなります。 FILES を 20 に指定することて、 , CONFIG. SYS ファイルの中のくなります。ネストを浅くするか , ネストて、きるレベルはさらに小さされません。なぜならば , オープンファイル数の制限により , 工ラーメッセージファイルを開くことがてきないからて、す。 0 フィル名の検索をサプディレクトリの中まで行っていきたいのですが , dfind, dnext 関数は再 ( 付録ディスク収載の List1 参照 ) 。どこかに退避する必要がありますい場合には , API DTA の内容をん。どうしても再帰的に使用した本的には再帰的には使用て、きませ API DTA を初期化しますから , 基使用しています。 dfind 関数は AP 工 DTA を仮想的な DTA として Ver. 4.1 て、は , グローノヾル変数 DTA< 行います。 Lattice C/DOS -DOS とのデータのやり取りを EH,4FH を使用しているのて、 , MS DOS ファンクションコールの 4 dfind, dnext 関数は , MS ー A 帰的に使用できますか ? の場合は , このメッセージが表示 lnformation from CompiIer Makers 153 ( L モテル用オプジェクトモジュールとライプラリ ) L ティレクトリ ( D モテル用オプジェクトモジュールとライプラリ ) D ティレクトリ ( P モテル用オプジェクトモジュールとライプラリ ) P ディレクトリ ( S モテル用オプジェクトモジュールとライプラリ ) S ティレクトリ (. EXE ファイルや . H ファイル )

3. 月刊 C MAGAZINE 1990年4月号

一目瞭然て、す ) 。必要に応じて cprintf() を使用すべきて、しよう。ただし , リダイレクションが使用てきなくなる , ほかの 0 S への移植性が低くなる , という欠点があります。ーどう最適化するかまずハードウェアの制限を避ける対策をリストしましよう。プロセッサ / メモリプロセッサ / メモリのスピードに関して , プログラマがて、きることは , 実行するインストラクションの数を少なくしたり , 別の効率のよいインストラクションを使って高速化を図ることくらいて、しよう。 V25 などのチップを使う組み込みシステムのプログラマはバンクごとのウェイトステートの設定が可能て、す。インタラクテイプデパイスキーポード入力 ( インタラクテイプデバイス ) は通常 , 人間の入力時間のほうがはるかに遅く , あまり問題にはなりません。しかし , 一部のソフトて、は 1 文字入力ごとになんらかの処理を行っている ( FEP などは好例 ) ために , その時間が人間の入力インタバルより長く不自然に感じる場合があります。ディスクのキャッシュディスクキャッシュの影響に関しても「 lnside! 」ははっきりしたスピードの違いを見せてくれます。とくに「 lnside! 」は DOS のアクセスごとに最大値 , 最小値をレポートしますから , ヒットしたデータとそうてないデータとのアクセス時間が明確になります。コーノレ / リターンのオーバーヘッドを避けるある関数 (funcl( ) ) が複数の関数 ( Ca111 ( ) , Ca112 ( ) , Ca115 ( ) ) からコールされているが , 実行回数が多く時間もかかっている場合には , funcl( ) を Ca111 ( ) , Ca112 ( ) , Ca115 ( ) ! のどれか ( ひとつまたは複数 ) にインライン展開すればコール / リターンのオーバーヘッドを回避て、きます。問題は , funcl( ) をコールしたときにもっとも時間のかかる関数がわからないかぎり , 3 つの関数のどこにインライン化することが効果的なのかわかりません。もちろんすべての関数内へインライン化してもよいのて、すが , コールしている関数の数が増えるにしたがってコードサイズが膨らんて、しまいます。この場合は「 lnside! 」の関数コール解析を使って funcl ( ) をコールしている関数ごとに funcl ( ) の実行回数 / 時間を計測し , 多くの時間を消費している関数を探しあてて , その関数内に funcl( ) をインライン化します。もちろんインライン化によってコードが散らばるため , メンテナンスの負担が増えることになります。この点も考慮に入れてインライン化すべきかどうかを決定してくださいアセンプラ化コール / リターンのオーバーヘッドてはなく , 関数内て、時間がかかっている場合には ( 「 lnside! 」のイベントタイミング解析て、関数の最初から最後まてを指定して計測してみてください ) , この関数自身を ( アセンプラ化などによって ) 高速化するか , アルゴリズムの変更を含めて , グローバルな視点から大幅な変更をする以外に手はありません。関数内部の時間計測にはソース行タイミング解析が役に立ちます ( 「 lnside! 」の—lt オプション ) 。ーレジスタ宣言変数のレジスタ割り付けはコンパイラに任せておけばよいのて、すが , 自動的にコンンパイラが最適に割り付けるのは事実上不可能て、す。なぜならある変数のアクセス回数は関数へのパラメータやデータに依存するからて、す。実行時のダイナミックな結果を見る以外に手はありません。まずレジスタ宣言をもっともアクセス回数の多いと思われる変数へ割り付け , 関数のスビードを計測してみてくださいループて、の例を見てみましよう。小さなループて、はループカウンタ ( 普通 i , j などの変数名 ) へのレジスタ宣言は効果がありますが , ループ内部て、の処理が増えるにしたがって相対的な効果が減っていきます。ループカウンタへの割り付けがあまり効果的て、ないと判断したら , 次にループ内部て、もっともアクセスの頻繁な変数へ割り付けます。この割り付けを変えて繰り返してみてくだ忘れてならないのはレジスタ割り付け可能な数は各コンパイラて、違う点て、す。宣言を行っただけて、割り付けられたと思ったら大まちがいてす。また繰り返しになりますが , このような最適化の効果は全体の実行時間を見てもわかりません。マイクロ秒単位の変化を計測しなければなりません。ポインタ宣言ポインタ宣言するにはいくつか理由があります。データへのアクセスがポインタを使ったほうが自然な ( パラメータをポインタて受け取った ) 場合や , やりやすい場合 , またはサプスクリプションを使った場合よりも高速化したい場合などてす。ポインタ割り付けには ( レジスタ割り付けのように ) 数の制限はありませんから自由にポインタ宣言を行い「 lnside! 」て結果を比較してくだパラメータて渡された値を一度ポインタ Conference Room 137

4. 月刊 C MAGAZINE 1990年4月号

コンヾイラの内部を詳解 LAND, op LOR というノードになります。これらの演算子は , オプジェクトコード中て、は比較命令 ( CMP 命令 ) と条件分岐命令の組み合わせに展開されます。比較・論理演算子を処理する関数は , genbool( ) , gencompare( ) , gencond jump( ) の 3 って、す ( List5 ) 。このうち , gen b001 ( ) が外部から呼び出される関数て、 , 残りのふたつは下請けの関数て、す。まず ,gen b001 ( ) から説明しましよう。 genbool( ) は 3 つのパラメータを受け取ります。第 1 パラメータは式の木へのポインタて、 , ノードは op BOOL,OP LAND,OP BOOL のいずれかて、なければなりません ( というより , プログラムが正しければ , このいずれかになるはずて、す ) 。第 2 パラメータは式を評価した結果が真だったときにジャンプするラベル番号 , 第 3 パラメータは偽だったときにジャンプするラベル番号て、す。ラベル番号として 0 を渡すと , ジャンプするかわりに下に抜けるコードを生成します。たとえば , genbool(), 10 , 0 ) ; とすると , 「式 e を評価して , 真だったら、、 @ 10 〃このように , 「副作用のみが必要とされる式が文として使われるときて、す。このようというラベルにジャンプし , 偽だったらそ場合には , 最適化したコードを出力する」とな場合には , genexp( ) のかわりに genex のまま下に抜ける」というコードを生成しいう方法は , ほかの演算子にも応用するこ ptop( ) を呼び出します。 genexptop( ) は , とがて、きます。このような演算子には代入 List4 のようになっており , 代入演算子とイ Fig. 1 論理演算子のコード生成演算子 ( 十 = , / = など ) と , インクリメント / ンクリメント / デクリメント演算子を別扱い ( 1 ) A & & B ー ) がありまするようになっています。その他の演算子デクリメント演算子 ( 十十 , す。代入演算子は genassignop( ) と genas の場合には ,genexp( ) を呼んて、従来どおり if A が偽 then 90t0 F signopref( ) て、処理されます。前者はオペラの処理を行います。 if B か偽 then goto F ンドが数値て、ある場合 , 後者はオペランド goto T 比較演算子と論理演算子がポインタて、ある場合を処理します。インクリメント / デクリメント演算子は , 副作用のみが必要な場合には genincdectop( ) , 式前回に説明しましたように , Cm コンパイの値も必要となる場合には genincdec( ) て、ラの内部て、は比較演算 , 論理演算の結果を処理されます。これらの関数は , パラメー表す型として b001 型を導入しています。比タとして , 木構造へのポインタのほかに , 較演算子 ( = 式の値が必要とされているかを示すフラグ理否定演算子 ( ! ) は正規化され , op BOOL を受け取るようになっています。というノードて表現されます。また , 論理演算子の副作用のみが必要とされるのは , AND 演算子と論理 OR 演算子は , それぞれ op List 3 genexp(left->e_left) ; if (i sConst (right) & & ! needValue) gencode ("YtmovYt%oCbx] , %dYn" else { pushbx() : genexp(right) : popdi ( ) : gencode ("YtmovYt[di] , %rYn" ・ 4 戸 0 《 0 行ー 8 0 》 0 1 よっ 0 っ 0 -4 11 、 1 1 よ 11 1 人 11 っ 0 っ乙っ 0 っ 0 っ 0 right->e value) : p->optype, p->optype) : 関数 genexptop( ) 1 : / * genexptop generate COde for expression (with some optimization for top level) 3 : public void genexptop(EXPR *p) = NU しい 5 : 6 : switch (p->opcode) { 7 : Case op-ASSIGN: 8 : genass ign(), (O) : / * we only need side effect * / 9 : Case op-ASSIGN_0P: genassignop(), (O) : / * we only need side effect * / Case OP-ASSIGN-OP_R: genass ignopRef (), (O) : / * we only need side effect * / Case op-PREINC or op_POSTINC or op_PREDEC or 叩 _POSTDEC: 14 : genincdectop (P) : / * we only need side effect * / Default: genexp (p) : 18 : } List 4 return; ( 2 ) A ロ B if A が真 then goto T if B が真 then goto T goto F ※ T は真のときの飛び先 . F は偽のときの飛び先 yacc による C コンバイラブログラミング 79

5. 月刊 C MAGAZINE 1990年4月号

emental String 5e0 代 h in ( コーディングの詳細 26 CMAGAZINE 19 4 インデクス範囲が返されます。 ( いずれも整数へのポインタ ) に , arr [ ] の合致したの合致を見つけると , 形式引数 ptr start と ptr end ルーチンが , 探索文字列に対するひとつまたは複数に参照て、きる最初の最大インデクスて、す。この探索元配列へのポインタて、あり , 整数 imax は arr を安全 ptr end)" となっています。ここて、 arr は文字の 2 次ヘッダは , 、 \int inc search(arr, imax, ptr start, inc search( ) が実際の探索をします。この関数の戻り値は O て、す。す。 get range( ) が合致を見つけなかったら , そのクスの範囲を引数リストを介してコール側に渡しまと , その値を返すとともに , それに対応するインデことがて、きません。 get range( ) が合致を発見するからなければ , ソートずみの配列を正しく探索する大インデクスを知らなければなりません。それがわた理由により get range( ) は , 配列の参照て、きる最が入力文字と合致する項目を探します。前節て、述べ get range( ) は文字列の配列中に , 冒頭の数文字字列全体との合致を求めよ , という意味になるのて、す。れた文字から成る部分文字列て、はなく , ひとつの文列終端子の O と等しいことになり , それまて、に入力さひとつの文字列全体を指定するのて、 , 値 0 は C の文字単純て、す。引用符は ( 文字列の前後を囲むことにより ) は値 0 を返します。この特別な戻り値を選んだ理由は入力されると , そのキーはエコーされずに , getkey ( ) ョンマークまたはダブルクオーテーションマークが例外がいくつかあります。シングルクオーテーシ key( ) は , 押されたキーの ASCII コードを返します。を何て、も読んて、画面にエコーします。その場合 get ンも含む , キーポードから入力された表示可能文字します。 getkey( ) は基本的には , キャリッジリターらの関数の定義と必要な補助的コードを , List2 に示かのふたつの関数を使って探索を実行します。これス範囲を判定します。 3 つ目の inc search( ) は , ほは , 文字列の配列中の入力文字に合致するインデクは , 単純なキーポードフィルタて、す。次の get range( ) な関数は , わずか 3 つだけて、す。最初の getkey( ) 漸進的文字列探索をインプリメントするのに必要 inc search( ) はまず , 合致インデクス範囲を探索配列 arr の全配列インデクスへとセットします。これによって , ユーザが 1 文字も入力せずにキーを押した場合には , 「すべての項目が合致している」という正しい結果を関数は返せます。また , 配列の探索開始位置を表す変数て、ある base の値を , arr へと初期化します。次に , inc search( ) は getkey( ) をコールして , 入力文字を取得します。この文字が、、 ESC" や以外だと , それは get range( ) に渡され , get range( ) は文字との合致が見つかったか否かを報告します。合致が見つからないか , または見つかった合致がただひとつの場合は , 探索は終了します。これ以外の可能性は , 合致が配列中の複数の項目に存在するという場合て、す。その場合 , first と last に合致するインデクス範囲がセットされます。そして配列ポインタ base を , base[first] の第 2 の文字をポイントするよう更新します。 C て、は , これは , base = &baseCfirst] [ 1 ] ; という文により , 容易に実現て、きます。このようにして探索の起点を移動した後て、 , 同じ処理サイクルを再び開始します。すなわち入力文字を求め , 合致を調べ , その結果に従って配列ポインタを更新します。処理は最終的に , 探索成功 , 失敗 , またはアボ、一トて、終わります。こて、ご紹介した inc search( ) の実行効率は , 配列のサイズがあまり大きくなければ十分て、す。しかし項目数が数百にもなる配列に応用するときには , いくつかの変更が必要て、す。たとえば現状て、は get range( ) は線型探索を使っていますが , 配列が大きい場合は二分木探索を使い , インデクス範囲が 100 以下になれば線型探索に切り替える , といったくふうが必要て、す。また探索文字列をエディットて、きる機能を , 盛り込みたい場合もあるて、しよう。いずれにしても , ここに示したルーチンは , あなたのニーズに , 十分に簡潔て、 , そして明快に応えてくれるものだと思います。 Jim Kerr 氏は元数学教授て、 , 現在はカリフォルニア大学サンタクルーズ校て、計算機科学を学んて、います。彼のおもな関心は , コンパイラの設計と言語理論て、す。

6. 月刊 C MAGAZINE 1990年4月号

高速化とノヾフォーマンスアナライサ野口修男プログラムを作成し , 実行してみると期待どおりのスピードで動作しない , 時間のかかっていそうなところにあたりをつけて書き直すが , たいしてスピードが上がらプログラマならだれでも経験したことがあるはずです。パフォーマンスアナライサとしては UN Ⅸのプロファイラが知られていますが , DOS 上では実用的なものがありませんでした ( UN Ⅸのプロファイラが実用的かどうかは疑問の残るところですが ) 。 DOS アナライサ rlnside! 」は従来のプロファイラより機能的に一歩進んだプログラムです。 , こでいう「パフォーマンス」という単語はたんに英語でのスピードというよりも , もう少し大きな概念を表しています。日本語の「性能」に近い意味がこめられています。今回はプログラムの高速化を中心に [lnside! 」がどんな場合に役立つかを実践的に解説します。卩 nside ! 」には QA の分野でも役立つ機能があります。この方法論は C 言語に限定されませんが , コードは MS ー C を想定しています。また , 最初にお断りをしておきますが , この記事を読んだ途端にプログラムのスピードが 2 倍になるようなマジックはありません。こに記載した高速化の手法は常識的なことばかりです。違いはいかに計測するかにあります。いつ「 lnside! 」を使うか誕十 / プロトタイピンク段階での高ヒに対する考慮プログラムの高速化を考えるのは , ある場合には設計者てあり , またプログラマ自身が実際のコーディングのときに変史 / 追加 / 削除を行うこともあります。「 lnside ! 」は設計者には役に立たないてしよう。なぜなら , 設計者は経験と理論を駆使して机上て、設計するのが仕事だからて、す。しかし , 「 lnside! 」はプロトタイピングの段階からは確実に役立ちます。プログラムが完成に近づいてから行う高速化の多くは , ほとんどがモジュール内部に限定されます。したがってグローバルな最適化に比べてあまり効果がありません。効果を増すために , モジュール構成などを変更すればかなり大規模な変更に発展する可能性があります。設計段階て、はなかなか実行時間の予測は難しいのてすが , プロトタイヒ。ングの段階て、は「 lnside! 」を使いマイクロ秒単位の時間計測が可能になります。この段階て、かなり入念な最適化を行うべきてしよう。プロトタイヒ。ングの段階て、正確な実行時間とともに行 / 関数単位の実行回数もチェックし , 繰り返し文の繰り返し回数に誤りがないかなどのバグを取り除くことも可能て、す。この段階て、のファインチューニングは , 最終製品に近いものがてき上がってからプログラム全体のスヒ。ードを測って行う場合よりも大きな意味があります。また , 全体の実行時間の計測 / 修正に要する時間 ( ターンアラウンド ) は , プロトタイピングの場合に比べて数倍から数十倍を要することからも , プロトタイピング段階てのファインチニングは明らかに効率的なはずて、す。もしこの段階て、パフォーマンスが不十分だとプログラマが判断した場合には , 設計者との相談によって設計変更を余儀なくされることもしばしばあります。全モジュールリンク後のファインチューニング各モジュールまたは機能ごとのプロトタイプが完了すると , 全モジュールをリンクして製品の初期段階がてき上がります。プログラマはもう製品がてき上がったとよくいいますが , 実際にはこの段階から製品出荷まて、の時間 / 労力が相当にかかります。いくらプロトタイビングて、ファインチューングしても , 最終製品はなかなか希望するスピードに達しないものて、す。なぜか ? プロトタイピングの段階ては一連のプログラムの流れをすべてチェックてきないからてす。たとえばあるメニューからあるパラメータを設定し , この設定にしたがってランしてみると , 別の設定の場合とはパフォーマンスが大きく異なることがあります。その大きな要因のひとつがデータてす。プロトタイプの段階て作成てきるデータの種類 , および大きさが限られているのが通常て、す。なぜなら , その段階てはデータ作成ツールがまだ完成していないために , マニュアルて作成しなければならないからてす。データの種類 , 大きさによってパフォーマンスに大きな違いが生じます。さらにディスク上のデータの分散化も大きな要因てす ( ここても「 lnside! 」の DOS コール解析てファイルの RD / WR に要する時間の違いを Conference Room 135

7. 月刊 C MAGAZINE 1990年4月号

し , さらに ③挿入する要素の next ポインタ A3 ④挿入する要素の back ポインタ A2 としておけばいいのて、す。そして , この場合 , リストボインタは挿入された要素を指し示すのが自然てすから , ひとつ進めて、、 ls A4 クとします。また Fig. 3 は Fig. 2 の状態からリストボインタをひとつ前に移動したうえて、その位置の要素 ( = A2 ) を削除する場合を示しています。この場合は , ① ls の back ポインタが指し示している構造体 ( = AI ) の next ポインタを A4 に ② ls の next ポインタが指し示している構造体 ( = A4 ) の back ポインタを AI に書き換えるだけて、十分て、す。リストボインタはひとつ前に進めて , A4 を指し示すようにするのが自然て、しよう。すなわち、、 ls ls ー > next" とします。 ( 3 ) 例外処理リストの初期状態て、は , 要素はなく , NULL 〃て、すから , 最初の 1 個目、、 ls の要素を挿入するのは例外処理にしなくてはいけません。たとえば , アドレスが AI の要素を挿入する場合 , ① ls = AI ・② ls— >next = NULL ③ ls— >back = NULL リストの先頭や末尾に挿とします。また , 入する場合は , back ポインタや next ポインタを NULL とする処理が必要になります。プグラミングの実際明しておきます。タなどが代表的な例て、す。まず , 第一にこのポイントは「マルチリスそこて , このライプラリて、は , open ト」にするということて、す。これは , ひとつ以上見てきたように , アルゴリズムは比 list, close list という関数て、 , あたかもフ較的簡単て、す。自分て、図を書いてみながらのアプリケーションプログラムて , ふたっァイルのようにリストを開いたり閉じたり考えると理解しやすいて、しよう。て、はどの以上のリスト構造を同時に操作する必要がて、きるようにしました。同時に開けるリスあるのて , これはとても重要て、す。たとえようにしてこのアルゴリズムを実現するか , トの数は , いちおう最高 20 本としてありまば複数のテキストを同時に編集するエディ次にプログラミングの実際について少し説す。そのため , Fig. 4 に示すような構造体を Fig. 2 要素の挿入 NULL A3 A4 NULL ( 1 ) ( 3 ) ( 4 ) ( 2 ) A2 リストボインタはからばに移動する A4 ( 3 ) ( 4 ) Fig. 3 要素の削除 AI NULL A4 A3 A4 N U LL リストボインタはからに移動する 1 4 CMAGAZINE 19 4 140

8. 月刊 C MAGAZINE 1990年4月号

ne Oint Edition 0 P て、す。ラインの端がどこに位置するかによって , Fig. 2 の 9 種類のアウトコードのどれかが決まります。両端のアウトコードの AND をとって , 0 て、ない場合はラインを引く必要がありませんにのとき引こうとするライン囓は直線 U よりも上 , もしくは D よりも下 , L よりも左 , R よりも右にその両方の端をもつわけて、す ) 。 AND の結果が 0 になった場合は , どちらかはまだわかりませんから , アウトコードによって直線を分断します。たとえば , アウトコードの最後の桁が 1 の場合は , その端はウインドウの左にあるわけて、すから , その端を直線 L と引こうとする直線の交 3 点に移動し , その点のアウトコードを得ます。これを両端て、繰り返していけば , 最大第 4 回の繰り返しののち , 次のふたつのどちらかの結果が得られます。 ①アウトコードが双方とも 0 になる ②双方のアウトコードの AND が 0 以外になる ①の場合は安心して両端を結んて、直線を引けばいいて、すし , ②の場合は直線を引かずにリターンしてよいわけて、す。 C によるコーティング例 C 言語によるコーディング例を List6(cIip) に示します。 List6 の 76 行の c cline( ) 関数がクリッビングっきライン関数て、す。 82 行目て、アウトコードの AND が 0 て、ないとき , 何もせず戻ります。そうて、ない場合 , ループに入り , 前にあげた条件①か②のどちらかになるまて、 , 切断と AND を繰り返します。① のときだけ 92 行のライン描画を実行します。次にこれをアセンプリ言語化したもの (cline. asm) およびウインドウ設定関数 (setwindow) のソースリストをディスクに掲載しておきます。最適化がこうじて C 言語プログラムの List6 とはほとんど対応づけがてきていませんが , 基本的には , 同じことをやっていると思ってください 0 List 5 68 : even 69 : 心 11 : 76 : even 77 : n 1 011 : 80 : even 81 : 心 01 : 82 : 87 : even 88 : n 1 3 : 90 : 92 : 93 : 94 : 95 : 96 : 99 : 100 : 101 : 102 : 103 : 104 : even 105 : 心 77 : 106 : 107 : 108 : even 109 : n17: 110 : 112 : 114 : ende : 115 : 116 : 1 18 : even 1 19 : 心 9 : ror 120 : adc 121 : ー 00P 122 : 123 : out 124 : endproc 125 : even 126 : shift2 dw 127 : shift dw 128 : 129 : setA し : 130 : 131 : 132 : @dy, @s n 1 0 11 : 右上がり 4 5 度 setAL @dy dx,-81 CX short n101 _setA し CX dx, 79 test call neg mov lnc JCIP : jz : 右下がり 4 5 度 call lnc mov stosb ror adc IOOP JIDP @Y, dx 心 0 1 short ende dS, CX ; push CX, ax : @dx equ DX だから必要なし dx, @dx ;dx:ax=dx*2-16 ax, ax ; d i v @ady CX ;st=dx * 2 ・ 16 / ady @st, ax : POP ax, CX CX, dS @dy, @s n 177 : 右上がり 4 5 度以上 0 r 真上 setAL @dy @dx, ー 81 CX short 心 7 setA し @dx, 79 CX mov mov mov xor d i v mov mov mov test JZ call neg mov lnc JLIP call mov IIIC stosb add JC add ー 00P : jz : 右下がり 4 5 度以上 0 r 真下 @s, @st n 19 @y, @dx n 17 : キャリーが立っことは少ない a l, ah 7ch, mov out endproc ;grcg-off 1 ー 0 ) cd 0 ) 0 ー 'grcg-off 32768 , 16384 , 8192 , 4096 , 2048 , 1024 , 512 , 256 128 , 64 , 32 , 16 , 8 , 4 , 2 , 1 : ビットシフトテープル : ドットセットマスク A しのセット ()H のリセット ) ds, bx bx,7 bx, 1 mov and shl 超高速グラフィックライプラリ 69

9. 月刊 C MAGAZINE 1990年4月号

この手順に従って生成したコードが List2(A) て、す。ここて、 , ( 1 ) については異論はないと思いますが , ( 2 ) ~ ( 4 ) については改良の余地があります。 ②のようなケースて、は , word ptr i, 1 mov とすれば , 1 命令て、すむはずて、す。また , 同様に ( 4 ) のケースて、も , bx, word ptr p 用 OV word ptr Cbx] ユ mov とすれば , 2 命令にまて、縮まります。しかしよく見ると , この最適化版て、は代入式の値が正しく設定されないことがわかります。 Cm( そして C ) の定義て、は , 代入された値 ( 右辺 ) がそのまま代入式の値になります。つまり , 「 i=j 」という式を実行した直後には , AX レジスタには変数 j の値が入っていなければなりません。これらのケースて、は , AX レジスタをバイバスしてしまっていますから , 明らかに規則違反て、す。こて、見方を変えてみましよう。代入式は「式」とはいうものの , たいていのケースて、は実質的には「文」として扱われています。いい換えれば , 代入式の値が使われるケースはまれて、 , ほとんどの場合は「代入する」という副作用のみが必要とされ , 代入式の値は無視されます。これは , ほかの代入演算子についても同様のことがいえます。そこて、 , ▽代入式の値が必要とされる場合 ▽副作用のみが必要で , 値は不要の場合というふたつのケースを区別して , 後者の場合についてのみ , 最適化を行うようにします。そうすれば , 「代入文」として使われるケース ( ほとんどがこのケースに該当する ) て、は効率のよいコードが生成され , 値が必要とされる「代入式」て、は正しく値が設定され , すべてがまるく収まることになります。値が必要とされない代入文用に最適化したコードを List2 ( B ) に示します。単純な代入式のコード生成を行う関数は genas sign( ) て、す (List3) 。 78 CMAGAZINE 19 4 代入式のオプジェクトコード ※変数 i , j, p は次のように定義されているものとする。 i, j, *P, a [ 10 ] : int (A) 代入式の値が必要となる場合 ax, word ptr -j word ptr _i, ax List 2 ( 1 ) i mov mov ( 2 ) 、 i mov mov ax, 1 word ptr _i,ax ( 3 ) *p mov push 田 OV POP mov ( 4 ) *p mov push mov POP mov bx, word ptr -p bx ax, word ptr ・ 1 [di],ax 0 (B) 副作用のみが必要で , 代入式の値は不要なケース ( 1 ) i ax, word ptr -j mov word ptr -i,ax mov 0 2 word ptr —i, 1 ( 3 ) *p mov push mov POP mov ( 4 ) *p mov mov bx, word ptr -P bx ax, word ptr 1 [di],ax bx, word ptr -P word ptr [bx] , 1 代入式のコード生成 genassign( ) generate code for assignment * / genasslgn genassign(EXPR *P' bOOl needValue) 2 : v 0 i d *left = p->e_left, *right ニ p->e-right; 4 : EXPR 5 : if (isVariable(Ieft)) { 6 : if (isConst(right) & & ! needValue) 7 : right->e-value) : gencode ("YtmovYt%v, %dYn" left, 8 : else { 9 : genexp(right) ; gencode ("YtmovYt%v, %rYn" List 3 p->optype) : left, } else {

10. 月刊 C MAGAZINE 1990年4月号

① List 1 bms. C List 1 6 : 7 : #include <stdio. h> 8 : #define DEBUG 9 : 10 : #ifdef DEBUG 11 : nain() 13 : Char *key, *text; int c コ ocsu 魲 0 : key="PCG" text="CMZ 円 PCPCGABPCCEXPCG ”・ 01234567890 3456789 事 / loc=bn-search(key, text) : 20 : locsun 十 =loc: printf("Key word is XsYn".key) : 21 : printf("text isYnXsYn", text) : 22 : printf("location is XdYn",loc) : 23 : whi 厄 00C > = の { 24 : loc=bn-search(key. text+locsun + 1) : 25 : if (loc く 0 ) break; ー ocsu 引 oc + 1 : printf("location is XdYn",locsun) : 28 : 29 : 30 : 31 : #endif 32 : 33 : bn-search(key. text) 34 : Char *key, *text : int i, cur-pos. key-length. skip-array(256) : 36 : 37 . initialize skip array 38 : key-length=strlen(key) : 39 : for ( i : 0 : i く 256 : i + + ) { 40 : skip-array[i]=key-length; 42 : fo 「 (i=0; i<key_lengthä + + ) { skip-array[(int)key[i]]=key-length-i -1 : 43 : 44 : 45 sea rch key word 46 : cur_pos=O; while (cur-pos く strlen(text)) { if (skip-array[text[cur-pos + key-length-l]] く key-length) { 48 : 49 . found a letter in the key word * / cur-pos 十 =skip-array [text[cur-pos 十 key-length-l]] : 50 : 52 : if(key[i] !=text [cur-pos + i)) break; 53 : if (key[i]= 54 : ・ \ 0 ・ ) return (cur_pos) : 55 : e ー se 56 : 57 . skip 58 : else cur_pos + =key_length; 59 : return ( - 60 : Boyer-Moore Sea rch ・ 89.7. 26 f 「 0 田 DDJ July ・ 89 F. Awa / * found り / * fail * / つの比較てキーワードを見つけられれば , 、、 IIIIIIIIIAAAI" ′から、、 AAAI" してリンクして用いる。そのロケーションを返して終了する。キーを探すようにキーワードに重複が多い場合 Fig. 3 にコンパイルの方法を示した。外かワードと違う部分が見つかれば , 1 文字ずつら呼ばれる関数は , bm search()< ふたっや , 探すべき文字列にキーワードの最後のの比較は中止され , 位置をひとつ進めて , の引数をとる。第 1 引数はキーワードて、 , 第文字 ( スキップ 0 ) が多い場合は不利て、 , むし 2 引数として与えられたストリング中からころ順々に探すほうが速い場合もあり得る。もとのループに戻る。比較した文字がキーワードの長さより小さらに Boyer ー Moore 法て、はスキップ用のれを探し , 最初に見つけたロケーションをさくない ( 等しい ) 場合は , キーワードはな配列を用いているのて、 , 複数のキーワード返す。を同時に検索することが効率的にて、きそういのて , その数 ( = キーワードの長さ ) だけ DEBUG を定義したままコンパイルし , とばせばよい実行した結果を Fig. 4 に示す。だ。すなわち , キーワードに含まれる文字このように探して , 最後まて、行った場合にはそのうち最小の数を割り当て , 含まれまとめはキーワードはないのて、あるから , ー 1 を返ない文字にはキーワードの中のもっとも短すようにした。い長さとすればよい。実際にどの程度速く Boyer-Moore 法はスキップ用の配列を必要とするだけに , 記憶域と初期化の時間がなるかは試していないコンバイ ) 順と呼び出し方法余分にかかる。しかし , キーワードの長さソースファイルを BMS. C としてセープすだけ比較をさばれるのて、 , トータルて、は順る。前節て、も述べたが , #define DEBUG 次先頭から比較するより速い場合が多いだろう。キーワードが長いほど有利て、あるこを残せば , 単体テスト用の実行形式を作る。とは容易に想像て、きる。 DEBUG が定義されなければ , BMS. OBJ と Fig. 4 実行例 Fig. 3 コンバイルの手順 #define DEBUG のまま Key wo 「 d is PCG BMS. OBJ—>BMS. EXE ( 例題を実行 ) text iS CMZPIPCPCGABPCCEXPCG BMS. C location is 7 BMS. OBJ ( リンクして使う ) location is 1 7 #define DEBUG を消去 0 参考文献 1 ) COStas MeniCO : Faster String Searches, Dr. D0bb's Journa し # 153 ′ pp. 74 ー 75 ( 1989 ) 2 ) Boyer. R. S. Moore. J. S. : A Fast string 劑 go 「 - ithm,CACM,Vol.20,No.1 の pp. 762 ー 772 ( 1977 ) 3 ) Knuth,D. E. Morris,J. H. Pratt,V. R. : Fast Pat- tern Matching in Strings,SlAM J . of Comput. Vo に 6 ′ No. 2 June, pp. 323 ー 350 ( 1977 ) 4 ) Davies. G. Bowsher. S. : Algorithms for Pattern Matching,Softw. Pract . Exper,VOL . 16. NO. 6 ′」 une pp. 575 ー 601 ( 1986 ) 144 CMAGAZINE 19 4