データ - みる会図書館

1. 月刊 C MAGAZINE 2001年7月号

TabIe 2 0 「 acle で利用できるデータ型ァータ CHA 日 ( サイズ ) VA 日 CHA 日 2 ( サイズ ) NUMBER( 総桁数 , 小数部桁数 ) DATE BLOB 日 AW ( サイズ ) LONG ない項目のことです。つまり , これを決定プルを作成するための SQL 文は次のようにープルを作成しておきましよう。このテーでは , SQL * Plus などを使用してこのテ主キーにすることにしました。すが , 今回は簡単のため「ソフト名」のみを項目をまとめて主キーとすることも可能で設定すべきと思います。具体的には複数のあってもいいことはないと思うので , 常には , 重複レコードが発生することは , 害は複数発生することになります。私の経験でしないと , まったく同じ内容のレコードがなります。 create tab 厄 GAME—DATA ( TabIe 3 GAME_DATA テーブル明 2000 文字以下の固定長文字列 4000 文字以下の可変長文字列数値データ日付データ 4G バイト以下のバイナリテータ 2000 バイト以下のバイナリデータ 2G バイト以下の可変長文字列プページの HTML になります。このページーリンクから「データ入力」 , 「デーのハイノヾタ参照・編集」のページを出力する CGI を起動できるようになっています。 List3 はデータベースの接続を行う処理を簡単に記述できるようにするため , 関数 ( K M_ConnectOracIe) を定義しています。デ項目名項目内容 NAME ソフト名 COMPANY 会社名 R_DATE 発売日データ型文字列型 64 バイト文字列型 32 バイト日付型ータベースの接続時には環境変数の設定やユーザ名 , パスワードの指定などがあるため , このように他のファイルに関数として記述していると便利です。 List4 は「データ入力」ページの処理を行う CGI です。まず , 最初のほうで読み込んでいる「 mperLlib. pl 」という見慣れないファイルがあります。これは PO もしくは GE T されたデータを受け取る処理を行うモジュールです。 require した後で , 呼び出して NAME COMPANY R—DATE 文字コード varchar ( 64 ) primary key, date varchar ( 32 ) , List 2 ゲームソフトデータベースのトップページ (index. html) <html> く head> <meta http-equiv="Content-Type content= "text /htm 嶹 charset=nshift—j 土 s ” > く t 土凵 e 〉ゲームソフトデータベースサンプルく / ti 凵 e > く /head> く body bgcolor="#ffffff" し ext = ” # 000055 ”〉く hl > ゲームソフトく br> データベースサンプルく / hl > <u くは > く a href=mregist.cgi"> データ入力く / く / は > くは > く a href="data ・ cgi"> テータ参照・編集く / a > く / は〉く / u く div a は gn = ″て土 ght ” > & copy 2001 KIT-M く br» <a href="mai Ito:masa26@naa.att.ne ・ jp">masa26@naa.att.ne.jpく/diV> く /bodY> く /html> List 3 データベースへの接続処理用関数 ( connect ー db. pl) # CONNECT DB ー Oracle データベースへの接続処理 by KIT-M あともう 1 つ決定しておきたいことがあります。データベースに格納する文字列型データの文字コードについてです。日本語を格納することになるので , たいてい EUC コードか Shift JIS コードのどちらかになると思います。本来 UNIX は EUC コードのほうが相性がいいと思うので EUC を選択すべきですが , 今回は ShiftJIS コードを使用したいと思います。理由は私の好みです。・・・すみません ( ^ ^ ; 。なお , 今回は必要ありませんが , もし文字列コードの変換が必要な場合はその用途によく利用される n 灯などのライプラリを使用すれば簡単に行えます。ソース解説 List 2 はゲームソフトデータベースのトッ実際のソースを List2 ~ 5 へ示します。 1 20 C MAGAZINE 2001 7 use DBI; $ENV{'ORACLE-HOME') $ENV{ 'NLS-LANG') = '/export/home/oracle'; = 'japanese—japan. ja16sjis'; # 文字コードは SJIS # ' japanese—japan. ja16euc'; # EUC コードの場合はこれ $ENV{ 'LD—LIBRARY-PATH' } '/export/home/oracle/lib'; # LINUX 用 $dbh $sth # KM—ConnectOracIe - Oracle DB への接続 sub KM—ConnectOrac 厄 } # KM—ConnectOracl e ex 辻 ( 1 print STDERR. $s; $userid, "$DBI: :errstrn ・ま j0 土れ ' if ($dbh = {P て intError = > 0 , AutoCommit => 0 } ) Ⅱ warn ”基 n ・ ' Nek0 ' 'KIT—M' $dbh = DBI->connect( 'dbi:Oracle:

2. 月刊 C MAGAZINE 2001年7月号

末尾から前に向かってたどっていくしかないのです。つまり , リストはテータを飛び飛びにアクセスするのには向いていません。ー連のデータを順番にたどっていくことしかできないのです。ですから , やはり " リストは配列よりも優れている ! " などとは言えないわけです。飛び飛びのデータにランダムにアクセスしたり , 何度も前後を行ったり来たりする場合は配列がよいでしようし , そうでなければリストを使って楽にコーディングするチャンスがあるかもしれません。 [ 注 4 ] 「 a ay [ 5 ] 」というのは「 * (array + 5 ) 」とまったく等価になります。要するに " array が配列の先頭を指すポインタで , そこから 5 っ先のメモリ位置にアクセスする”という意味です。リストはメモリ内でバラバラな位置に格納されているので , リストの先頭から 5 っ先のメモリ位置には全然関係のないデータが入っているのです。応用例・自己組織化探索さて , 前回で探索を取り上げたときに「自己組織化探索」という方法を紹介しました。データの探し方はリニアサーチと変わりませんが , 毎回見つかった項目を先頭方向に移動してくることで , 頻繁に検索される値が先頭付近に集まり , 結果としてリニアサーチによる検索が効率化される , というものです。前回紹介した配列版自己組織化探索では , Fig. 7 のように見つかったデータを 1 つ前に移動していくだけでした。本当は Fig. 8 のように見つかったデータをいっきに先頭まで移動させられれば理想的です。なぜそれができなかったのか。 List 6 を見てください。この処理だけで計算量オーダが 0 ( N ) になってしまうため , データ量が多くなれば効率化のための工夫がかえって逆効果になってしまうのです。これに対し , 先ほど述べたように , データを頻繁に削除・挿入する場合にはリスト構造が強力な武器になります。自己組織化探索をリスト構造を用いて実装すると , デ 82 C MAGAZINE 2 1 7 リストの中のテータの検索とデータの削除 #include く s セ d は b. # incl ude く stdio. い typedef struct tagListNode 。。 / * リストの要素 ( ノード ) を表す構造体 * / int data; / * この要素が持っているデータ * / struct tagListNode *next ー / * 次の要素へのポインタ * / struct tagListNode *prev; / * 前の要素へのポインタ * / } ListNode; 土 n し main(int argc, char* argv[ ] ) int buf; ListNode *firstnode, *newnode, firstnode = lastnode NULL; * thisnode , *removenode ー printf ( ”整数を入力して下さい ( 0 を入力すると終了 ) : ” scanf げ %d", &buf if(buf) / * 新たな入力があったら * / / * 新しいノードを作成 * / newnode = (ListNode*)malloc(sizeof(ListNode) ); if(buf ! = 0 ) scanf( "%d", &buf p て i f ( ″検索する値を入力して下さい : / * 検索値を入力 * / } while(buf ! = 0 newnode—>prev = NULL ・ firstnode = lastnode = / * これが最初の要素だった場合 * / lastnode = newnode; newnode—>prev = lastnode; ー astnode—>next = newnode ー / * 既にあるリストの末尾に新しいノードをつなげる * / if い astnode ! = NULL ) newnode->next = NULL ・ newnode->data = buf; if(thåsnode = = ) break; free ( thisnode lastnode = thisnode->prev ー thisnode->next—>prev = thisnode->P て ev; if(thisnode->next ! = NULL) firstnode = thisnode->next; thi snode->prev->next = thisnode—>next; if(thisnode->prev ! = NULL) p て土 n ( ”入力された値の中に宅 d が見付かりました。ノードを削除します。” , buf); if ( thisnode->data = = buf ) for ( thisnode = firstnode; thisnode ! = NULL; thisnode = thisnode-»next ) / * 最初に入力した値の中から検索し、見付かったら削除 * / prin し f ( d は入力されていないか、あるいは既に削除されています。″ , buf); て eturn EXIT—SUCCESS ー free ( removenode 潺 thisnode = thisnode->next ー removenode = thi snode ー for(thisnode = firstnode; thisnode ! = NULL; ) / * 残ったノードを全て削除 * / } while(buf ! = 0

3. 月刊 C MAGAZINE 2001年7月号

画像データの圧縮画像データに限らずデータの圧縮を行うには , 元の情報に「統計的な偏り」がなければなりません。「統計的な偏り」とは , あるデータ値がほかのデータ値に比べて登場頻度が大きい , データの並び方に特徴があるなどの状態を指します。ですから , 完全にランダムに並んだデータは , どうやっても圧縮することはできません。このように圧縮の効果が期待しにくいデータを「冗長性の低い」データといいます。ただ , 画像データは , 一般的に「冗長性の高い」データであることが多いため , 何かしらの圧縮方法により , データ量の削減を図れます ( 冗長性については , 情報理論 ( シャノン理論 ) の中で数学的に述べられています。興味のある人は文献をあたってみてください ) 。また画像データには , 一般のデータとは異なる特徴が 1 つあります。それは , データの一部が変わってしまった場合でも , 元の情報をある程度保持できる点です。文書などのデータでは , たとえー部でもデータが変わってしまうことは許されません。変わってしまった場合 , そのデータそのものの価値がすべて失われてしまう可能性もあります。しかし , 画像データでは , 1 画素の値が変わってしまってもあまり問題にはなりません。 1 画素だけでなく全体の画素値が多少変化したとしても , その差が 1 , 2 程度であれば , その差異を見つけること Fig. 3 ランレングスを示すコードが出現したときの処理元データ FF 0xFF 1 」テータ長が 1 であっても , ランレングス符号として出力する。この場合 , 元のデータよりも大きくなってしまうは難しいでしよう。つまり , 画像データの圧縮では , 元のデータをある程度変更して圧縮しやすくすることが許されていることよって , 画像データの圧縮方法には大きになります。 Fig. 4 フルカラー画像の場合のデータ構成方法圧縮法も成り立っことになります。可逆圧完全に損なうことはないため , このようなータはデータが多少変化してもその価値をまいます。しかし , 前述のとおり , 画像デ縮は , 圧縮を行うと元データが変化してし性の高いデータだけです。一方 , 非可逆圧を行います。可逆圧縮が行えるのは , 冗長逆圧縮は元のデータを損なうことなく圧縮それぞれの違いは名前が示すとおりで , 可 1 つは可逆圧縮 , もう 1 つは非可逆圧縮です。く分けて 2 種類が存在することになります。縮は , 画像データに限らず , 文書・プログラムなど , あらゆるデータを対象にすることができます ( ただし , 元データの統計的性質によって , 有効に利用できるアルゴリズムは変わってきます ) 。一方 , 非可逆圧縮が適用できるのは , 画像・音声など一部のデータに限られます。可逆圧縮と非可逆圧縮とでは , 目的が大きく異なるといえるでしよう。可逆圧縮は , データサイズが多少大きくても , 元のデータを損なうことがないようにしたい場合に利用します。非可逆圧縮はその逆で , 元データの品質が劣化しても , とにかくデータ量を減らしたい場合に利用します。一般的に非可逆圧縮のほうが圧縮率は高くなります。非可逆圧縮は , 元のデータがお、分デをタ同じ色成分のデータだけを集めていく Pmacs 画像出力プラグイン Pm acs は主だった機能をすべてプラグインで実現しているグラフィックエデイタですが物そのひとつに画像出力用のプラグインがあります。このプラグインは D 旧形式の画像データを与えると , 対応する画像形式でファイルに保存する機能を持っています。 Pm acs 画像出力プラグインは , いくつかの関数から成り立っています。このプラグインの仕様は以下のとおりですが , 基本的な部分は画像ビューアで有名な「 susie 」のプラグインの仕様がべースになっているので , Susie プラグインの仕様を理解している方なら理解は容易だと思います。画像出力を行う関数は W ⅲ ePicture です。そのほかの関数は , プラグインを利用するアプリケーションに向けて , プラグイン情報を提供するためのものです。この中でアプリケーションにとってとくに必要なのは , Suppo mage によって提供されるサポートしている色数の情報です。画像フォーマットによってはフルカラーのみ対応しているものや 256 色の画像のみサポートしているものなどがあるので , プラグインに D 旧形式のデータを渡す際に , 適切な色数のデータを渡す必要があります。 TabIe A に Pmacs 画像出力プラグインを構成している関数とその仕様の説明を掲載します。パラメータの仕組みを含め , より詳しい情報がほしい方は , http:″www.asahi-net.or.jprgv9k-setg/ mado. html を参照してください。 1 0 イ C MAGAZINE 2001 7

4. 月刊 C MAGAZINE 2001年7月号

カリ画像処理を極める変化しても圧縮率を高めようという考えで行うのですから , 可逆圧縮のほうが圧縮率が高いならば , 非可逆圧縮の存在価値は皆無ということになります。 TabIe A Pmacs 画像出力プラグインの関数 int GetAddinInfo(int infon. LPSTR st 「 , int st 「 I) : 簡単な圧縮アルゴリズム ~ ランレングス符号化画像に対するデータ圧縮法の中で , もっ Add - in に関する情報を返す。この関数の仕様は Susie 曰 ug - in と基本的に同じだが , 引数によってプラグイン名 , 対応する画像フォーマットの拡張子などを返す。主にプラグインを利用するアプリケーションにプラグイン情報を与えるために利用引数する infono str strl 取得する情報番号 PIug-inAPlJéジョン 0 Plug-in 名 , バージョンおよび copy 「 ight 1 2n + 2 代表的な拡張子 (" *. JPG"" * . RGB"" *. 00 " など ) 2n + 3 ファイル形式名情報を納めるバッファバッファ長 ( byte ) 戻り値バッフアに書き込んだ文字数 ( 情報番号が無効の場合 0 ) int Supportlmage(void) : 内容戻り値プラグインを利用するアプリケーションのための情報を与える。アプリケーションはここで得られた情報を元に適切な色数の画像データを用意しプラグインに渡す必要があるサポートしている色数の情報。プラグインがサポートしている色数 ( 1 画素あたりのビット数 ) の情報を返す。以下の定数が定義されているので , これらの O 日をとった値を返すマクロ SUPPORT_32 SUPPORT_24 SUPPORT_16 SUPPORT_8 SUPPORT_4 SUPPORT_2 SUPPORT_I 実際の値 ② ( 8 ) ( 16 ) ( 32 ) ( 64 ) 256 65536 Full Colo 「 Full Color 色数 2 4 int W 「 itePictu 「 e(LPSTR *fname, unsigned int flag. BITMAPINFO * pHBlnfo, void * pHBm, FARPROC lpP 「 gressCallback, long IData,int a 「 gc, cha 「 *argv[ ] ) : 内引画像をファイルに出力する。この関数がプラグインのメインとなる。この関数に下記の引数のように D 旧形式で収納された画像データのヘッダ , およびビットマップテータを引き渡すと , 対応する画像形式でファイルに保存する。画像のセーブでは , 圧縮率の指定などバラメータを与える必要があるが , Pmacs プラグインではこのようなバラメータを最後の 2 つの引数 , argc, a 「 gv によって与える。これは C 言語の main 関数と同じで , バラメータの数とバラメータの入ったメモリ領域へのポインタを表している ( すべてのパラメータは文字列で与えられる ) 。この関数の先頭部分ではこのバラメータを解釈して指示されたとおりにセーブできるようにする必要がある数 fname flag pHBInfo pHBm lpPrgressCaIIback lData argc argv Save するファイル名 ( フルバス ) 追加情報 ( 現状意味なし ) 画像データ ( D 旧 ) ヘッダ情報へのポインタ画像データ本体へのポインタ途中経過を表示するコールバック関数へのポインタ。仕様は Susie のものと同じコールバック関数に渡す long データ。ポインタなどを必要に応じて受け渡せる引き渡しパラメータの数引き渡しバラメータ戻り値 0 : 正常終了 , それ以外はエラー ( 工ラー値は Susie プラグインに準拠 ) とも簡単なもののひとつにランレングス符号化があります。ランレングス符号化は , データ中に同じ値のデータが並んでいる場合 , その並びの数を記録していきます。たとえば , Fig. 1 のようにデータが並んでいる場合 , その下のように符号化を行います。このようにすれば , 同じ値が固まって存在するようなデータの場合 , データ量が少なくなることが期待できます。ランレングス符号化は基本的に可逆圧縮による圧縮方法で , データの「同じ値の部分が偏って存在する」という統計的性質を元に圧縮を行います。このようなデータは画像データ以外にはあまり存在しないので , ランレングス符号化は画像データ以外には適用されることは少ないでしよう。逆にいえば , 画像データであっても , 「同じ値の部分が偏って存在する」という特徴を持っていない画像データには適用できないことになります。写真などの自然画像では , 画素値は激しく変化しているので , ランレングス符号化の適用は困難です。ランレングス符号化は非常に簡単なアルゴリズムですが , それでもいくつかのバリ工ーションが考えられます。ここでは , データの表現方法に関して , いくつかのバリ工ーションを考えてみます。まず , それぞれのパターンによる圧縮結果を Fig. 2 に示します。この結果と以下の説明を見比べながら読み進めてください。なお , 以下の説明中で「データ長」とは , 同じ画素値が並んでいる部分の長さを指すものとします。 ①テータ値 + データ長の並びで表現するこのパターンでは , データの並びは , 常にデータ値とその並びのデータ長をひとまとめにして表現していきます。このパターンはデータ構造が非常に単純なので , 実装が簡単です。しかし , たとえ 1 バイト長のデータがあったとしても必ず 2 バイトを利用するため , 最悪のケースでは元のデータ量の 2 倍に増えてしまうことがあります。そこまでいかなくても , 変化の激しいデータの場合 , データ量が逆に増えてしまう可能性があります。ランレングス符号化は本画像処理を極めるアルゴリズムラボ 105

5. 月刊 C MAGAZINE 2001年7月号

アルゴリズム、入門フログラミン ~ 箱たくさんのデータを格納するために , 「配列」が配列に少し似ている , 強烈に便利な " データ構厘です。リストを使いこなせるようになると , よく使われます。けれども , 配列にも不便な点 " がいくつかあります。今回紹介する「リスト」は , データのかたまりの扱いが楽になります。リストとデータ構造第 3 回春日イ申弥 BorIand c + + 5.5.1 compiler 日本語版収録紀平拓男協力 : ポーランド ( 株 ) ( 有 ) スウイフト : りません。今回の「リスト」 , 次回以降で紹上に , 非常に便利なテクニックです。今回ァータ構造” ? 66 ーヾのテーマ「リスト」にいたっては , 知らなけ介する「スタック」「キュー」 , そして「マップ」「ツリれば損をする ! と断言してもよいくらいかなんていわれても , 配前回・前々回と , 探索や並べ替えといっ列しか知らない人にとっては「配列のほかもしれません。た、、アルゴリズム ( 方法 ) " を解説してきましにいったいどんな方法があるっていうの ? 」いくつあるかわからないた。今回は少し毛色を変えて , 「リスト」とと , なかなか想像がつきにくいかもしれまデータいう " データ構造 " を紹介します。・・いえいえ , いかめしい名前を聞せん。今回は抽象的なことを言っていても始ま大量のデータがあるときにそれを格納 ( 記いて緊張することはありません。どれもとらないので , いきなり具体例を出してしまてもシンプルな考え方です。そしてそれ以憶 ) しておく方法は , 何も配列だけではあ入力したいくつかの数値とその合計を出力する入力する数値の数を最初に確認する # 土 n 引 ude く stdio. h> #include <stdio. h> #include «stdlib. h> #include <stdlib. h> int main(int argc, char* argv[ ] ) #define NMAX 10 int main ( int argc , char* argv [ ] ) int buf, sum, count' n; int *array ー int buf, sum, count, n; / * 入力するデータの個数を最初に聞いて、必要なメモリを確保 * / int array[NMAX]; p て intf ( ”何個の数値を入力しますか : ” scanf ( 物 d ” , &count count = 0 ・ array = (int*)malloc(sizeof(int) * count); n = p て土 ntf ( ”整数を入力して下さい ( 0 を入力すると終了 ) : ” scanf ( d ” , &buf if(buf) array [ count ] = buf ・十十 count ー ) while(buf ! = 0 / * 合計値を算出 * / printf("-- 入力されたのは以下の数です一如” for(sum = n = 0 ・ n く = count; 十十 n ) , array[n] sum 十 = array[n]; printf( -- 以上の数の合計値は %d です。″ return EXIT—SUCCESS ー p て intf ( ”整数を入力して下さい ( 0 を入力すると終了 ) : ″ scanf ( "%d", &buf if(buf ) array[n] = buf; 十十 n ー } while(buf ! = 0 / * 合計値を算出 * / printf("-- 入力されたのは以下の数です一” for(sum = n = 0 ー n く count; 十十 n ) printf( d 基ビ , arraytnJ sum 十 = array[nJ; p て土 ntf ( 、 n - ー - 以上の数の合計値はです。跏” sum free ( array 潺 return EXIT—SUCCESS ー / 8 C MAGAZINE 2001 7

6. 月刊 C MAGAZINE 2001年7月号

LiIlllX PV0$ilIIlIlllIlg ハッシュテーブル操作関数の使用例 GHashTab 厄 * tabl table = g—hash—table—new( g—direct—hash' g—direct—equal TIPS Fig. 5 List 1 0 の実行の様子 $ rpm -qa --qf "%{NAME) %{VERSION) %{RELEASE)*nn kernel 2 . 2 .18 2 the size of table= 604 $ rpm -qa --qf "%{NAME) %{VERSION} %{RELEASE}*nn the size of table= 604 . /hash kerne ー . /hash ( 処理 ) g—hash—tab le—destroy( tab 厄 List オリジナルのハッシュ関数・比較関数を実装したい場合の例 static gu 土北 hash-func(gconstpointer key) fo て ( 辷の土く st ( s に土十 + ) { ( ke = も ) て e セ n guint val = gchar *str = (gchar*)key; val = (vaI<<4) 十 (val (guint)str[i]); return val; めんなさい , RPM がインストールされていトを処理するプログラムだったりします ( ごラム , インストールされている RPM のリスログラムになっています。実はこのプログをキーとしハッシュテープルに挿入するプつのトークンを読み込み , 先頭のトークン録 ) 。この例は , 標準入力から 1 行ごとに 3 を紹介します ( List 10 , 付録 CD - ROM に収次に , キー , データを動的に確保する例す。がないので比較的処理は簡単になっていまているため , メモリを動的に確保する必要ムです。この例では , 文字列定数を使用しに紹介した関数を使ったサンプルプログラ List 9 ( 付録 CD-ROM に収録 ) は , 今までります。ドレスをあらかじめ取得しておく必要があ ded ( ) によりオリジナルキー , データのアになります。 g_hash_table lookup_exten 解放しないままリンクを切ってしまうこと領域のみを解放し , キーやデータの領域を hash—table—remove ( ) を呼ぶとノヾケットのにメモリ確保している場合は , 不用意に g ー注意が必要です。もしキーやデータを動的すが , g_hash—table—remove ( ) の使用には TabIe 4 ハッシュテープレ操作関数 ( データの操作 ) 関数名 void g—hash—table 」 nse 「 t( GHashTable * hash_table, gpointe 「 key, gpointe 「 value); void g—hash—table—「 emove( GHashTable * hash_table, gconstpointer key); gpointe 「 g—hash—table lookup( GHashTable * hash_table, gconstpointer key); gboolean g—hash—table 」 ookup—extended( gpointer user_data); func. GHFunc GHashTable * hash_table, void g—hash_table_foreach( *value); gpointe 「 gpointe 「 * orig—key, gconstpointer lookup—key. GHashTable * hash_table, user_data); gpointe 「 value, gpointe 「 void ( * GHFunc) (gpointe 「 key, ハッシュテーブルにキー / データを挿入するハッシュテーブルからデータを検索する ( オリジナルキーハッシュテーブルのデータを検索するハッシュテーブルからキー / データを削除する / データの取得 ) GHFunc をもとにした全データの操作ハッシュテーブル操作関数 ( その他のテータ操作 ) TabIe 5 void g—hash—table-thaw(GHashTabIe * hash—table); void g—hash—table—f 「 eeze(GHashTable * hash—table); guint g—hash—table—size(GHashTabIe * hash—table); 関数名説明ェーブ丿レのリサイズを再開するェープレのリサイズを止めるァープレサイズを取得するないシステムを使っているみなさん ) 。各行は , 最初のトークンが RPM 名 , 2 番目がバージョン , 3 番目がリリースの文字列を持ち , コマンドの第 1 引数に RPM 名を指定すると検索し , 引数がない場合は全部のリストを表示するようになっています。たとえば , Fig. 5 のように実行します。そのほか , ハッシュテープルの関数として , テープルサイズに関係するものがあります (TabIe 5 ) 。最後に今回は , GLib が提供する機能の氷山の一角しか紹介できませんでしたが , まだまだ興味深い機能がたくさんあります。たとえば , 字句解析 (Lexical Scanner) , I/O 関連 , スレッドサポートなど , 大物がいつばいあります。リファレンスやソースコードを手がかりにしてハックしてみましよう。 1 28 C MAGAZINE 2 1 7

7. 月刊 C MAGAZINE 2001年7月号

力リ画像処理を極めるタでも , 3 バイトの並びで表現します。れにより , データ展開時に問題が発生することはなくなりますが , 0xFF が頻繁に現れるデータの場合 , データ量が元データより増えてしまう可能性が出てきます。号の始まりを示すコードとして利用するテ strncpy(str, "00XN",strI strncpy(str, ” *. RL2",strI strncpy(str, ″ RL2 ″ , s セ r い一 ③テータ長の頭 1 ヒットをランレングス符いため , 適用には若干注意が必要です。で登場頻度の少ない値というのは考えにくあります。画像データでは , あらゆる画像ドには登場頻度の少ないものを選ぶ必要がですから , ランレングス符号を示すコーータ形式この方法も , ②の方法と同じく , ランレングスが短いデータ部分は , そのまま出力します。違いは , データ長 + データ値形式での出力の際 , データ長部の上位 1 ビットをランレングス符号化を示すコードとするランレングス符号化による圧縮② ( ランレングスを示す符号を利用する ) List #include く windows. h> / * 変更すべきポイント * / #include く stdio. h> List 2 0 case 8 : switch(dep) { #def ine SUPPORT_I #def ine SUPPORT_2 #define SUPPORT_4 #def ine SUPPORT_8 #def ine SUPPORT—16 #def ine SUPPORT_24 #define SUPPORT—32 char pbuf[256]; 1 2 4 8 16 32 64 /*void xvbzero(), len) char * 町 size—t len; fo て ( ー厄 n > の len--) * s 十十 = 0 ・ int WINAPI GetAddinInfo(int infon , LPSTR str は n に return 0 ー default: break; case 3 : break; case 2 : break; case 1 : break; case 0 : switch(infon) { 土 n セ strl ) maxx=()x + 3) / 4 * f0 て ( 辷 my -1 洋 > = の土ーー ) { output—raster ( fp , &img [ 土 *maxx ] , mx if( IpprgressCaIIback) lpprgressCallback(i,my,0); fu Ⅱ col or=FALSE; break; default: MessageBox(NULL,DNOt support! % ” ERR ”田一 OK return 1 ー if( lpPrgressCaIIback) lpPrgressCaIIback(my,my,0) fc lose ( fp getRLE ( byte *img は n し x は n セ mx , int lim はれヒ *run , int *code ) return px ー px 十十一 px 十十一 *code=img [ px *run=l ー int px; while(px«mx & & *code==img[px] & & *run<lim ) { strncpy(str,"RunLength saver Ver0.01 By Kz",strl) デ return SUPPORT—8; int WINAPI supportlmage(void) return str ー en ( str if (IpPrgressCallback) IpPrgressCaIIback(0,O,0); if( (fp=fopen( (char*)fname,"wb") )==NULL) て eturn FALSE; dep=bmih->biBitCount ー my=bmih->biHeight; mx=bmih->biWidth; img=pHBm ー colmap=pHBInfo—>bmiColors; bmih=(BITMAPINFOHEADER *)pHBInfo; int temp ー int mx,my,maxxßep; int fu 日 col 0 土 n し土 , byte *img; RGBQUAD *colmap; BITMAPINFOHEADER *bmih; FILE *fp; FARPROC lpprgresscallback,int ac,char *av[ ] ) BITMAPINFO *pHBInfo,void* pHBm, unsigned 土 n セ f lag , LPSTR *fname, 土 n に WINAP I WritePicture ( int output—raster(FILE *fp,byte *img, int mx) fputc ( code , fp fputc(run,fp); fputc(Oxff,fp); se { fputc ( code , fp fputc(0x02 ,fp); fputc(0xff ,fp); else { fputc ( code ,fp fputc(code,fp); if(code!=0xff) { else if(run==2) { fputc(code,fp); fputc(0x01,fp); fputc(0xff,fp); else { fputc(code,fp); if ( code ! =Oxff ) { if(run<2) { //MessageBox(NULL,pbuf,"MES" 靆田一 OK //sprintf(pbuf , nx=%d run=%d code=%d" ,x,run,code); x=getRLE(img,x,mx,0xff ,&run,&code); while(x く皿) { //MessageBOX(NULL,pbuf, ” ES ”川 B ー OK //sprintf(pbuf, ” d % x=0; int run , code; 画像処理を極めるアルゴリズムラボ 107

8. 月刊 C MAGAZINE 2001年7月号

第 22 回画像処理を極める画像圧縮アルゴリズム① 画像圧縮の基本昌達 K'Z 精密になればなるほど膨大なデータ量種類やプログラムの種類によってさまざまなものが存在します。今回から数になる画像データ。これをうまく運用するために : そのデータを圧縮してデ回にわたり , 画像圧縮について取り上ータ量を削減するのがほとんどです。げます。今回は画像圧縮の基本を扱い画像データの圧縮方法は , その画像のます。に強いもの , 逆に CG 的な画像に強いものしいでしよう。このように , 圧縮アルゴリはじめにズムの処理効率も考慮すべき場合もありえなどです。逆にいえば , あらゆる画像を最適に圧縮できるようなアルゴリズムは存在ます。場合によっては , その画像に最適なしません。また , 圧縮率や画質だけでなく , アルゴリズムを新たに構築する必要がある画素の集まりによって表現されるビット処理速度が問題となる場合もあります。ゲマップ形式の画像データは , 非常に表現力かもしれません。が高く , イラスト的な絵から写真などの自ームなどで用いる画像でも , そのままでは本稿では , 今回から数回にわたって , 画データ量が大きいので圧縮を施すことがあ像圧縮の基本や比較的よく用いられる画像然画像まで , あらゆる画像に対応することります。その場合 , データの復元処理にか圧縮アルゴリズムを紹介していきたいと思ができます。さらに , 画素数を上げていくかる時間ができるだけ短くなることが望まいます。ことにより , 細部までも再現することが可能です。しかし , その表現力の高さとあい Fig. 1 ランレングス符号化まって , データ量は非常に大きなものとな元データります。たとえば , 今の PC の一般的なディスプレイサイズ 1024X768 の画像でグレースケールや 256 色のみを考えた場合でも , データ量は 768K バイトに達します。これがフルカラーとなると , いっきに 3 倍に膨れ上がります。精密さを求めるために解像 Fig. 2 ランレングス符号化の表現方法度を上げていくと , データ量はさらに増加元データします。このように画像データは , データ量が非常に大きくなるため , そのままではデータの保存 , 運用が非常に困難です。ゆえに多くの場合 , 圧縮処理を施して , データ量を削減してから利用する場合がほとんどです。画像データの圧縮については , 初期のころからさまざまな方法が考えられています。それぞれ得意とする画像の種類 , 目的が異なります。たとえば , 写真などの自然画像 00 1 1 2 2 2 1 1 1 1 1 1 1 圧縮データ 2 2 2 1 1 1 1 1 1 1 1 1 1 方法① 3 1 方法② FF 4 1 方法③ x84 1 3 2 FF 3 FF 5 ↑ FF 4 1 0 3 X85 1 X83 2 0 x84 1 103 画像処理を極めるアルゴリズムラボ

9. 月刊 C MAGAZINE 2001年7月号

技術を知って実践しよう ! ネットワークプログラミングのアトリエロ 2 当葺第本連載ではプログラミング言語や開発環境を問わず , さまざまなネ , トワ ' = を ! 第 3 朝象 4 朝ラムを作りたいときにどのようにすればいし、のだろう」というときにお役、 4 き、受誉 0 に立てる内容をお届けします。今回は , Web サイトのさまざまなサービスを提供する CG にデータベース操作を伴う処理の作り方について , Perl& 0 「 acle データベースを使った実例を示しながら解説します。 Per による CG に OracIe データベースを扱う KIT-M (masa26@naa.att.ne.jp, http://macosx2.ncs.gr.jprmasa/) て読み進んでください。なお , 今回 Oracle と DBI, DBD::OracIe モジュールはすでにインストール済みという本稿を執筆するにあたり , web サイトでそれでは , このデータベース構築に使用前提で解説していきます。そのため各インデータベースについて検索してみました。するソフトウェアなどについて説明しましストール方法については解説しないので , とてもたくさんの結果が出てきます。声優よう。ご了承ください。のデータを名前で検索できるものや料理の今回はデータベースとして Oracle を使用分類により料理のレシピを検索できるもの , します。 OracIe は Linux や Sun などで使用で昔発売されたゲームソフトについて調べらきるもので , 別のマシンにあるプログラムれるものなど , いろいろあるようです。仕からデータヘアクセスすることもでき , なデータベースのメリットというと , レコ組みもさまざまです。たとえば , データのかなか便利なデータベースです。本稿ではードの検索 / 抽出の速さをあげるかもしれ数だけ HTML ファイルを直接記述している OracIe を対象として解説しますが , Postgr ません。たしかにそれもありますが , もっ単純な構造のものもありました。百件程度 es や MySQL などでも同じ API を使用していと重要なことがあります。データベースののちょっとしたデータ数の場合なら , このます。ほかのデータベースシステムを使い本当のメリットは検索 / 抽出 / ソートなどの方法がいちばんかもしれません。しかし比機能が簡単な関数の呼び出しで実行できるたい方は , OracIe 独自の SQL やデータ型を較的大規模なデータ , 数千 , 数万件程度のということです。それは , どのように簡単除いて OracIe を Postgres などと置き換えてデータ ( レコード ) を扱いたい場合はどうで読んでみてください。なのでしようか ? 一般的にデータベースデータヘアクセスするプログラム言語にしようか。数万件の HTML ファイルをいちの操作には , SQL という構造化問い合わせいち記述するのは並大抵ではありません。は , メンテナンスのしやすさを考えて Perl 言語を使用します。 DBI モジュールを使用を使用することにしました。 Perl から Orac する場合も例外ではありません。データベしかも項目別にソートができるようにしたい場合 , または複数の人がリアルタイムに le ヘアクセスするには , DBI モジュールと D ースを操作するには基本的にこの SQL を文データを追加 / 更新したい場合はどうした BD::OracIe モジュール (DBI モジュールのた字列として DBI モジュールの API メソッドへらいいのか ? という問題も出てきます。めの Oracle データベースドライノヾ ) というも渡してやるだけです。たとえば , さて , どうしたらいいでしよう。今回はのを一般的に使用します。もちろん C 言語 $ dbh->do(' SQL 文 "潺このような比較的大規模なデータベースをや C + + で作ることも可能ですが , こんな感じになります。実に単純ですよね。こでは扱う簡単な方法を紹介したいと思います。とくに解説しません。この文の内容や SQL については , 後ほど解簡単といっても安定性がないとか速度が遅 Perl で記述した CGI によって Webvx—ジ説するので安心してください。ここではデいとかいうことはありません。商品データからこのデータベースをアクセスできるよータベースプログラムが実に簡単なことでや顧客データなどの大事なデータに対してうにしてみます (Fig. 1 ) 。プログラム自体あるというのをわかっていただければと思はとても単純なので , どうぞリラックスしも十分に使用できるものです。います。 1 1 6 C MAGAZINE 2 1 7 データベースのソフトウェアデータベースのメリット

10. 月刊 C MAGAZINE 2001年7月号

必要な部分だけを追記すればよい。 TabIe 2 VB と Delphi のデータ型比較型クラス内のメンバは private と public キー整数型ワードによって , そのアクセス範囲が規定長整数型される。 VB の Private/PubIic と意味的には単精度実数型同じだ。倍精度実数型 private: ここで宣言したメンバ ( 変数通貨型関数 , 手続き ) は , このユニット内でしか日付型利用できない。ほかのユニットから参照さ ( 記文字列型れたくない変数や関数 , 手続きはバリアント型述する。バイト型 public: ここで宣言したメンバ ( 変数論理型関数 , 手続き ) は , ほかのユニットからもオブジェクト型参照が可能となる。 [var 節 ] プロジェクト全体で参照可能な変数 , 関 TabIe 3 D phi のデータ型 ~ 整数型数 , 手続きを宣言する。 uses 節でほかのユ囲ニットの参照を記述すれば , そのユニット Shortint 符号付き 8 ビット -128 ~ 127 上の変数 , 関数 , 手続きも宣言できる。 Smallint 符号付き 16 ビット -32768 ~ 32767 符号付き 32 ビット Longint ー 2147483647 ~ 2147483647 •lmplementation 部ー 263 ~ 263 ー 1 符号付き 64 ビット int64 lnterface 部で宣言した関数や手続きの具符号なし 8 ビット Byte 0 ~ 255 体的なコードを記述する。要するに関数や符号なし 1 6 ビット Wo 「 d 0 ~ 65535 手続きは「 lnterface 部で宣言し , lmplemen 符号なし 32 ビット Longword 0 ~ 4294967295 ねⅱ。 n 部で実体を定義する」ことになる。符号付き 32 ビット lntege 「ー 2147483647 ~ 2147483647 ちょっと乱暴な言い方になるが , VB は I Cardinal 符号なし 32 ビット 0A42147483647 nterface 部がなく , いきなり lmplementati さらに DeIphi には , 整数 , 実数 , 文字など on 部でプロシージャの宣言と定義を行っ腹である。厳密な規則に従って , 多種のデータ型を扱わなければならない。の各要素を扱うデータ型が多数用意されてている一一と , とらえてもいいだろう。いる。 Table3 ~ 7 をご覧いただきたい。文 VB と DeIphi のデータ型字と文字列も明確に分かれ , 文字型はコー VB は DeIphi に比べてデータ型の種類がドセットによって分けられている。部分だが , ほとんど使用されることはない。少なく , その扱いも鷹揚 ( というか , けっ VB から DeIphi へとコードを移植する場こうアバウト ) だ。まず , VB と基本的に共合 , Table2 に基づいて , 通するデータ型を TabIe2 にあげておこう。 lnteger 型→ Shortlnt 型 String 型→ string 型 TabIe 4 D 引 phi のデータ型 ~ 実数型のように単純に置き換えることが可能だ。型名有効桁数ただし , pascal 本来の厳密な記述は , Ta 6 バイト ble 3 以降にあげた詳細なデータ型を駆使 4 バイトするところから始まる。 8 バイト 15 ~ 16 1 9-20 1 0 バイト 1 9-20 8 バイト 1 9-20 8 バイト Delphi VB Shortlnt Longlnt single double currency TDateTime st 「 ing va 「 iant byte boolean TObject(VCL) , variant(OLE) lntege 「 Long Single Double Cur 「 ency Date String Variant Byte Boolean Object 形式型名・ lnitialization 部初期化処理 , 要するに最初に実行される・ Finalization 部 lnitialization 部で使用したオプジェクトをメモリから解放する処理を記述するのだが , lnitialization 部と同様 , ほとんど使用されることはない。データ型と型キャスト PascaI をベースにした Delphi のデータ型は豊富だ。豊富ということは , 便利さと裏おうよう ~ 12 日 e 引 Single Double Extended Comp Currency 型変換繰り返すが , DeIphi はデータ型に関して非常に厳格な言語である。 VB では問題な 1 54 c MAGAZINE 2 1 7