連載 / BSD をハックする一⑩ 図 3 DMA によるファイル車医のテータ糸 CPU コア キャッシュ ユーザー プロセス ディスクレ F / ヾッフア・ キャッシュ メモリ たく関係ないプロセスのシステム時間としてチャージされ てしまうこともあります。 判別法 て表されたデータの流れのぶんだけ、性能力觝下すると考 ューサー・プログラムか 1 司時にあった場合、この図の泉 ファイルの読込み時に、主記匱を頻繁にアクセスする クセスは、図 3 のようなデータの流れとなります。 DMA を用いたディスク上のファイルシステムへのア ました。 だけ生能力イ氏下するかを調べ川まよいのではないかと考え の 2 つを同時に動かして、前者単独のときとくらべてどれ うフログラム ・ CPU ははとんど使わないがファイルアクセスはおこな ・ CPU を激しく利用するプログラム オ L ば区別できそうです。そこで、 ファイル I / O に CPU をどれだけ使っているかをヾ をしているかを判別する手段を考えます。 をおこなうディスク上に置かれているか、プログラム中幻医 以 E の考察をもとに、あるファイルシステムが DMA えられます。 UNIX MAGAZINE 2000.9 す。 もうすこし詳しくみてゆくと、次のような手順になりま を作って性能を言れ則します。 1. メモリアクセスを繰り返しおこなうテストプログラム A ディスクドライプ 益己意の容量の範囲内でキャッシュに収まらない大量の データを扱うことによって、メモリバスのバンド幅転 送能力 ) か計測できます。この性能を MMB/s としま 2. バッフア・キャッシュに収まらない大きなファイルを 作り、言もムみ性能を調べるためのフログラム B を作成 します。 3. A と B を同時に動かします。このとき、 A の実行優先 順位を低くしておきます。ます、 B を繰り返し実行して おいて A を 1 回実行します。 A の所要時間から、ディ スク I/O 中の ( フログラム A にとっての ) メモリバン ド幅 M'MB/s カ球められます。 4. 逆に A を繰り返し実行しながら B を実行して B の実 彳芋間を計ると、 B の調則時間からディスクの読出し速 度 DMB/s も分かります。 こで M ー M ′は、ディスクからのデータ言も囚みによっ て阻害されたメモリのバンド幅です。これは、ディスクア クセスに関連した CPU の動きと DMA ( もしおこなっ ているなら ) が CPU を押しのけてメモリアクセスをおこ なったことと、バッフア・キャッシュからユーサープロ セスにデータをコピーする手間の和と考えられます。 M ーアのうち、バッフア・キャッシュとユーサーデ ータ空間のあいだのデータコピーで説明がつくのは D x 2MB/s ( バッフア・キャッシュの言もムみに DMB/s 、ユー サープロセス空間への書込みに DMB/s) です。したがっ て、残りの M ー M' ー 2D がどの程度大きいかか判断基 準となります。 75
ノ ( ( リ′作 05P ( べースワークステーション デスクトップシリース JU5 シリース JUIO シリース J い / 360 J い 0 / 4 和 を 00000000000 を 00000000000 UltraSPARC-II i 360MHz UltraSPARC-II i 440MHz 外部キャッシュ 256KB 外部キャッシュ 2MB JU60 シリーズ JU80 シリース JU60, / お 60 〃 4 側 / 7450 U80 / 1 0 / 2450 / 4450 ・ UltraSPARC-II ・ UltraSPARC-II 450MHz ・ 1CPU—4CPU 360 / 400 / 450MHz ・外部キャッシュ 2MB / 4MB ・ 4GB ( 最大 ) メモリ搭載 ・外部キャッシュ 4MB ℃ PU JU60, / 2360 / 24 側 / 2450 ・ UltraSPARC-II 360 / 400 / 450MHzX2 ・外部キャッシュ 2MB / 4MB クループサーハシリース 25 のリーズ 45 のリース ・ UltraSPARC-II 360 / 400MHz ・ 1 CPU—2CPU ・ 2GB ( 最大 ) メモリ搭載 ・ 108GB ( 最大 ) 内蔵ティスク ストレーシンリューション をハードディスクストレージ ・ 9GB—•50GB ・ディスクタワー ・ 9GB ~ 216GB をテープストレージ ・ DAT/8mm/DLT 第 H. ー 0 ストレージ ・ 36GB ~ 2.6TB OAPAN COMPUTER CO 日 P. 2CPU Model オ = プグ = イト ハイエンドサーバー 4 4CPU Model aSPARC- Ⅱ ( 360 / 400 / 450MHz ) ミッドレンジサーバー ・ UltraSPARC-II 360 / 400 / 450MHz ・ 1CPIß4CPU ・ 4GB ( 最大 ) メモリ搭載 ・ 364GB ( 最大 ) 内蔵ディスク 0 キーボード / ビデオ・スイッチ / S シリーズ ・日本語 / 英語 キーボード対応 ロ O O JVS シリーズ導入前 JVS シリーズ導入後 ※すべての SPARC 商標は、米国 SPARC lnternationa い nc. のライセンスを受けて使用している同社の米国およびその他の国における商標または登録商標です。 ※ Solaris は、米国 Sun Microsystems, lnc. の登録商標です。※製品名等の固有名詞は各メーカーの登録商標または商標です。 ※製品の仕様及び写真内容は予告なく変更することがありますのでご了承ください。 資料請求 No. 003
・テータストレージ EXPO 写真 18 2.5inch ソリッドステート・ディスク 写真 20 3.5inch ミラードライプ 写真 19 IU のキャッシュ・サーパー NetCache C1100 クみ社 A 第夏つラッ % ・ユ・第響 ) - を ~ 多 、第・書性にれていをすので、 ツニト府ノつンやノスチム第にも第し氣、ま ちょっとしたキャッシュを用意したいときには、有力な 選択肢の 1 つになるでしよう。 小型ミラーティスク アドテックスの 3.5inch ミラードライプは、 3.5inch ABS (Automatic Backup System) という、いか ハーフハイトのディスクサイズで 2 台の 2.5 ⅲ ch ディ にもそれらしい名称のノート PC 用パックアップ装置が スクをミラーする、かなり変わった製品です ( 写真 20 ) 。 出展されていました ( 写真 22 ) 。 CMS Peripherals [ 20 ] ホストからは 1 台の IDE ディスクにみえていて、専用 プロセッサにより 2 台のディスクに同時に書込みをおこ の製品で、国内ではマクニカ [ 21 ] か総代理店になって いるようです。基本的には PC カード接続のディスク ないます。 ですが、自勺に起重丿ける Windows 対応のソフトウェ ハードディスク・ミラーシステム QuDi[18] もなか ア (CMS Launcher) が付属していて、更新されたデー なかュニークで、 5inch べイでホットスワッフが可能な タだけを対象にするインクリメンタル・バックアッフ。や ミラーシステムを提供する製品です ( 写真 21 ) 。 2.5 ⅲ ch 特定のファイルだけをリストアする機能などカ甘是供され の IDE ディスクを専用ケースに入れたものを使い、ホ ています。 ストとは UItraSCS12 て接続します。ホストからは通 常の SCSI ディスクにみえるため、 OS にかかわらす利 DataBook は、 DataZONE [ 22 ] か闢発したモバイ 用できます ( 日本の糸翁入元は日本タクソン [ 19 ] だそう ル・ハードディスクです ( 写真 23 ) 。衝撃に強いケー 16 UNIX MAGAZINE 2000.9
Daemons & Dragons— ン数を示す。 を実行するとプート時を起点とする統計値が最初に出力 されるはずだ。これらの数値は無視して、短い間隔で報 memory のカラム ( または、、 sar ー r " の出力 ) は、スワ 告を繰り返すようにするほうがよい。 ッフ。領域と物理メモリの空き容量を示す ( 、、 free" という ラベルが付いている ) 。あらかじめ設定された物理メモ これらのコマンドの出力はいたって単純で、システム リの最少残量 ( 通常は IKB 前後 ) に達すると、システ の各デバイスへの読取りと書込み時の転送量が表示され ムは物理領域を増やすためにメモリページをディスクに る。ディスクのスルーブットの限界が分かっているなら、 移し始める。システムの稼重加間に関係なく空きメモリ これらの数値からディスクの使用率を割り出せる。しか はこの値に近づくが、それ自体はまったく正常である。 し、通常はもっと簡単な指標が使える。サービス時間 UNIX では必要に迫られるまでページを物理メモリか ( たいてい、、 svc-t" か、、 serv" と表示される ) と待ち時間 ら移動しないからだ。ただし、スワップ容量の不足はメ をみるのである。サーピス時間は、リクエストを処理す モリ割当て要求の失敗につながる。これはなんとしても るための平均所要時間である (I/O キューでの待ち時間 避けたい。 を含む ) 。この数値が 50 ミリ秒以上の場合、ディスク がリクエストでいつばいになっている可能生がある。待 べージングの糸値 (sar-p) は、 1 秒あたりのページ ち時間は、リクエストが処理されるまでの待機時間の合 イン / ページアウトを KB 単位で表示したものである。 計である。待ち時間が長い場合もディスクの飽和状態を vmstat では pi" と、 p 。 " て示される。これにより、シ ステムで実行されているべージング量を感覚的に擱むこ 示す。 とができる。高い数値はよくないが、それでおしまいで 想定される状況として、何台かのディスクのサービ はない。 SoIaris では、、短期的なメモリ不足 " と呼ばれる ス時間と待機の割合か高い数値を示しているが、各ディ ものが報告される。これは vmstat の出力の、、 de" に該 スクの転送率は比較的低い場合がある。言い換えれば、 当し、メモリの使用傾向を示す。高い数値は、メモリが I/O リクエストの処理に時間がかかっているのに、と 急速に消費されていることを示す。 1 つまたは複数のプ くににしいディスクはみあたらないという状況だ。これ ロセスが、高い割合でメモリを割り当てているというこ はおそらく、コントローラのいすれかがふさがっている とである。 ことを示す。サービス時間の数値か高いディスクを調べ て、それらが同しコントローラに接続されているかどう もっとも重要な数値は、べージデーモンのスキャンレ かを石忍しよう。 ート、すなわち、、 sr " である。この数値はページデーモン の作業量を示す。物理メモリが少なくなると、ページデ ネットワーク I / O ーモンはべージの再生利用を始める。丘参照されてい ネットワークの輻輳がシステム・ノヾフォーマンスの ないページを調べ、それらのページアウトのスケジュー 問題として顕在化することもある。これは、間題の原因 リングをおこなうのである。べージデーモンの作業量が がシステムになくても起こりうる。ネットワークで問題 多いようなら、メモリを増設する必要がある。一般に が発生すると、ネットワーク・アプリケーションやネ 毎秒 200 ページを超える場合は問題とみなされる。 ットワークを介したディスクアクセス (AFS や DFS 、 ディスク I / O NFS など ) に支障が生しる。この場合、システムの統 計値を調べてもポトルネックを示すものはないにもかか ディスク操作の監視は、ほとんどの UNIX システム わらす、依然としてパフォーマンスが低下しているよう で簡単におこなえる。難しいのは、ディスク I / 0 カ蒴加 に感しられるだろう。 した原因を特定することである。現在では、 I/O の糸兤 値が得られる各種のコマンドか揃っている。 SystemV ネットワークのパフォーマンス・チューニングについ から派生したシステムでは、一般に、、 sar—d" で I/O の て述べると長くなるので、こでは簡単なチェック項目 をいくつか紹介しておく。まず、疑わしいシステム上で 統計値を取得できる。ほかのコマンドとしては、 iostat netstat-i" を実行し、ネットワーク・インターフェイ と dkstat がある。 vmstat と同様に、 iostat と dkstat 135 UNIX MAGAZINE 2000.9
NOTICE プ、 E 写真 7 Sedona RAID Storage Subsystem ません。とはいえ、容量あたりの単価は SCSI とくらべ て圧倒的に低く、大容量の一時作業用ディスクなどの用 途に限定すれば、かなり割安なストレージが入手できそ うです (MaxAttach NAS 4000 は 240GB で定価 78 万円です ) 。 サン・マイクロシステムズ [ 5 ] も、新型の RAID ディ RAID Array スクアレイ Sun StorEdge T3 Workgroup Array を 台 : 弯 3Ds Communications [ 4 ] の Sedona RAID 出展していました ( 写真 9 ) 。 9 台のディスクを用いた Storage Subsystem は、ディスクと電源を完全に分離 8 十 1 の RAID 5 構成で、ホストシステムとは Fibre した珍しい RAID システムです ( 写真 7 ~ 8 ) 。電源部 ChanneI で接続します。電源、冷却装置、コントロー 分を別の筐体にしているため、方効果がよく、その点 ラなどを二重化できる純正品としてはかなり満足のいく で安定した運用か期待できそうです。 化 E がりです。 UNIX MAGAZINE 2000.9
Newtech ーー Confidence2000 驚異の実効性能 100MB/s ! ! ! 高速 RA 旧システム、ついに発売 ! - ,NO をぎを貰ご冊刪残 5 ぎを第 ホストバスⅧ t 「 al 60 SC 引対応モデル CO id Ge2000 シリ - ズ 10 , 000 回転 HDD 搭載 163GB ( 18.2GBX1 。台内バリティ 1 ) 標準価格¥ 2 , 300 000 327GB ( 36.4GBX1 。台内バリティ 1 ) 標準価格 \ 3 之 60 000 657GB ( 73. 。 GBXI 。台内バリティ 1 ) 標準価格¥ 4 , 980 , 000 ※容量は、 R D5 構成時の物理容量で表しています。 ホストバスⅧ t 「 a2 SC 引対応モデル Confidence100 シリ - ス 7 , 200 回転 HDD 搭載 91 GB ( 18.2GBX6 台内バリティ 1 ) 標準価格¥ 1 390 OOO 163GB ( 18.2GBX1 。台内バリティ 1 ) 標準価格¥ 1 730 000 327GB ( 36 4GBX10 台内パリティ 1 ) 標準価格¥ 2 , 600 OOO ※容量は、 R D5 構成時の物理容量で表しています。 ロ無料カタログのご請求は・・・ ewtech. CO 可 営業課 ( 代 ) TEL: 03-5777-0852 FAX : 03-5 フ 77-0853 温度センサ 4 ヶ内蔵 製品 3 年保証 NEWTECH Ultra 80MBl 100 MB/S 明 t CO れ石 d 円 ー 00 Confidence100 R 劑 D の実効性能として 1 0 0 シリースでは旧シリーズの 2 倍を超える 60MB / sec 以上、 2000 シリースでは 4 倍の 100MB / sc 以上と最強の RAID コントローラを心臓部に持つ Confidence シリースを新たにラインナップし ました RAM ティスク並みのパフォーマンスを要求するクラスタリングサー バ環境や、 HDTV の動画編集システムなとへの要求に応えます 09 = コ 惓 0 5 ( Confidence2000 ・ RA 旧レベルは O / 1 /O + 1 / 5 に加え、 50 を新たにサポート ( c 。 n れ dence20 ⑩ ・キャッシュメモリ 256MB 搭載 (Confidence2000) ・障害状況が一目でわかる 障害発生時にはアラームで警告し、ハードディスク、ファン、電源 それぞれのモジュールとなりに配置されたランプが障害を示します。 ・ドライプ毎に独立した電源スイッチ ・多重化ファン ・ SCSI ホストチャンネルを 2CH 用意 ・強力な冷却機能 LED ディスクドライプの状況を LED で確認できます 電源 ホットスワップ多重化電源 異常警告アラーム搭載 ディスクドライブ ファン 冷却効果が高い ホットスワップファンを採用 ディスクホルダー採用ファン停止時にはアラームで警告 対応 OS ( 共通 ) Solaris WindowsNT/2000 Solaris i 猷版 Linux FreeBSD MacOS HP-UX 旧Ⅸ AIX 00 i 印 56 tiO れ Provider お電話・ FAX でも 受け付けております 株式会社ニューテック 〒 105-0012 東京都港区芝大門 1 -7-7 浜松町 K ビル 資料請求 No. 014
20 第 CE 写真 14 オーサリング用 DVD-R ドライプ 写真 15 DVD/CD-ROM チェンジャー DRN 1004 写真 16 TeraCart AM-750DVD : ◆戔 : 写真 17 Excellerator 100 Ultra パイオニア [ 12 ] は、 DVD-R を用いたオーサリング 用 DVD-R ドライプと、この技術を使ったバックアッ フ。装置を出展していました ( 写真 14 ~ 15 ) 。展示会の時 占では参考出品で、たんなる DVD チェンジャーでし たが、将来的にはドライプを DVD-R に交換できるよ うになるとのことで、大容量バックアップ装置としても かなり魅力的です。 アサカ [ 13 ] は、 DVD ライプラリ TeraCart AM- 1450DVD/AM-750DVD を出展していました ( 写真 16 ) 。これは、ホストシステムと SCSI て接続する大容 量記慮装置です。 AM-1450DVD は最大で 1 , 500 枚の ChanneI ディスクの大容量メモリキャッシュのように DVD カ刈内可能で、 7.8TB までのデータを記億するこ 動き、アクセス効率を大幅に向上させる装置です ( 最大 とかできます。 120 , OOOIOPS ) 。呂 ! 前川期は未定とのことで、写真彡 ソリッドステート・ディスク は許可してもらえませんでした。 アドテックス [ 17 ] の 2.5inch IDE 型ソリッドス ソリッドステート・ディスクを用いたファイルキャッ テート・ディスク (SSD シリーズ ) には、 16MB から シュ・システムが 2 つ展示されていました。 640MB までのモデルがあります ( 写真 18 ) 。これらは、 1 つは、伊藤忠テクノサイエンス [ 14 ] か扱っている 振動から重要なデータ描矍したい病院や航空機、車載 Solid Data Systems[15] の ExceIIerator 100 UI- システムなどの用途を想定しているようです。 tra です ( 写真 17 ) 。 RAID システムと組み合わせる ことで、かなり高速なファイルアクセスか可能になりま キャッシュ・サー / ( ー す ( 12 , OOOIOPS ) 。 I—2GB の容量を提供する Ultra SCSI ディスクにみえるので、既存のシステムにそのま Network Appliance の NetCache CI 100 は、小型 ま適用できます。 の Web キャッシュ・サーバーです ( 写真 19 ) 。処理性能 もう 1 つは、プロストア・ジャパン [ 16 ] の ProAd- は最大同日妾続数 4 , 000 、 150URL/s で、 MMS (Mi- vance N'Iodel C2 です。こちらは Fibre Channel 接 crosoft Media Streaming) や RTSP (ReaI Time 続の製品で容量は 4GB から 98GB まで、既存の Fibre Streaming Protocol) などにも対応可能とのことです。 UNIX MAGAZINE 2000.9 メそリをイスク 15
0 彙 ice テータストレージ EXPO 小林和真 今回は、東京ピッグサイトからのレポートです。 7 月 12 日から 14 日までの 3 日間、リードエグジヒ、ション ジャパンか主催する一ド記の 4 つの展示会か東京ピッグサ イトの東 4 ~ 6 ホールで開催されました ( 写真 1 ~ 2 ) 。 ・第 2 回データストレージ EXPO 第 5 回データウェアハウス EXPO ・第 3 回糸町囚みシステム開発技術展 ・第 9 回ソフトウェア開発ま竟展 出展は 4 つの展示会で合言 490 社と、かなりの規模 の展示会てす。 これらの展示会に足を運んだのは、もとはといえは私 の所属する倉敷芸彳商科学大学でのファイルサーバーの更 新に備えた汁 i 場調査が目的です。そこで、以下ではデー タストレージ EXPO の期兼を中心に報告します。 テータストレージ EXPO データストレージ EXPO は、 NAS (Network At- tached Storage) や SAN (Storage Area Network) 用 RAID など、ディスク関連のさまざまな製品やヾッ クアップ・ストレージを中心とした展示会です。 Fibre Channel に接続する高速ディスクから、 PC 間のデー タ共有に利用する MO 装置まで、幅広いストレージ・デ バイスカ咄展されていました ( 写真 3 ~ 4 ) 。 NAS 関品 NAS に関連する製品では、 Network Appliance [ 1 ] の NetApp FiIer や Procom Technology [ 2 ] の NetFORCE 1500 、 Maxtor [ 3 ] の MaxAttach NAS 4000 などが展示されていました ( 写真 5 ~ 6 ) 。 NetApp や NetFORCE は SCSI べースの RAID 5 でディスクアレイを構成していますが、 MaxAttach は IDE ディスクを利用しています。製品により容量あ たりの価格に 10 倍以上の開きがあるため、導入する際 12 写真 1 写真 2 ・ 9 / 2000 会場の棘ビッグサイト 4 つの展示会の案内板 ソフトウェア開発環境展 気 $C 印第 0 第材 0 第町第 0 00 糾モ観第 組込みシステム開発技術展豸 EM 砂 E ロロ EDSV 守作 5 EXPO& し 0 : ER を物スい ' こ データウェアハウス EXPO = ー新食第第瞽旧既 PO & の 0 一電一 データストレ - ジ EXP ÜA をを一 S 丁 0 をを X00 ー & 00 時陸第ま物 展示会場し X 印印 ON ENTRANCE EAST HALLO ・ 6 ・ 6 写真 3 Fibre ChanneI 協議会のプース UNIX MAGAZINE 2000.9 い信頼生を求められるデータの保存には不向きかもしれ IDE はディスク自体のエラー訂正機能か弱いので、高 めに必要な性能をイ・分に検詞する必要があります。 には NAS をどのように利用するかをよく考え、そのた
I/O ポートの言もムみは益己慮より遅いのと、データ転送 のはかにファイルシステムのオーバーヘッドもありますか ら、合計 2 倍のオ→ヾーヘッドがあるかもしれません。 そこで、 M ー M' ー 2D が小さい値 ( D 未満 ~ D の 2 イ部呈度 ) なら DMA を使っている、大きな値なら PIO だ と考えられるのではないでしようか。 ただし、プログラム A がメモリバスを 100 % 馬町力でき なければ DMA がおこなわれてもプログラム A の釧乍を 妨げないということですから、結果的に言れ則された転送コ ストが見かけ上 D を大幅に下回る値になることもありえ ます。 PIO 転送は ( シングル CPU のマシンであるかぎり ) 、 他のユーサープロセスの動きを妨げすにおこなうことはで きませんから、 CPU 消費はそれなりに大きな値になるは 実際のマシンが前節て考えたような挙動を示すかどうか 調べてみました。 調査に用いたのは K6-2 (300MHz) の AT 互換機で す。主記憶は 256MB (IOOMHz SDRAM) で、 Net- BSD-I. 4 をインストールしてあります。テストに用いた ディスクは、 Seagate の「 ST313032 」です。誤差が生 しるのを防ぐために、 NetBSD 自体は SCSI ディスクに インストールしています。テストプログラム以外が IDE ディスクにアクセスすることはありません。 プログラム A に相当するテストプログラムは、 bcopy で IMB のメモリ領域を別の IMB の領域にコピーする操 作を 1 , 000 回繰り返すというものです。 char dst [ 1024 * 1024 ] ; unsigned int xxjunk [ 23 ] ; char src [ 1024 * 1024 ] ; test-bcopy() 連載 BSD をハックする一① 検証 int i ; fO て ( i = 0 ; i く 1000 ; i + + ) bcopy(src ,dst, sizeof (dst)) ; このプログラムを単独て動作させると、実行時間は 8.3 秒でした。 120MB/s でデータを読んで書いているわけで すから、 240MB/s のメモリバンド幅か親測されたことに 76 なります。 バッフアサイズを 2MB に増やしたところ、急激に悪化 して所要日が 40 秒になりました。 2MBx 1 , 000 / 40 x = 102.4MB / s となります。このマザーポードは 2MB 2 の L2 キャッシュか載っているので、こちらの 102MB / s のはうがメインメモリの実力と考えられます。 次に、大きさが 128MB のファイルの言もムみテストを おこないました。所要時間は 11 秒で、約 12MB/s の速 度です。 bcopy によるテストプログラムとファイルの言もムみを 同時におこなうと、所要時間は 67 秒に増えました。約 62MB/s ということになります。 102 ー 62 ー 12 x 2 = 16MB/s < 2D ( = 24MB/s) なので、 DMA を使っていると結論できます。実際に、 dmesg て市忍すると、このディスクは Ultra DMA モー ド 2 と表示されました。 さてこれだけでは、この E-IDE ディスクのアクセス性 能がたまたま判男坊試に適合しただけかもしれません。対 照実験として、 SCSI ディスクの場合と DMA を禁止し た E-IDE ディスクを調べてみます。 /var/tmp に置いたデータを読みながらプログラム A を動かしてみました。 /var/tmp は Fast Wide の Sea- gate 「 Barracuda ( 7 , 200rpm ) 」上に作られたファイル システムです。 A の実行所要時間は 47 秒で、そのとき のファイルの言ムみ速度は約 5.5MB/s でした。つまり、 2MBx 1 , 000X2 / 47 = 87.2 B / s となります。 102 ー 87.2 ー 5.5 x 2 = 3.8MB/s < D ( = 5.5 B / s ) やはり想定したとおりの DMA の景グか表れています。 最後に、カーネルを明冓築して PCI 接続の IDE イン ターフェイスの DMA 機能を禁止してみます。すると、 PIO モード 4 となりました。これで同じテストをしてみ ると、 bcopy プログラムがいつまでたっても終りません。 20 丘くかかってしまいました。 また、ファイルの言もムみ速度も 5.5MB/s 程度に低下し ました。計算するとメモリのバンド幅は約 3 MB/s 程度の 低い中幻幻重度です。このことは CPU 能力のほば 100 % が ファイル読出しに費やされていることを夋します。 102 ー 3 ー 11 = 88MB/s 》 2D ( = 11MB/s) UNIX MAGAZINE 2000.9
の一部の旧いバージョンは、 Daemons & Dragons— この部分の解釈を誤ってい スにまとめるとしたら、「メモリはいい、多いはどいい」 システム管理者としての長年の経験を 1 行アドバイ メモリ、ページンク、スワップ たくないかもしれない。 もしつは正常で、パフォーマンスを改善する必要はまっ めなければならない。その結果によっては、高い数値で ない。ロードアベレージが高ければ、その原因を突き止 優れた指標だが、それ以外の情報も検討しなければなら 価する唯一の手段として用いるべきではない。平均値は ロードアベレージは、システム・パフォーマンスを評 らない点に注意しよう。 のイベントなので、つねにユーサーの役に立っとはかぎ だし、この数値は特定の目的で計算されたカーネル内部 負荷を調べるユーティリティが複数用意されている。た を左右する。ロードアベレージはなにかと便利なので、 取り込まれ、スケジューリンクのプロセスの優先順位 テムの負荷は、プロセスの CPU 使用率を計算する際に ュール・アルゴリズム用として計算される。現在のシス ロードアベレージは本来、 UNIX のプロセススケジ は CPU が使用されていなくても急騰する。 バーがダウンすれば、クライアントのロードアベレージ 期的なディスク待機とみなされる。そのため、 NFS サー して NFS がある。 NFS の読出しを待っプロセスは、短 I/O は去麒月的な待機とはみなされないが、重要な例外と げることはないだろう。はとんどの場合、ネットワーク mit 、 Z-modem など ) も、ロードアベレージを押し上 読出しと書込みに時間がかかるプロセス (uucico 、 ker- ロードアベレージに含まれない。シリアル回線を介した い。したがって、ユーサーからの入力を待つプロセスは デバイスからの入力待ちは去麒月的な待機とはみなされな かるプロセスは、ロードアベレージに含められる。 tty ある。ローカルディスクの読出しと書込みに時間がか ドアベレージが予想を上回る数値に歪められる可能性が 短期的な待機状態にあるプロセスまで含めると、ロー く準備か整うプロセスである。 CPU のスケジュールに加えるにはまだ早いが、まもな 呼ばれる状態にあるプロセスもカウントする。これは、 る ) 。しかし、システムは、短期的なディスク待機 " と 134 となる。メモリが桁外れに高価な時代もあったが、事情 が一変した現在、システムにメモリをつぎこまない理由 はない。大量のメモリはどのシステムの性能も向上させ る。 これには単純明快な理由がある。仮想メモリである。 物理メモリを使いはたすと、システムはほとんど使用さ れていないメモリページをディスクに移し始める。 れにより物理メモリの空き領域を増やし、物理メモリが すぐに必要なプロセスに割り当てることができる。ただ し、ディスクに移したページが必要になったら、はかの ページが身代わりとなってメモリが空けられる。物理メ モリの容量が不十分なシステムでは、 I/O の実行とペ ージフォールトの処理に時間がかかる。メモリ不足は、 CPU とディスクの使用効率を低下させる。 イ反想メモリシステムのノヾフォーマンスは、 vmstat コ マンドか sar コマンドを使って簡単に調べられる。はと んどの UNIX システムはどちらかのコマンドを備えて いるし、どのシステムにも仮想メモリの統引・値を報告す るコマンドがあるはすだ。 vmstat コマンドは、イ反想メモリのノヾフォーマンスに 影響をおよばしうる糸 - 「値を表示する。ただし、すべて の数値が仮想メモリシステムに直接関連づけられるわけ ではない。おかしな数値が出力されても、メモリ関連の 問題とはかぎらないのである。仮想メモリシステムの実 装は、 UNIX の種類によって大きく異なる。実装の違 いは、 vmstat か報告する数値とその解釈に反映される。 こでは各数値の詳細については説明しないが、重要な ものだけ紹介しておく。 sar コマンドを使えば各種の役立つ数値が得られる。 このコマンドの出力は指定するオプションによって変わ る。上の 2 つのコマンドの出力をなんとか関連づけてみ よう。結果は UNIX の種類によって異なるはすだ。経 験上、 Solaris を中心とした説明になることをお断わり しておく。 vmstat の出力の 1 行目は、システムのプート時か ら蓄積された糸値である。これらの大半は役に立たな い。重要なのはごく短時間の傾向である。これを知るに は、定期的に報告を出力するように、コマンド行て報告 間隔を ( 秒単位で ) 指定する。そうすれは、連続して出 力される行は指定した時間における正確なオペレーショ UNIX MAGAZINE 2000.9