受信 - みる会図書館

1. UNIX MAGAZINE 2006年10月号

いわれています。ポットを多数の家庭用割合は増加傾向にあります。 PC などに潜ませてポットネットを構築 spam について言及するとき、注意をし、それらのポットを遠隔操作して払わなければならないのが、 spam とし spam を送信するという手法です。ポッて分類されるメールの定義です。一般には、「受信者の承諾なく、不特定多数のトを利用した spam 送信の出現は、 spam の絶対量を急激に増加させました。プ受信者に対して無差別に送信されるメーロードバンド回線でインターネットに常ル」と考えられています。別の見方をす時接続された多数の高性能 PC を利用すると、受信者の承諾があり、特定の受信ることで、大量の spam を短時間に送信者宛てに送信されるメールは spam ではすることができるようになったのです。ない、ということになります。 spam 対策製品の正確性をテストする一方、 spam として送信されるメールのコンテンツについても、巧妙化が進んでために、出会い系サイトに e-mail アドレスを登録し、送信されてくるメールをテいます。その中でも特に増加傾向が著しストの対象とする。こういったテストプいのが、イメージ spam と呼ばれるものです。名前から想像できるように、画像ランを何度となく見かけたことがありま ( イメージ ) を貼り付けた spam です。コンす。これは、 spam として配信されるメーテンツに含める文章や URL を画像としてルと、出会い系サイトが利用者に送信送信することで、 spam 検知工ンジンをかするメールが類似しているという理由かいくぐることを目的としています。 spam ら、検体として使用するのです。しかし全体に占めるイメージ spam の割合は、過これは、明らかに間違っています。出会去 1 年間で 10 倍以上に増えたと米国ではい系サイトが登録者、つまりサイトからいわれていますのメールの受信を承諾した利用者に対しまた、特定の組織だけを狙うスピア型て送信するメールは、 spam にはあたりフィッシングの被害も報告されていますません。実は、技術的検知からみた場合、従来のフィッシングメールは、 spam とこれが spam 対策の難易度を高めていまして不特定多数の受信者に配信されるのす。仮にコンテンツが完全に同じであっが一般的でした。スピア型フィッシングても、そのメールが spam の場合もあれは、送信先を特定の組織 ( 企業、ドメイば、そうでない場合もありますンなど ) に限定し、組織のメンバーのみなお、企業などの e ー mail システムにおいて、出会い系サイトからのメールを排が知りうるコンテンツを偽装します。組織内のメールを装うことで受信者の警戒除したいというニーズがあるのは事実で心を解き、フィッシングサイトへ誘導すす。しかし、それは spam 対策とは異なるのが狙いです。スピア型フィッシングるカテゴリとなるのですは、通常のフィッシングメールに比べて送信量が極めて少なく、べンダー側での対応が取りにくいのも特徴です最新ロ spam 事情最近の spam 事情数年前まで、 spam を送信する方法は、利用者確認が甘い無料 ISP などを利用した直接送信や、オープンリレーのメール spam 対策を実施する場合、もっとも重サーバやオープンプロキシを踏み台とし要とされるのが検知の精確さです。検知た送信がほとんどでした。現在、こうしの精度は、 spam を ham ( spam ではない正た従来方式での spam 送信は激減し、 spam 規のメール ) と判定してしまう検知漏れの過半数はポットから送信されていると検知漏れと誤検知 1 18 UNIX magazine 2006 Autumn

2. UNIX MAGAZINE 2006年10月号

3 受信側のメールサーバは、送信元のアドしスのドメインの DNS に対して、送信に使用された IP アドレスが承認されているかどうかを問い合わせばれる送信者認証も、細かい部分での違いはあるものの、ほば同様の手順を定めています。 DomainKeys ( 図 5 ) は Yahoo! や Gmail が採用する送信者認証の方式で、秘密鍵 / 公開鍵ペアによる電子署名で認証を実施します。 Sender-ID/SPF が送信サーバの IP アドレスを DNS に登録するのに対して、 DomainKeys では公開鍵が DNS に登録されます。送信側 MTA は秘密鍵を用いて e ー mai に電子署名を施し、受信側 MTA がその署名を検証することになります。検証に必要な公開鍵は、 DNS の応答として取得します。送信者認証は、いまだ発展途上にあるテクノロジです。送信者認証に対応したサーバも限られていることから、当面の間は、送信者認証非対応を理由に受信を拒否するといった対処は難しいといわざるを得ません。しかし一方では、送信者認証に対応したサーノヾからの e ー mail を優先処理するといった対応をする ISP も出てきています。送信側ドメイン DNS サーバ 1 送信側ドメインの管理者が自ドメインのメール送信に使用する旧アドしスを登録 4 2 送信者が SMTP 通信を開始 DNS サーバのレスポンスに応じたポリシー適用受信側 MTA (MX) 図 4 送信者認証技術ー 1 Sender- ID 送信側 MTA 受信側メールサーバ 3 受信者は、送信元アドレスのドメイン情報を基に DNS に問い合わせを行ない、入手した公開鍵でヘッダを暗号化送信側ドメイン DNS サーバ 1 ドメインの管理者は、秘密鍵 / 公開鍵のペアを作成し、公開鍵を DNS に登録 2 4 送信者は、秘密鍵を使ってメッセージに“サイン第し、暗号化したヘッダを挿入 DNS サーバのしスポンスに応じたポリシー適用受信側 MTA (MX) 図 5 送信者認証技術ー 2 DomainKeys 送信側 MTA 受信側メールサーバ 0P25B (Outgoing Port 25 BIOCk) OP25B は、ボットを利用した spam の送信や、メールを媒介としたウイルスの感染拡大を抑制する手段として、一部の ISP で採用が始まっています ( 図 6 ) Outgoing PO 25 Blocking ( 0P25B ) ISP の加入者が e-mail を送信する場合、旧 P のネットワークから外部への SMTP (TCP Po 25 ) の企業のメールサ - バなど、異なる旧 P に接続されたメ - ルサー通信を特定の旧アドレスに限定することで、ボット等に感染バと直接通信するためには、 TCP Po 25 に代わり、サプミ通常の手順では、 ISP が管理する MTA した端末が spam の配信に使用されるのを抑制する対策。多ッションポート ( TCPPo 587 ) が定められている。サプくの場合、旧 P が管理するメールサーバや固定アドレス契約のミッションボートを使用すれば、異なる旧 P のサーバを中継しをリレーサーバとして使用します。一方、ューザーは対象外となり、動的旧アドレス契約のユ - ザーがたメール送信が可能になるが、 SMTP Auth による認証、大量 0P25B の対象となる。送信を防ぐ流量制限の導入が併せて求められている。ポットからの spam の送信は、リレーサーノヾを使用せず、受信側 MTA への直接配図 6 Outgoing Port 25 BIocking (OP25B) 送を試みています。 OP25B は、加入者しかし、 spam の根絶はできなくとも、そ端末から ISP 外部への SMTP 通信 ( 宛先の被害を軽減するテクノロジは存在して TCP Port 25 ) を遮断することで、ポッいます。個々のテクノロジの長短所を理トが試行する spam 送信のプロックを実現解し、組み合わせることで、 e-mail シスしています。なお、 OP25B の対象とな e ー mail セキュリティ製品を販売するべテム全体としての耐性を向上させることンダーの社員としては極めてお恥ずかしる IP アドレスから ISP 外部のメールサーは可能です。 e ー mail の継続的な発展に期い結論ですが、今日の spam メールに対すバと通信する代替手段として、サプミッ待しつつ、ペンを置きたいと思います。る完璧な対策というのは存在しません。ションポートが併せて定められています。企業内メールサーバ 0 P -1 のメールサーバ P -1 ・第強“ - 第・ SMTP 宛先 TCP7K—ト 25 サプミッションポート宛先 TCP7K—ト 587 ISP -2 のメールサーバ旧 P -2 0 まとめ 123 U N Ⅸ magazine 2006 Autumn

3. UNIX MAGAZINE 2006年10月号

の符号化は、 ALM と深い関連があります。例えば、元のデータストリームを符号化してから ALM に流すことで、バケットロスなどでデータ片が揃わない場合でも、ある程度の品質で再生することが可能となります。 erasure coding とは、 n 個のデータ片を符号化し、そのうちの k 個を揃えるだけで元のデータを復号できるというような符号化を指します。例えば 64 個のデータ片に符号化し、そのうちの 16 個を揃えることで元のデータを復元できます。これは特に映像・音声に特化しているわけではありません。 layered coding は、元の映像・音声ストリームを、複数本のデータストリームに符号化します。受信側は、 base layer のストリームだけ受信できれば最低限の品質で再生が可能であり、そのほかのストリームも受信すればさらに高い品質での再生が可能となります。例えば 256kbps のデータストリーム 4 本に符号化するとしましよう。この場合、 1 本分 (256kbps) を受信するだけで最低限の再生が可能であり、すべて (IMbps) を受信することで最高品質での再生が可能となります。つまり layered coding により、広帯域幅かつ高品質のデータストリームに、狭帯域幅かっ低品質のデータを兼ねさせることが可能となるのです。ツリーベースの ALM で、広帯域幅でつながったノードの先に狭帯域幅のノードがつながっている場合を想定してみましよう。この場合は通常、狭帯域幅のノードに合わせて両ノードに低品質のデータを送るか、それぞれのノードに異なる品質のデータを送るかのどちらかとなります。しかしここで layered coding を用いることで、両ノードに個別のデータを送ることなく、帯域幅に応じたデータを受信して再生することができます。広帯域幅のノードは高品質で、狭帯域幅のノードはそれなりの品質で再生することが可能となるのです。 multiple description coding (MDC) も、映像・音声のための符号化手法です。元のデータストリームを複数本に符号化します。再生に base layer が必要となる layered coding とは異なり、任意のデータストリームを最低 1 本受信すれば再生できるという、再生可能性の高さが特徴です。データストリームの本数が増えるほど、歪みの少ない高品質な再生が可能となります。 MDC を応用した ALM に、 CoopNet があります。 network coding は、ビット列を伝送する通信ネットワークを前提として、その中継ノードにおいて中継だけでなく符号化を許します。そうして、中継だけが可能な場合よりも高い伝送レートを達成します。中継ノードで行なわれる符号化とは、多くの場合、異なる枝からやってきたデータ同士の線形結合 ( もっとも簡単には x xor y) です。 network coding は 2000 年にその可能性が示されました。それ以降、 ALM に限定してもすでに多数の応用提案がされています。もっとも話題を呼んだのは、 ALM ではありませんが、 2005 年 6 月に Microsoft Research から発表された P2P コンテンツ配信方式 Avalanche ではないでしようか。これは BitTorrent の代替技術といった触れ込みで報道されました。 BitTorrent では、ファイルをデータ片に分割し、各ノード ( 利用者の PC ) は全データ片を集めることで元のデータを復元します。 UNIX magazine 2006 Autumn

4. UNIX MAGAZINE 2006年10月号

所有のドメインなのでサンプル数は比較ンスを販売するべンダーによって、各社のアプライアンスのみが利用できる付加的少ないですが、全体の傾向は把握できると思います。ー 4.0 以下の送信元から受サービスとして提供されています。では、レピュテーションの詳細とその効信した e-mail はすべて spam であるのに対して、図 2 で spam がわずかに混在する十 4.0 果を、米国アイアンポートシステムズ社の提供する SenderBase ( 図 1 ) を例に近辺の詳細データでは、十 4.1 以上の送信元から spam の受信はありません。ー 3.9 ~ 解説していきます。十 4.0 の間は spam と ham が混在しています。 SenderBase では、 e-mail の送信に使用された各 IP アドレスを 110 を超えるパ左端の None は、 SenderBase に登録のなラメータで評価し、一 10 ~ 十 10 ( 0.1 刻い IP アドレスから受信した e ー mail ですみ、 200 段階 ) のスコアで格付けしますこの結果を利用して、例として以下の RBL への登録、ー mail 送信数の急増な設定を適用してみます。どは、スコアを下げるマイナスの要素とー 5.0 以下の送信元からの受信は流量を制限し、無条件に隔離して処理されます。一方、 IP アドレスの所有者が身元のしつかりした企業であー 4.9 ~ 十 5 ℃の場合にはコンテンツレる、第三者機関の認定を受けている ( 後ベルでの spam フィルタを適用・十 5.1 以上の場合にはコンテンツレベル述 ) などは、スコアを上方修正するプラの spam フィルタをスキップして配信スの要素です。最終的にはすべての要素を集計し、レヒュテーションスコアが計十 5.1 以上の送信元からの e-mail は、 spam フィルタをスキップするため誤検知の算されます。アイアンポートシステムズ可能性がなくなります。また、コンテ社製のアプライアンスは、 e-mail 受信時 ( 厳密には TCP SYN 受信時 ) に、送信ンツレベルの spam フィルタを適用する e ー mail を限定することで、システムへの兀 IP アドレスに対するレヒ。ュテーショ負荷を軽減することが可能になります。ンスコアの問い合わせを行ないます。そうして戻されたスコアに応じて、接続の spam フィルタ拒絶や流量の制限、隔離などのアクションを指定できる設計になっています。図 2 は、筆者が個人で所有するドメイコンテンツを含めた e ー mail メッセージ全体を解析の対象とする spam フィルタン宛の e ー mail を一定期間アイアンポートは、 spam 検知の中核となるテクノロジシステムズ社製アプライアンスで処理です。これはさまざまな角度からのアプし、レヒュテーションスコアごとに spam ローチが研究され、実用化されていまと ham の割合を計算したものです。個人 0 0 最新ロ spam 事情アイアンポートシステムズ株式会社の提供するしピュテーションサービス。協力旧 P 、アプライアンスを導入したエンドユーザーなどからデータの提供を受け、 e - ma ⅱ送信元の旧アドレスの格付け (Reputation Sco 「 e) を生成している。 CompIaint Reports Message Spam Traps Composition Data Global Volume Data Compromised URL Lists HOSt Lists Web Crawlers 旧 Blacklists & Whitelists Add itional Data 1 10 以上のバラメータ SenderBase SenderBase Reputation Score -10 ~ + 1 0 SenderBase テータベースデータ解析図 1 Sende 「 Base 120 UN Ⅸ magazine 2006 Autumn

5. UNIX MAGAZINE 2006年10月号

に対し強制的にデータを送りつけます。構造を前提としながらもメッシュべースつまりプッシュ型の方式です。データをの手法をとっています。最初は配信木に受信したノードは、そのデータの受信が従ってデータを流しますが、各ノードは初めてであれば、データが来た方向を除すべての子に全データを流すわけではあいて、自分の隣接ノードに対してデータりません。各ノードは木構造に関係なく、を転送します。受信済であれば転送しま足りないデータをほかのノードから入手せん。します。この点がメッシュべースである単純な flooding には、データ転送の総所以です。どのノードがどのデータを保量、それも無駄なデータ転送が多いとい持しているかという情報は、木構造を活う問題があります。例えば図 6 中のある用して流通させます。この手法によりッノードは、同一のデータを 4 回以上受信リーベースよりも高帯域幅のデータを流しています。各ノードの上り帯域幅が貴すことができる、というのが提案者の主重な ALM において、これは大きな問題張です。です。そこで、 ALM に flooding を適用すデータ駆動のデータ転送る場合には、無駄なデータ転送を低減する工夫がとり入れられています。これまで紹介してきたツリーベース、 flooding の良い点、つまり高いデータ浸メッシュべースの方法は、基本的にブッ透率を維持しつつ、なおかっデータ転送シュ (push) 型のプロトコルでした。木の総量を抑える手法として、 1980 年代に構造では、データは単一の親からしか gossip と呼ばれる手法が考え出されましやってこないため、プル (pull) 型のプロた。 gossip は rumor mongering 、 epidemic トコル、つまり親に対するデータの要求 dissemination とも呼ばれます。文字どおは無駄なものでしかありません。しかしり、噂が人づてに伝わっていくような動メッシュべースでは状況が異なります。作をします。 gossip プロトコルには、多くブッシュ型プロトコルである flooding やのノヾリエーションがあります。基本的には gossip では、同一のデータが複数の隣接転送処理として、隣接ノードの中から転ノードからやってきます。この無駄を省送先をランダムに選び転送する、というくためには、プル型のプロトコルが有効動作を繰り返します。そして、例えば受です。つまり、強制的にデータを送りつ信済ノードへの転送を一定回数繰り返しけること (push) はやめ、明示的な要求てしまった時点で、転送を止めます。 (pull) があって初めて転送するのです。この種のプロトコルの ALM への応用かといって、隣接ノードに対してやとしては、構造化オーバーレイ CAN のみくもにデータを要求しても、その隣上で % oding を行なうものがあります。接ノードが当該データを持っていなけれ flooding は ALM 自体よりも、イベントば、要求自体が無駄なものとしかなりま通知 ( 例 :lpbcast) やオーノヾーレイのメせん。そこで、自らが保持しているデーンノヾ管理 ( 例 : CoolStreaming/DONet) タの一覧を、隣接ノードに知らせておくという方法がとられます。具体的には、によく用いられています。 Bullet という ALM は、ノード間の木データストリームを時間方向に分割した SPECIRL C 38 UNIX magazine 2006 Autumn

6. UNIX MAGAZINE 2006年10月号

信木に参加することになります。各ノーら 10 ノードに対して転送でき、受信可が行なわれます。このルーティングは、ドはどれかただ 1 つの配信木で子を持ち能なノードの数をそれだけ増やすことが該当するキーと値の組を保持しているます。複数配信木を構築する ALM には、できます。ノードに到達するというわけです。ほかに Chunkyspread などがあります。ここで同一の ID を宛先として、複数ここで、配信木を構成する各ノードの上り帯域幅について考えます。子を持つの異なるノードからルーティングを行メッシュべースのデータ転送ノードは、データを子に転送するためになった場合を考えます。各ルーティング上り帯域幅を活用しています。持ち得る木構造には、親が 1 つである、ノードの経路は、最終的には同一の担当ノード間に親・子という方向がある、といった子の数が、上り帯域幅によって制限されに収束します。これら複数の経路の和集いくつかの制約があり、この制約に従っ合は、木構造を構成します ( 図 5 ) 。る点にも注意してください。このことは配信木を構成する際に、各ノードの帯域てデータが流れます。これに対し、よりの木構造を配信木として使おうという緩やかなノード間の関係に基づいてデー幅、特に上り帯域幅を考慮する必要があのが、構造化オーバーレイを使ったマタを転送していくメッシュべースの方式ることを意味します。続いて子を持たなルチキャストの基本的なアイデアです。も提案されています。ここでは、ノードいノード、つまり配信木の葉の場合はど Scribe は、構造化オーバーレイのアルゴうでしよう。ほかのノードに対してデー間に親子関係がなかったり、ノード間のリズムである Pastry を使って配信木をタを転送していないということは、上関係が枝の有無といったゼロ / イチでは構築します。それは配信木の根をランデ定まらなかったりする、比較的ノード間プーポイント (Rendezvous point) とり帯域幅を活用していないことになりまの関係が緩やかな構造を大雑把にメッす。木構造において、葉となるノードのして、そこから葉に向けてデータを転送シュと呼びます数は案外多いものです。各ノードが 2 つしていくという ALM です。メシ上全ノードに対してデーの子を持っバイナリツリーですら、半分上り帯域幅を活用しつくすための複数ツリータを配布する方式として、 flooding とい強のノードが葉となります。各ノードう単純な方式がよく知られています ( 図が 16 の子を持っとしたら、 9 割を超える昨今のインターネットは Web 向きに 6 ) 。 flooding は日本語で「洪水」「氾濫」数のノードが葉となります。 ALM にお設計されており、 P2P ソフトウェアのであり、文字どおり、メッシュ上にデーいて、系全体にとっての貴重な資源であ動作に適さない構造が各所にあります。タを氾濫させます。 P2P 関係では、ファる上り帯域幅を活用しないというのは、アクセス系ネットワークについていえイル共有プロトコル Gnutella で検索クエもったいないことです。ば、 NAT の普及による双方向通信の阻リの拡散に fl 。 oding が使われていることそこで、複数の配信木を構築して、害や、非対称 DSL (ADSL) での上り方が有名です。それぞれの配信木ではデータの一部分向帯域幅の狭さがその例です。特に上り flooding では、各ノードは隣接ノードを流すという手法が考えられました。帯域幅の狭さは、 ALM で非常に大きな SplitStream は、複数の配信問題となります。 ALM では、各ノード木を構築する ALM です。が受信したデータをほかのノードに提供で構築される複数の配信木はするので、受信のための下り帯域幅だけ forest と呼ばれます。それぞれでなく、送信のための上り帯域幅が重要の配信木は Scribe の手法で構となります。上り帯域幅が広いほど、ト築し、データストリームを時間ラフィックをより大きく増幅できると方向に分割したものを、複数いうことです。例えば、 500kbps のトラの配信木に分散して流します。フィックを受信している場合、上り帯域つまり、ノードは必要なデー幅が 500kbps なら 1 ノードに対してしかタを揃えるために、複数の配転送できません。しかし 5Mbps だとしたー②未送信 & 転送 3 未送信 & 転送 2 ②受信済 & 転送せす 3 3 図 6 flooding 37 UNIX magazine 2006 Autumn

7. UNIX MAGAZINE 2006年10月号

JANOG REPORT す。これによりマルチキャストの運用負荷は減り、さらには「責任分界点」における複雑性を改善できる可能性があります。事業者間接続の責任分界点においては、 MBGP 、 MSDP などの手法はあるものの、商用サービスでの採用には課題が多く、ランテブーポイントの運用という難点を解決できていません。また、運用のためのツール類の充実化、および品質の確保も大きな課題となってきます。この点について、現時点で答はなく、運用事業者は各自さまざまな独自工夫でしのいでいるのが実情です。 JANOG18 で行なった議論の中でも、アプリケーション面でカノヾーするケースが多いのではないかというコメントもありました。このプログラムはほかのものとは異なり、情報共有的なニュアンスを強めに作図 2 PIM-SM ネットワークの動作概略りこんだものでした。しかし、マルチキャクリアしたという前提で、運用面についストの現状と必要性、そしてネットワーて考えます。冒頭で P Ⅳ - SM がもっともクオペレーターとして意識する必要のあ普及していると述べましたが、 PIM-SM る技術であることは十分に伝えられたを使う場合には、ユニキャストで想定でと感じています。今後 JAN 〇 G という場きなかった運用上の難点が出てきます。が最適であるかどうかは吟味が必要です 1 つは、ランデブーポイントです。 PIM- が、情報の共有やドキュメントの充実化、 SM のネットワークでは、すべての Join コア技術の最適化に向けて、さまざまな要求、 Register 要求は一旦ランテブー団体や開発者と意見交換を行なう必要がポイントへ集まり、その後、最適化さあると感じています。ある日突然「マルれた最短経路木へと切り替わります ( 図チキャストの配信ネットワークを設計し 2 ) 。このランデブーポイントの運用が、てください」と言われたときに困った筆マルチキャストを複雑化しています。詳者の経験を、無駄にしたくないという気細は JANOG の Web サイト * 9 を参照して持ちを込めて。 ( 以上、川村聖ー ) ください。もしこの複雑性を取り払おほっといた引 Pv4 運用にうとすれば、まったく新しいプロトコル影響する旧 v6 の話の採用が必要となります。その注目株が曰 M ー SSM * というプロトコルです。 PIM-SSM は、マルチキャストの送信元 lPv4 のネットワークやサーバなどをアドレスを特定して Join することによ運用されている方は、 lPv6 を利用したり、ランテプーポイントを省略していまサービスの登場や lPv6 対応 OS の登場に時間の流れ端末からの受信要求サーバが配信を開始最適化経路への切り替えテータセンタデータセンタテータセンタ 6 WAN WAN WAN 0 3 PIM domain ※ FHR : Fi 「 st Hop Router ※ RP : Rendezvou Point ※ PE : P 「 ovide 「 Edge ※ SPT: Shortest PathTree ① FHR 宛てにバケットを送出 ② RP へ送信元アドレスとグルーフアドレスを登録する ③端末からの受信要求 (IGMP 0 「 MLD) ④ RP への受信要求 : ( ・ (G) join メッセージこの時点で送信元アドレスがわからないためひとます RP へ要求 ⑤ SPT への受信要求 : (S,G) join メッセーシ ⑥ SPT 上でのデータ転送 * 9 * 10 http://www.janog.g 「 jp/meeting/janog 18/program-abstract. html Protocollndependent Multicast-Source Specific Mode 128 UNIX magazine 2006 Autumn

8. UNIX MAGAZINE 2006年10月号

ど、多額の費用がかかりました。そこに ALM を利用することで、極めて安価な配信が可能となります。例えば、単純なクライアント / サーバ型のライプ配信では、配信元には視聴者の数に比例したネットワーク帯域幅が必要となります。それに対し ALM では、 1 ~ 数ノードに対して配信する能力があれば充分です。れによって、誰でも世界中に向けた大規模発信が可能となります。これまで Web が実現してきた文書や静止画についての総発信社会が、ライプ映像についても現実のものとなります。技術的特徴ウタゴ工株式会社の Ocean Grid の技術的特徴を挙げます。とにかく実用本位という方針で開発しています。単一配信木間、または測定サーバを相手として帯域応じて設計します。必要に応じてノード配信木の構造は、各ノードの帯域幅にまでの遅延を抑えることができます。間が比較的短く、それだけ配信から再生あるため、末端にデータが届くまでの時りません。また、ツリーベースの手法で起きても映像・音声が途切れることはあ少の間保持しているため、木の再構築が木を再構築します。受信したデータを多脱があった場合は、数十ミリ秒のうちに向けてデータを転送します。ノードの離構築した配信木に沿って、根から葉にています。法も、プロトタイプ実装および試験をしとっています。ツリーベースではない手単一の配信木を構築するという手法を比較的古く、また確立されつつある、幅を測定し、その結果に応じて、ほかのノードへの中継をするかしないかを決めています。ハイブリッド P2P P2P システムとしての構造は、ハイプリッド P2P です。つまり、配信木の構造はトボロジ管理サーバが集中的に決めて、各ノードに指示を出します。ハイプリッド P2P のシステムは、サーバが単一故障点となることが弱点ですが、そこはトボロジ管理サーバの冗長構成でカノヾーします。トボロジ管理サーバは、バックアップを含めた複数台を動作させることができます。 N AT 越え UPnP を利用したルータの穴開け、 NAT 越えを行ないます。これによって、 NAT ルータが UPnP に対応していれば、 NAT の内側にある PC にもデータの中継を行なわせることが可能です。 NAT 越えができなかった場合でも、中継を行なわないだけで受信は可能です。 Web との親和性・多チャネル同時受信 / 再生 Mbps 程度の比較的高品質な映像であり、画面上部のウインドウは数 100kbps ~ 数同時受信 / 再生が可能です。この例では、貼っています。このような多チャネルの Web/< ージに 5 つの再生ウインドウを図 9 に示している再生画面の例では、ることが可能です。サービスに、 Ocean Grid を組み合わせべースとしたあらゆるシステムやネットことが可能です。これにより、 Web を Media PIayer など ) を WebvX—ジに貼る動画再生ソフトウェア (Windows その下の 4 つのウインドウは数 10kbps 程度の低ビットレートの映像です。ストリーミングでは映像の再生開始時に、どうしても数秒程度のバッファリング待ち時間が必要です。チャネルをザッピングする際、切り替えのたびに数秒待たされるのは、非常に大きなストレスとなります。図 9 の例で低ビットレート映像を複数再生しているのは、ザッピングせずともチャネルの選択ができるようにという数百ノードの試験配慮からです。なっています。しての狭帯域・高遅延環境での試験も行試験、ネットワーク帯域幅や遅延を調整でなく、ノードの頻繁な出入りを模したしています。多ノードの試験というだけの PC を用いて数百ノードの動作を試験ア、実験環境を用意してあり、十数台大規模な試験をするためのソフトウェまとめら、使われていくこととなるでしよう。きには組み合わせられ補完し合いながらはそれぞれの性質が活きる領域で、と発信し得るという利点があります。これ備・費用が安価、すなわち、誰もが広くリケーション層マルチキャストには、設という利点があります。それに対しアプ努力で信頼性を向上させることができるされた基盤を用いる配信方式には、運用 IP マルチキャストや CDN などの整備よび実際のシステム例を紹介しました。ケーション層マルチキャストの手法、お信の手段として注目されているアプリ本稿では、マルチキャスト、ライプ配 UNIX magazine 2006 Autumn 43

9. UNIX MAGAZINE 2006年10月号

450 ■ ham spam ■ 2006 年 6 月 27 日 ~ 8 月 10 日に受信したメール、 2 , 721 通を集計 ■アイアンポートシステムズが提供する Sende 「 Base レピュテーションサービスは、メールの送信元の IP アドレスを、 - IO から + 10 ( 01 刻みの 28 段階 ) で格付けします。左端の None は、 SenderBase に登録のない旧アドレスから受信したメールです。 -7.0 -60 -1 .0 0 ℃ 40 レビュテーション図 2 レピュテーションスコアごとの ham ( 正規のメール ) と spam ( 迷惑メール ) の割合 400 350 300 鹹 250 9 す。しかしどの方式にも長短所の両方があり、絶対的な解が見出せていないのが今日の状況です ( 表 2 ) 。キーワードマッチングは、もっとも基本的な spam フィルタです。 "Viagra" などのキーワードによって spam 判定を行ないます。従来型の単純な spam には効果的ですが、 spam の巧妙化が進んだ現在では、効力が薄れたといわざるを得ません。件名、本文に含まれるキーワードを検索し、巧妙化した spam には効果が少な各キーワードに割り当てられたスコアを累計キーワードマッチング従来型の spam には即効性がある。前述したイメージ spam には無力ですし、い ( イメージ spam 、キーワードする。スコアがしきい値を超えた場合に spam の偽装など ) 。と判定する。キーワードの偽装にも脆弱です。例えば、べイズ理論を基にした学習型のフィルタ。学習量に応じて処理負荷が増え性学習を繰り返すことで検知精度が向ユーザー自身が spam と判断したメールを学能劣化。 "Viagra" は。 V. i. a. g. r. a " 、もしくは HTML 上する。習させることで、ユーザー環境にマッチした学習作業の継続による運用負荷の使用ユーザーの判断を柔軟に反映可フィルタを生成する。増大。を使用して "Viagra 多角的判を行なうため、ルール特定の文字列の出現頻度など、メールの各部といった形で偽装されます。受信者であルールの複雑化による処理負荷のヒューリスティック解析分を複数のルールセットで分析し、総合的なセットの品質が維持できれば高い増大。判断で spam 検知を行なう。情度を実現可能。る人間は一目で理解できますが、機械処 spam 判定の指標となるキーワード、文字列理においてすべての偽装パターンを登録運用負荷が少ない。巧妙化した spam には効果が少なバターンなどをテータベース化して配布。い ( イメージ spam 、キーワードシグニチャの質が高ければ、高精度受信メールをシグニチャと比較することでするのは極めて困難です。の偽装など ) 。での検知カ河能。 spam の検知を行なう。べイズ理論を基にしたべイジアンフィメッセージへッダの構造、プロトコル標準へ単純な spam には即効性が高い。の準拠などを確認するほか、マルチバートの今日、もっとも普及しているルタは、構成などをチェックする。 spam フィルタといえます。継続的な学多くの spam ( 特にフィッシング ) は URL をほかの方式を補完する役割であり、含んでおり、その URL を基に spam 判定を行フィッシングなどには高い効果を発揮。習を行なうことでフィルタの精度が向上 URL マッチングのみに依存するのなう技術。 URL データベースの迅速な更新が、は誤検知の危険が大きい。精度維持には極めて重要。しますが、その際に利用者の意向を反表 2 代表的な spam 検知技術映できるというのが大きな特徴です。学習の素材となる e ー mail は利用者が選択で析を組み合わせ、ルールセットとして提たテクノロジであり、一部のべンダーがきます。そして学習の程度によっては、供されます。ルールセットのアップデールールセットの一部として提供を始めま spam の検知に留まらず、利用者にとっトはべンダーが行ない、定期的にアップした。フィッシングメールを含めた多くての不要 e ー mail を、より広範に検知するデートされるため、特別な操作なしに最の spam は、受信者に URL をクリックさことも可能です。このように極めて高い新のフィルタが利用可能です。ライセンせること、つまり、指定サイトに誘導す検知精度を実現可能なべイジアンフィルス費用を支払うとしても運用負荷の低減ることを目的としています。 URL マッタですが、一方で、精度の維持、向上にを指向するユーザーにとっては魅力的なチングはこれを逆手に取って、 e-mail には継続的な学習が不可欠です。このためソリューションですが、重要なのはべン埋め込まれた URL を基に spam 判定を行運用負荷が高いことが、短所として指摘ダーの選定です。 spam を送信する側は、ないます。特にフィッシングメールにはされています。学習作業は個々の利用者フィルタをかいくぐる手段を日々研究し有効な対策ですが、実環境で効果をあげが実施する必要があり、管理者が一括しています。現在の製品の品質だけでなく、るためには、データベース更新のスピーて代替することはできません。日々の運将来を見据えた技術力、信頼性などを考ドが重要になります。このため日本語の用に必要な負荷を考慮し、企業では導入慮して選択する必要があると思います。サイトを含めたデータ収集の体制と運用を敬遠する傾向もみられます。また spam 対策製品の多くは、海外のべが、べンダー選定の基準になっていくと運用負荷という側面から検討した場合ンダーが開発しています。日本語特有の思いますに有力な候補となるのが、べンダーの提表現など、日本国内での使用にどれだけ供する spam 検知工ンジンです。採用し真剣に取り組んでいるのかも、選択の重要な基準となります。ている spam フィルタはべンダーごとに spam 検知技術の最後に記載した URL spam と判定された e ー mail の処理は、異なりますが、多くの場合、ヒューリスティック解析、シグニチャ方式、構造解破棄、もしくは件名へのマーキングマッチングは、最近になって実用化され 0 100 50 0 None -9 ℃ -8.0 -2.0 -5.0 -40 5 ℃ 3.0 20 10.0 90 50 spam 検知技術長所概要短所べイジアンフィルタシグニチャ方式ほかの方式を補完する役割であり、構造解析のみでの対応には限界がある。構造解析 URL マッチング 0 spam 隔離 2 UNIX magazine 2 06 Autumn

10. UNIX MAGAZINE 2006年10月号

れています。誤検知が理由で隔離されて ( 「 SPAM 」などの文字列を挿入 ) や、しまった e ー mail があっても、 Web 経由で識別ヘッダの挿入を行なうのが一般的で URL にアクセスし、リリースすることがした。しかし破棄してしまった場合、万が一の誤検知の際の復旧手段がありませ可能です。隔離に必要なスペースの確保やダイん。件名のマーキングやヘッダの挿入をジェストの送信間隔をどうするかなど、選択した場合、誤検知された e-mail が失導入にあたって検討すべき項目はありまわれることはありませんが、 spam を含めすが、システム負荷の軽減と誤検知の救た e ー mail の総量は変化せず、 e-mail シス済をともに満たせるソリューションとしテムの負荷は軽減されません。そのようて、特に企業においては導入が増えつつな中、注目を集めているのが spam の隔離という手法です ( 図 3 ) 。あります。隔離システムを採用した場合、 spam と判定された e ー mail は、専用の隔離サーバに蓄積されます。このため、 spam によるメールサーノヾやクライアントの圧迫は spam という脅威に対する抜本的な解決策として検討が進められているのが、回避できます。また、隔離サーバから利送信者認証のしくみです。用者に対して、 spam として隔離したメッ冒頭でも指摘したように、 e-mail の送セージのダイジェストが一定間隔で届け信に認証プロセスがないことが、 spamB られます。通常、ダイジェストにはメー題の根源になっています。 SMTP Auth ルの送信者、件名、そして隔離されたメーや POP before SMTP による認証はクラルにアクセスするための URL が記載さイアントとリレーサーバの間の通信に限定され、 MX 登録された MTA への e-mail 転送では認証は求められません。 MX は、インターネット上の不特定多数の送信サーバと通信する必要があり、 SMTP Auth のようなユーザー単位の認証を実施することはできないのです。検討されている送信者認証のしくみは、ユーザー単位の認証ではなく、ドメイン単位の認証機能を提供するものです。現在は複数のしくみが並存しています。 Sender-ID ( 図 4 ) はマイクロソフト社が提唱する IP アドレスペースの送信者認証技術です。ドメインの管理者は、同ドメインからのメール送信に使用するサーバの IP アドレスを、あらかじめ DNS に登録しておきます。当該ドメインからの e ー mail を受信したサーノヾは、 DNS に対して送信サーバのアドレスを問い合わせ、応答が受信 e ー mail の送信元と一致した場合に正規の送信元であると判断します。 SPF (Sender policy Framework) と呼認者送最新ロ spam 事情インターネット〇や〇転送し保管〇〇正規のメール、 spam が混在して配信される spam ではないと判定されたメ - ルはメールサーバに転送 web べ - スで確認隔離メールの検索、誤検知の際の再配送隔離した spam のダイジェストを通知図 3 spam の隔離システム 122 UN Ⅸ magazine 2006 Autumn