トリック – 2/3

このエントリはフィクションです。

  1. トリック – 1/3 に戻る
  2. トリック – 2/3
  3. トリック – 3/3 に進む

スパマーたちは検索エンジン別に異なるページを使って最適化する。Lycos用、Infoseek用、Excite用、Altavista用、Inktomi用、といった具合だ。検索エンジン別にページを作るのは、検索エンジンごとに加点配分やbanまでの閾値が異なるからだ。それぞれのファイルは、対応する検索エンジンに対してのみ、極限まで最適化される。

こうしたファイルは、対象外の検索エンジンに読み込まれると、しばしばbanされ、その被害が同じドメイン上の他のファイルにまで及んでしまうことがある。対象外の検索エンジンにとっては、閾値を超えているのだ。

だからスパマーは、対象とする検索エンジンだけがそのファイルにアクセスできるように、robots.txt を設定する。Exciteだけが対象なら、ArchitextSpider だけにアクセスを許可し、その他のロボットを許可しないようにすればいい。より用心深い人なら、robots.txt ではなく、httpd.conf や .htaccess で制御する。UAだけでなくIPでも判別するのもいい。

しかし俺の場合は、例えそれがExcite専用のファイルだったとしても、他の検索エンジンを排除することはしない。ロボットは何でもウエルカムだ。そうしたほうが、他の検索エンジンの挙動が見れるので、かえっていいくらいだ。

俺は新しいトリックを試すたびにフリースペースに新しいアカウントを取得し、そこにファイル一式を置くようにしているので、最悪banされてしまっても特に問題ない。どうせフリースペースだ。また新たに確保できる。そもそも、今回のような危なそうなトリックを自前のサーバで使う奴はアホだ。

俺はフリーのメールアドレスを1つ用意し、それを使って Geocities と Tripod、それにEngelFire の計3ヵ所を回って、フリーのWebスペースを新たに確保した。どれもUSのサイトだ。わざわざUSを使うのは、どのサービスもUSが飛び抜けて利用者が多いため、少々無茶をしても目立たないだろうという目算からだ。もちろん、中米や西欧だと言葉の壁があることもある。

次の作業はファイル作りだが、これはもうほとんど自動でできてしまう。というのも、今回のトリックの対象であるExciteでは、ファイルが人の目に触れることを考えなくてもよく、したがってきちんとした文章や画像を用意する必要がないのだ。Exciteはインデックス更新の間隔が極めて長いために、このようなことが可能となる。

インデックスの更新は、新たなページを見つけるために逐次データベースに追加していく方式と、定期的にすべてのインデックスをまるごと更新する方式の2通りがあり、Exciteは後者だ。そして、その更新頻度は3ヶ月から6ヶ月に1度と、かなり間隔が長い。

これはつまり、新しいページがExciteの検索結果に表示されることを確認したら、ページを別のものに差し替えてしまっても、次の更新までの3ヶ月から6ヶ月はそのままの順位で表示され続ける、ということを意味する。検索結果の上位を確保したら、あとは好きな内容に差し替えるなり、どこか別のページにリダイレクトするなりすればいい。

インデックスを逐次更新する方式の検索エンジン、例えばInfoseekやLycosでは、こうはいかない。巡回申請を出してから新しい内容がインデックスに反映されるまでの期間が、Infoseekでは1日から3日、Lycosでは5日から8日ほどだが、このように更新が早いと、ページの内容を差し替えた場合、ライバルがさらに巡回申請を出してしまえばそれまでだ。数日後には差し替えた後の新しい内容がインデックスされ、順位は大きく下がってしまう。

これから作るファイルはまさに、インデックスされたことが確認できたら別のものに差し替えてしまうことを前提としている。これらのファイルが人目に触れることは想定しない。このため、拾ってきた文章をランダムに組み合わせたものをマークアップし、適切な場所に適切な回数だけキーワードを埋め込めば、それだけでファイルは完成する。文章になっている必要もなく、デザインも考える必要はない。

ファイルの生成は、FileMakerで作ったオリジナルの自動化ソフトを使う。キーワードのリストを読み込ませ、どの要素の中にどれくらいの割合でキーワードを埋め込むかを設定するだけで、あとは自動だ。あらかじめニュースサイトから適当にコピーしてきてDBに格納してある9,000行ほどの文をランダムに組み合わせてでたらめな文章を作成し、マークアップし、キーワードを挿入し、htmlファイルとして保存する。

今回はtitle要素を複数回記述するという特殊な条件が加わるため、ソフトを少し書き直す必要があったが、あとはそのままで使う。

キーワードは、ありきたりだが、女性の名前を使った。古今東西の女優やアイドル、モデル、女性アスリートや文化人などの名前およそ4,100名分を集めたファイルは、まさにスパマーの秘密兵器だ。このファイルを先の自動化ソフトに読み込ませれば、それぞれの名前に最適化されたファイルが自動で作られ、ローカルのフォルダに蓄積されていく。非力な旧型のPowerMacがうなりを上げた。

生成された総数4103に及ぶ膨大な数のファイルを Geocities と Tripod と EngelFire のサーバに分散してすべてアップロードし、それらの巡回申請を終えたたときには、すでに昼になっていた。あとはインデックス更新後のお楽しみだ。

このエントリはフィクションであり、実在の人物、団体、企業、事件等とは一切の関係がありません。

  1. トリック – 1/3 に戻る
  2. トリック – 2/3
  3. トリック – 3/3 に進む