トリック – 1/3

このエントリはフィクションです。

1998年、日増しに暖かくなる気温に気持ちも緩みがちになる春の日のことだった。画面の向こうのチャットルームは、世界中のスパマーたちで賑わっていた。時刻は午後10時。アジアのスパマーにとっては夜、ヨーロッパのスパマーにとっては昼。そろそろアメリカのスパマーたちも起きてくる。

ここは世界中のスパマーたちの情報交換の場だ。やりとりはすべて、俺の苦手な英語で行われている。はじめのうちは自分のつたない英語が恥ずかしくて発言できなかったが、中央アジアや東アジアや中央アメリカの連中が発する怪しげな英語に触れるうちに、恥ずかしいなんていう感覚は失せ、発言もできるようになった。

夜更かしのアジア人と、昼休みのヨーロッパ人、早起きのアメリカ人が入り乱れるこの時間帯は、ちょっとしたラッシュアワーだ。有益な情報も飛び交うが、子細を確認するのは難しい。少しでも書き込みを躊躇すれば、話題は先へ先へと流れていく。参加は反射神経が勝負だ。

そんな熱狂的とも言える時間帯、常連の北米人 PositionMonkey の発言が俺の目を引いた。

「これを見てください。私はExciteをxxxxして、彼らに糞を食べさせることに成功しました」

その発言に続いて、US Exciteの検索結果を呼び出すリンクが並ぶ。検索ワードは、Bill Clinton(ビル・クリントン)、Monica Lewinsky(モニカ・ルインスキー)、Presidential Scandal(大統領のスキャンダル)だ。どのキーワードで検索しても、1位にヒットしたのは同じページで「All About “Relationship that was not Appropriate”(不適切な関係のすべて)」というものだった。

ページの内容は、大統領のスキャンダルについての文章も多少はあるものの、大半は出会い系サイトのアフィリエイトだ。これには驚いた。

奇妙なのは、キーワードをタイトルに含まない文書が1位にヒットしていることだ。しかもキーワードは複数で、どれも極めて検索数が多いと思われるものばかりだ。いったいどんなトリックを使えばこんなことができるのか。

俺は素早くソースをチェックした。なんと、タイトルタグが複数ある。全部で12個もの数のタイトルタグだ。俺はすかさず発言した。

「驚きです! 私はこのタイトルタグたちによるトリックを研究する必要があります。あなたの挑戦は必ずみんなの賞賛を浴びます」

ソースを保存しようと再びページを開くと、ソースが書き換わっていた。タイトルタグは「All About “Relationship that was not Appropriate”(不適切な関係のすべて)」と書かれた1個だけになっている。当時の検索エンジンにはソースのキャッシュ機能はない。俺は急いで書き込んだ。

「やあ PositionMonkey、私にはそのコードはすでにアップデートされたように見えます。私は以前のコードを見ることができますか?」

数秒の間があり、レスがつく。

「私がアップデートしたのはtitleタグだけで、その他のコードはそのままです。私が ArchitextSpider に食べさせた xxxx’n コードでは、私は正しいタイトルタグの下に、キーワードだけを書き入れたタイトルタグを並べていました。あなたが入れるべきタイトルタグの数は、1つのキーワードについて3つずつです」

「あなたに感謝します。私は今すぐにそれを試みます。私がうまくExcite Japanのお尻を蹴ることができたら、私はすぐにここで報告するでしょう」

たまにこういうことがあるから、海外の最新情報を追うことはやめられない。

1998年当時の検索エンジンのランキングアルゴリズムは、どれもそう賢いものではなかった。キーワードとコンテンツの関連性が高いとみなされる要因を満たすごとにスコアを加点していき、そのスコアの合計点が大きいものから順に検索結果に表示される、というような単純なものだ。

例えば、あるキーワードについて、title要素にそのキーワードが含まれていればプラス10点、b要素に含まれていればプラス2点、h1要素に含まれていればプラス1点、といった具合にスコアを加算し、そのスコアの合計の高いものほど高い順位を得る、というわけだ。

ただし、やり過ぎてスコアが閾値を超えるようなことがあると、スパムとみなされてbanされる。したがって、無闇にキーワードを詰め込めばいいというものでもない。スパマーの腕の見せ所は、この閾値を探り、閾値ぎりぎりのファイルを作ることだ。

Exciteの場合、title要素の中でキーワードを3回以上繰り返すのはNG、というのがスパマーの間で共有されていた常識だった。ところが今回の情報では、title要素そのものを複数回記述することによって、1つのtitle要素の中で使えるキーワードの回数の制限を突破してしまった。

Excite検索の開発者も、まさか1つのhtmlファイルにtitle要素を10回も書き入れるスパマーの登場は想定していなかったのだろう。検索エンジンの開発者でも気づかないような盲点を鋭く突いたスパマーの大勝利だ。

やってみるまでは日本のExciteに通用するかはわからないが、成功すればとんでもない儲けが転がり込む。検索ポータルとしてのExcite Japanは、前年末に日本でのサービスを開始したばかりだが、わずか数ヶ月のうちに急成長を遂げている注目株だ。今のうちから仕込んでおくのは悪くない。

それに、日本語での攻略が成功し、その方法を海外のスパマー連中と共有すれば、コミュニティに貢献できる。より多く貢献する奴ほど多くの信頼を集める、というのはスパマーのコミュニティでも同じことだ。コミュニティに参加するのは、そこから得られる情報だけがインセンティブじゃない。貢献できるという実感が得らることもまた、重要なインセンティブだ。

日本語なんていうローカルの情報でも、求めている奴はたくさんいる。東アジアの連中だ。台湾のスパマーが使う北京語や、香港のスパマーが使う広東語、韓国のスパマーが使う朝鮮語などは、日本語と同じく2バイトで、ヨーロッパ言語と違って単語と単語の間にスペースがないことも共通だ。日本語での事例は、彼らの役に立つ。

俺は猛然と作業を開始した。今夜は長い夜になる。

このエントリはフィクションであり、実在の人物、団体、企業、事件等とは一切の関係がありません。

  1. トリック – 1/3
  2. トリック – 2/3 に進む
  3. トリック – 3/3 に進む

ブログ内の関連する記事

広告

 RSS購読で最新情報を取得

トラックバックURL