DeNA 剽窃記事サイト事件を受けて,改めて DuckDuckGo を推奨する

DeNAが9メディアの記事を非公開に、転用奨励で批判相次ぐ | ロイター
DeNA、健康・美容サイト「WELQ」運営見直し 内容に「医療デマ」と批判相次ぎ
DeNA、「WELQ」騒動で「MERY」以外の9媒体を非公開に–守安社長「私自身の判断の甘さ」 – CNET Japan

 無内容で嘘偽りに満ちた極端に低品質な記事を,手段を選ばない SEO で強引に検索結果の上位に表示させる。そしてその内容は他のサイトからの剽窃――言語道断の所業です。
 しかし間違えてはいけないのは,こうした行為をしているのは DeNA だけではないということです。DeNA の場合,「東証一部上場の大企業がこんなことをしている」ということ,また資本がきわめて大きいことからいわば成功しすぎたために,結果として世間の耳目を集めているだけであり,同様のことをしている企業および個人は星の数ほど存在します。DeNA が事業を畳むなり倒産するなりしたところで,第二第三の DeNA がその地位を引き継ぐだけです。

 では,そもそもの原因はどこにあるのか? 考えるまでもありません。「ウェブでバカを騙すのはカネになる」から,これに尽きます。
 スマートフォンやタブレットの急速な普及によって多くの人がウェブにアクセスできるようになった一方,消費者のリテラシ――知識,警戒心――は今なお未発達であり,コンテンツを提供する事業者との間には情報の非対称性が広がっています。人々は新しいツールで得られる情報を貪欲にむさぼっています。質は一切問われません。多くのアクセスを得られるコンテンツである掲示板などのコピペブログの記事は,既にソフトウェアによる自動生成が一般的です。文章自体が自動生成であること,すなわちワードサラダであることも珍しくありません。こんなあからさまなゴミであっても,多くの人々にアクセスされ,場合によっては読まれるのです。DeNA の記事群も,ゴミ情報という点では同じであっても,人の手によって書かれていて文法・文脈的破綻が比較的少ないという点では,まだマシな方です。資金力さえあれば,毒,すなわち世論や消費行動の誘導を意図した偽情報を盛り込むことさえ,きわめて容易です。
 この怒涛のアクセスをカネに変える魔法がアドネットワーク(そしてアドエクスチェンジ)の広告です。これは広告出稿者と広告掲載者の間に入る一種の広告代理業であり,出稿者と掲載者が直接交渉や契約をせずに広告掲載ができるようになります。掲載者としてはページにちょっとした html タグを貼り付けるだけです。コンテンツの質なんてどうでもいいですし,かかるのは僅かなサーバ代・ドメイン代くらいです。あとは獲物が罠に誘い込まれて広告をクリックないしタップするたび儲けが生まれるのです。ゴミからカネが生まれる。なんと素晴らしい錬金術でしょうか!
 そして,消費者が情報にアクセスするためにまず訪れる場所が検索エンジン 1であり,検索結果の上位に表示されること,同じ検索結果ページに表示される他のページに何か加えたような内容にすることによってアルゴリズムに「他のページより価値がある」と認識させることが,錬金術の効率を高める一番の近道なのです(ゆえに他のサイトからの剽窃が多くなることは当然の帰結です)。

 もちろん,検索エンジンのプロバイダ,Google や Microsoft 等にとって,検索結果へのゴミ情報の氾濫は看過できるものではありません。提供する検索エンジンの価値を貶め,競合に対する競争力を失わせることにつながるからです。実際,時折アルゴリズムの改良によってスパムの排除が試みられています
 しかし,大手の検索エンジンプロバイダは同時に巨大な広告事業者でもあります。たとえば Google はその収益の9割以上を広告事業から得ています。先述の通り,検索エンジンに現れるスパムは広告収入が目当てであり,その広告収入の一部は検索エンジンプロバイダ自身の利益でもあります。つまり,抜本的な対策が困難であるばかりか,最小限度の対策に留めることによってこそ利益を最大化できる構造となっているのです。これらの広告表示には,出稿された広告を配信している同じ会社が検索エンジンとして収集した閲覧者の情報が利用されています。
 加えて,検索エンジンは特定のひとつのサービスが圧倒的なシェアを握りやすい傾向があります。独占的な地位を得ているサービスは国により異なりますが,1位のサービスは80%以上のシェアを握っていていることも普通です。また,グローバルでは Google が約76%(2016年12月現在)を占めており,全体でも独占構造になっています。シェアが奪われる見込みがなく,またシェアを奪える見込みもなく,検索エンジンの間に競争が働かず,消費者に対するサービスの改善への動機付けが存在しないということも,こんにちの混沌とした状況に至った一因と言えるでしょう。

 今のウェブ広告の仕組み自体が原因となって生まれている状況であるため,将来については悲観せざるを得ません。無内容なスパムに悩まされることがなくなるのは,金銭という動機付けが失われるとき,すなわち今のウェブ広告の仕組みが破滅するときであるので,これはかなり先になりそうです。
 消費者にできるのは自らの行動に自覚的になることです。中身のないサイトに不用意にアクセスして収益をもたらすことのないようにすべきです。Firefox のユーザであれば Hide Unwanted Results of Google Search が役立つでしょう。また,固定化したシェアを揺るがして検索エンジンプロバイダの間の競争を促すことも必要であるはずです。日本であれば Google や Yahoo! Japan の代わりにシェアの低い Bing を使うようにするだけでも違いますが,理想的なのは DuckDuckGo を利用することです 2。DuckDuckGo はプライバシの重視と意図的な操作のない(フィルタバブルのない)検索結果を売りとする検索エンジンです。日本語での検索結果の品質はまだまだといったところですが,概ね実用的な水準に達しています。現在のところ DuckDuckGo は自前のクローラに加え Yandex など他の検索エンジンの検索結果も利用しており,スパムもありますが,少なくともスパムサイトと利害が一致してはいません。もしも DuckDuckGo のようなサービスのシェアが大手サービスに並ぶような事になれば,他の検索エンジンプロバイダに対するこれ以上ないほどの強烈なメッセージとなることでしょう。

16/12/03 加筆修正。タイトルの「コピペ」が不正確であったことから,「剽窃記事」に修正。

Notes:

  1. この記事では本来の意味の検索システムとしての検索エンジンのことではなく,ウェブ検索サービスを提供するポータルサイトの意味でこの語を使っていることを註記しておきます。
  2. 同様の存在として Searx というものもあり,こちらもおすすめです。Searx は DuckDuckGo と違いサーバサイドのシステムそのものが自由ソフトウェア(AGPLv3)として公開されているのが特長です。ただしこちらは検索エンジンとしての独自性を志向してはおらず,既存の検索エンジンの検索結果を組み合わせて使用するメタ検索エンジン以上のものになることを意図したプロジェクトではありませんので,既存の検索エンジンに与えるインパクトは限定的でしょう。

コメントを残す

メールアドレスが公開されることはありません。