Murga

個人的に言いたいコト・主張・気持ち。

インターネット上に情報を永続させる難しさ

最近、Qiita で個人情報の取り扱いがイマイチっつーことで炎上して、退会する人が多かったらしい。

読んだ記事がプロフィール欄に表示される、という機能で、その情報は Treasure Data という別の組織が Cookie を追跡して得ているようだった。この炎上については、自分は「『アダルトサイトで同じことをやったら大問題』とかいうけど、Qiita はアダルトサイトじゃねえし」「そんなに見られてやましいモンばっか Qiita で見てんのかお前ら」ぐらいにしか思っていない。好きにしたらいいと思ってる。勿論、気にする人は気にするだろうし、もっと良いやり方があったんだろうな、とは思う。でも個人的には、どうされてもいい。

で、この炎上により Qiita を退会する人が多かったので、(ユーザの退会により) 有益な情報が失われた、という嘆きも見られた。今日の本題はココ。

失われるハイパーリンク

インターネット (WWW) の当初の思想は、

  1. URI によって文書 (→ 情報) を一意に示し、
  2. それらをハイパーリンクという技術で相互にリンクできるようにし、
  3. 情報を永続させる

といったモノであった。

しかし実際は、

  1. 一つの URI が示す文書・情報は維持されない
    • SNS なんかは常に最新の投稿が見えたり
    • 静的サイトでも内容を書き換えてしまえば、同じ URL にアクセスしても得られる情報が異なってくる
  2. 「1.」により、ハイパーリンク先が消えていることが多い
    • 「参考文献」などとしてリンクを貼っても、対象がなくなっていては効果がない
  3. 情報は永続しない

のが現状である。

そもそも「Web 2.0」とかいって、動的なコンテンツが増えてきた以上、URI の思想は崩れつつあるかな、とは思うが、それにしても、情報はなかなか永続しない。

データが永続されなかった事例

ホスティングサービスの提供終了とかで、データがインターネット上から消滅した例は数え切れない。個人的にも影響が大きかったモノを軽く調べ直してみた。

  • 2008年02月 : DivX Stage6
    • 動画サイト。「ほとんど違法コンテンツだっただろ」というツッコミもあるだろうが、純粋に「失われた情報」という意味では当てはまるかと
  • 2009年10月 : アメリカ版 Geocities
    • 老舗ポケモンサイトなどが消えてしまい、ミラーサイトに頼ることになる
  • 2010年10月 : Infoseek isweb ライト (有料版のベーシックも2012年に閉鎖)
    • コレは大きな損失だと思う
  • 2011年05月 : Google ビデオ
    • YouTube に統合・動画の移行やダウンロード期間はあった
  • 2013年07月 : Google リーダー
    • RSS リーダなので、このサービス自体が消えても失われる情報はなかったが、RSS そのものから遠ざかる人が多かったのも事実
    • 自分は Feedly に移行して今でも愛用中
  • 2014年10月 : Twitpic
    • Twitter は元々画像を投稿する機能がなく、こうした外部サービスを使っていた
    • Twitter 本体が画像投稿機能を備えたが Twitpic のデータは保持されず
  • 2016年03月 : Picasa
    • Google フォトへ移行
  • 2016年09月 : 前略プロフィール
    • 中高生の思い出が消滅
  • 2017年01月 : Vine
    • Instagram 的な動画投稿 SNS。自分は使っていなかったが影響はそれなりにあったと思う
  • 2017年05月 : FFFOUND!
    • このサービス好きでよく使ってたけど、いつの間にか消えてた
  • 2017年06月 : Del.icio.us
    • はてブ的なブックマークサイト。Pinboard が吸収
  • 2019年02月 : はてなダイアリー
    • 一応はてなブログへの移行は受け付けていた
  • 2019年03月 : Yahoo! Geocities
    • XREA などが無料で移行サービスを提供したりはしていた
  • 2019年04月 : Google+
    • あまり使われなかった SNS
  • 2019年12月 : Yahoo! ブログ
    • Yahoo! はジオシティーズだけでなくブログサービスも終了

…と、こんな感じで、思い出せるだけでも相当数のサービスが終了し、それに伴ってホスティングされていたデータが失われている。

一部は Archive.org などで閲覧できたり、別のサービスにデータ移行していたりするとは思うが、大半は失われてしまった。

ハイパーリンクするだけでは情報を残せない

僕が痛感するのは、「参考文献へのハイパーリンクを貼るだけでは、情報を残し続けられない」ということだ。

元のサイトが消えてしまうのは、もはや仕方がない。URI も永続させるのは難しい。

であればせめて、自分がその情報にリンクする時にできるだけ自分の記事に「引用」という形でコピーを作っておくしかないのかな、と思っている。リンクしながら併せて引用する、ということだ。引用の範疇や是非については意見があると思うが、「自分が有益だと思ったその情報を残し続けるには」を考えると、できるだけ多くのコピーを作ることしかないだろう。

リンク先のサイトがなくても完結する文書を書く

ある情報をインターネット上に維持し続けるには、引用によるコピーをとるか、自分で情報をまとめ直す必要があると考える。コレはそのドキュメント単体での質を高めることにも繋がると思う。

リンク先を見ないと完全に理解できないような記事は、リンク先が消えてしまった時に有用性が下がるワケだ。引用なりまとめ直すなりして、自分のドキュメント内にその情報があれば、そのドキュメント単独で完全な情報を得られるので、質が高まる。ウェブ上の広告収入の観点からしても、リンク先のサイトに「離脱」されることが少なくなると思われる。

個人的には Evernote などにクリップする

ココまでの話は、一度インターネット上に公開された情報を、できるだけ長くインターネット上で得られるように維持するための考え方だった。

別に自分さえ読めれば良いのであれば、Archive.org にクロールさせるでも良いが、オススメは Evernote などを使ってウェブページ全体をクリップ (ダウンロード) しておくことだ。最終的にはローカルに持っておくことで、「インターネット上から消えても取り戻せる」ようになるだろう。


雑に魚拓とったり、見たページのリンクを SNS に投稿したりするだけじゃなくて、ちゃんと本文や画像を含めて、まるっとコピーしておくしかないなぁ、と思うのであった。

Internet Archive(Unofficial)

Internet Archive(Unofficial)

  • 発売日: 2016/12/12
  • メディア: アプリ