個人ページの公開法|組織の中の研究者・技術者|アクセス解析|アクセスログと個人情報|こまごました疑問|その他
私のページのようなスタイルの個人ページを公開する場合に参考になりそうなことの中で、やや技術的でこまかいテーマについて書いています。
手間をかけずに自分のページの読まれ方を知るには(2003/8/8)
アクセス解析利用レポート(2003/9/6)
(「最少の労力でアクセスログを取るには」を改題--2003/8/17)
専門知識を持つ人たちが自分の知識を一部分でもネット上で公開してくれたら、多くの人の役に立つだろう。そんなことをしてみようと考える人の参考になればと、ここで私なりの方法論を書いている。ところで、公開された情報は本当に役に立っているのか?それを確かめる方法がないならば、有用そうな情報を持っていても、実際に公開する動機は生まれにくいと思う。書くこと自体が楽しい趣味的なページというわけではないのだから。
誰でも思いつくのは、掲示板を設置したり、読者からのメールを歓迎する呼びかけを載せることかもしれない。私もこの個人ページを公開して以来、何人かの見知らぬ読者の方からメールをいただいた。そういうことがあると、素直に感激する。
でも、メールをくれるほどの読者は、全体のほんの一部だろう。特に専門的な情報の場合は、それが役に立ったからといってメールを出すような人は少ないと思う。また、メールが非常に多く届くようになって返事を書くのが負担なほどになっては困るという心配もある。だから、私のページではあまり積極的に読者からのメールを求めていないし、掲示板も設置していない。
メールや掲示板のようにレスポンスを返す必要がなく、それでいながら、何人くらいにどのように読まれているのかを知る方法はないのか。インターネットに詳しい人には自明のことだけど、そういう方法はある。私がアクセスログというものがあることを知るようになったのは、黒木玄さんのサイトで自己紹介をしなければ安全かという文章を読んでからだった。
それまで、ウェブページを読むのは、あたりに誰もいない場所で張り紙を読むようなものだと思っていたが、実は、張り紙にはのぞき穴みたいなものがあって、サイトの管理者には、その穴からこちらが見えているらしい。つまり、インターネットを通じて私のコンピュータが目的のページにアクセスするとき、相手のコンピュータ(サーバー)はタダでは情報をくれず、あれこれ質問してくる。私のコンピュータ(または仲介役のコンピュータ)は勝手に質問に答える。相手のコンピュータはそれらを記録する。この記録が、アクセスログというものだ。そんな仕組みを知ると、何だか気味が悪くなった。また、自分のホームページを持てば私もアクセスログを読めるのだろうかと漠然と思った。
しかし、実際に個人ページを置くためのサーバー探しをしてみて、そんな簡単なものでないことはすぐにわかった。まず、初心者が手軽に利用できるサーバーは、アクセスログを取るような操作にあれこれ制約をもうけているところが多い。たぶん、利用者が各自でそういうことをするとサーバーの動作に思わぬ障害が出る可能性などがあるのだろう。自由度の高いサーバーは本格的な利用者向けで、高機能・高価格になっている。それから、サーバーが許可していたとしても、アクセスログを取るプログラムを自作するか探し出すかして、自分のページ用にカスタマイズする必要がある。私はついこの間までHTMLファイルの書き方さえ知らなかったレベルなので、そんなことはとてもできないし、勉強する気にもならない。
ところが、素人でも簡単にアクセスログを取れるサーバーがあった。このページを置いているBIGLOBEでは、ホームページ分析パックというサービスを提供している。私がホームページをBIGLOBEに置いている理由はただ一つ、分析パックを利用するためだ。それだけを基準にプロバイダを選んだ。
ではいったい、BIGLOBEの分析パックを使えば、どの程度の情報が入手できるのか。解析結果は、利用者だけがアクセスできるウェブページで読む仕組みになっているので、その画面のサンプルを見ていただくのが早いと思う。1回のアクセスごとに「訪問日時・リンク元URL・接続元ドメイン・OS・ブラウザ・訪問回数・前回訪問日時」の7項目がまとめて示される。また、これらの項目ごとに、日ごとや月ごとの推移や内訳をグラフ化したデータも読めるようになっている。
私の場合、この程度のことがわかれば、自分の公開した専門的な情報がどんな感じで役に立っているかざっと確かめるのに必要十分だ。大多数の初回来訪者は検索エンジン経由でアクセスしてくる。「リンク元URL」を参照すれば、訪問者が使った検索語が漏れなくわかる。検索語を見れば、その人がどんな情報を求めているのか、そして、自分のページがそれらの人たちにどの程度役に立つか、推定することができる。ホームページで単に専門用語を多数並べるだけでなく、ちゃんとまとまった文章を公開している限り、それらの用語の周辺を説明する役には立つはずだし、少なくとも、用語の例文を一つ提供することにはなるだろう。
また、検索語を見て、ページの充実につなげることもできる。例えば、「フタル酸エステル 分析法」で訪問してくる人がそれなりに存在していることがわかった。食品中のフタル酸エステル類と塩ビ手袋のページは国立衛研在職中から公開しているが、一般向けなので分析法に触れていなかった。検索語に催促されて、先週分析法の項を書き足した。それから、「カルバミン酸エチル」でアクセスしてくる人がけっこういる。研究内容の紹介でこの語が出ているからだ。このテーマは私がほんの新米の頃に与えられたもので、論文も一つしかないのだが、せめてその一つの論文の要約でも、近日中に載せたいと思う。(2003/8/31 掲載してリンクした。)「Horwitzの式」の語を含む日本語ページは、現時点では私の残留農薬多成分スクリーニングに関わる試験技能評価のみだ。この語で検索してくる人がいるということは、もう少し詳しい説明を書いておくほうがいいかもと思っている。
検索でアクセスしてくる訪問者が一定数いるとわかると、一応は「役に立っている実感」が得られる。しかし、見知らぬ人たちに辞書がわりに使われるだけで大きな満足感があるという奇特な書き手は、少ないのではないだろうか。やはり、検索で自分のページを見つけた人たちが、専門家としての自分個人にも少しは興味を示し、もっとよく知ろうという気持ちになってくれたことが確認できれば、書き手は嬉しいと思う。
「リンク元URL」の項目では、自分のページどうしの間の移動も把握することができる。つまり、訪問者が検索でヒットしたページだけでなく別ページへも移動した場合には確認できる。これは、訪問者が書き手についてもっと詳しく知ろうとしたか、あるいは別のページにも興味を持ったことを示しており、単に専門用語の文例として以上に考えたことを意味する。そして、訪問者が私のページを「お気に入り」や「ブックマーク」に登録して後日再来訪した場合には、「リンク元URL」は「不明」と表示される。大多数の訪問者は一度きりなのだが、このように再来訪してくれる人も存在することがわかると嬉しくなる。
ホームページ分析パックを使うと、だいたいこんな感じで自分のページの読まれ方がわかる。ただし、実際に使っている経験上では、情報収集の精度はかなり大ざっぱで漏れが多いから、きっちり漏れのない解析をしたい人には不満だと思う。このへんのことはこまかい話になるので、またの機会に書きたい。(2003/9/6 この下の記事に書いた。)「それから、アクセスログによって個人情報がわかってしまうのではないかと心配になる読者は多いだろうから、この分析パックに関する限りそこまでのものでないこともいずれ書きたい。とりあえず、心配な方は、BIGLOBEが提供している アクセス解析と個人情報のページを読んでみてほしい。(2003/9/13 私のサイト内にも アクセスログと個人情報のページを作った。超初心者向け。)
今のところ、私が発見しているアクセスログ取得法で最も労力が少なそうなのは、上記の分析パックだ。断っておくが、最少の労力というのは、サービスを探す手間も含めて最少という意味だ。何しろこのホームページは、私が個人ページを公開した経緯で書いたとおり、思い立ってから公開まで2週間しかかけていない。サーバーも3日ほどで決めた。もっとよく探せば、さらに労力の少ない方法が見つかるかもしれない。また、同程度の労力で、より詳細な情報の得られる方法があるかもしれない。そういう方法を知っている方は、ぜひメールで教えてほしい。私自身が乗り換えるのは手間がかかるからやらないと思うが、ここで紹介すれば、これからホームページを持つ人の参考になるだろう。
2003/8/9 追記
既にホームページを開設している人にも手軽に利用できるアクセス解析サービスが多数できていることを発見した。「アクセス解析」で検索をかける
だけで最新のサービスのリンクや広告がまとめて参照できる。ざっと見たところでは、インフォシークのアクセス解析は手頃な価格で、BIGLOBEのサービスよりも内容が充実している。試みに、このページに無料版を設定してみた。広告が表示されて目ざわりかもしれないが、御容赦いただきたい。何週間か後に、使用実感を報告したいと思う。
2003/8/17 追記
インフォシークのアクセス解析は、BIGLOBEの解析よりも少ない労力で多くの情報を得られることがわかったので、料金を支払って解析ページ数を増やした。現在、いくつかのページはBIGLOBEの解析と併用している。しばらく比較した後に、おそらくBIGLOBEの解析を解除すると思う。
アクセス解析に興味を持たれた方のために、サービスを利用しての実感など書いておく。私は現在、BIGLOBEのホームページ分析パック(個人ページ開設当初から利用)と infoseekのアクセス解析(8月17日から全面的に利用)を併行して使っている。2社のサービスを比較することで、これから解析を始める人が何をポイントにサービスを選べばいいか、ある程度イメージできる文章になるかもしれない。
得られる基本情報は、2社のサービス間に大きな違いはない。両社ともCookieを使用しており、アクセスごとの「訪問日時・リンク元URL・接続元ドメイン(リモートホスト)・OS・ブラウザ・訪問回数・前回訪問日時」を表示し集計する。infoseekのほうは「画面設定」と「初回訪問日時」も解析対象。大きな違いは、解析できるページ数がBIGLOBEは5ページだけ、infoseekは50ページという点だ。それから、infoseekの方がきめ細かいデータ処理に対応している。例えば全ページのログや集計結果を一画面で見ることもできるし、特定のページのみに絞って見ることもできる。BIGLOBEの結果表示は5つのページが独立していて、それぞれを開かなければ読めないため、私はほとんど表紙の分しか見ていなかった。infoseekのサービスを利用し始めてから、他のページの分も合わせて見るようになった。
BIGLOBEの解析だけを利用していた時から、アクセスがあっても記録に残らない場合があることに気づいていた。なぜなら、私が自宅で使っているPCから自分のホームページへアクセスしても、BIGLOBEのログには全く残らないからだ。これに対してinfoseekのログには私のアクセスも捕捉される。このような状態のコンピュータは、それなりの頻度で存在するらしい。この3週間、表紙のページとマトリックス効果のページで比較してみた。その結果、infoseekでのカウントを100%とすると、BIGLOBEでのカウントは、表紙ページではトータルアクセス56%、ユニークアクセス84%だった。マトリックス効果のページではトータル63%、ユニーク85%だった。トータルアクセスはページが読み込まれた全回数で、ユニークアクセスは同じコンピュータからの読み込みを1日1回だけ数えるもの。マトリックス効果のページはリピーターがほとんどいないので、こちらの方が表紙よりも偏りのないデータになっていると思う。
「解析用タグ」がページの先頭付近にあるか終わりのほうにあるかは、アクセス漏れに影響する。タグが後の方にあるほど、アクセス漏れになりやすい。上記の比較はBIGLOBEのタグを前に、infoseekのタグを後ろに置いて行っているので、BIGLOBEのカウント数が少ないのはタグの位置のせいではない。考えられる原因だが、私のブラウザの場合は不具合があり、いろいろなページのアクセスカウンタで「888888」とおかしなカウントが表示されてしまう。これがログをすり抜ける原因と共通しているような気がする(注)。また、日によっては、ユニークアクセスでinfoseekのほうが少ないときがある。(これはタグの位置が原因かもしれない。)詳しく追究する暇はないけれど、解析サービスでアクセスをすべて把握できるわけではないようなので、infoseekのログにも100%は期待していない。
どちらの解析でも、訪問者の接続元(ドメイン名)は基本的に「yahoobb*****.bbtec.net」や「*****.ocn.ne.jp」のように表示される。この「*****」の部分は数字だったり記号だったりするけれど、同じコンピュータであっても接続のたびに変わるものらしい。従って、この情報だけを頼りに特定の訪問者に注目したり過去のアクセス歴をたどることはできない。この項目、BIGLOBEの解析では、「接続元ドメイン 不明」という分析結果がかなり多いが、infoseekでは不明というものはなく、「***.***.***.***」のような数字が示される。
接続のたびにドメイン名が変わるのに「訪問回数」や「前回訪問日時」が表示されるのは不思議だが、これを調べるためにCookieという技術が使われているそうだ。どうも、解析サービスが、訪問してきたコンピュータに「何月何日何時に訪問、何回目」という情報を書き込むらしい。これは人様のコンピュータを汚しているようで心苦しい。私はそこまでの情報は望んでいないのに、サービスに組み込まれていて無効にすることができない。Cookieが嫌な場合は、訪問者の側で無効にすることができる。ただし、最近ではCookieを利用しているサイトは非常に多くて、無効にしてしまうと利用できなくなるサービスがあるようだ。私は試しに「高」という設定にしてみたら、infoseekにログインできなくなった。
BIGLOBEの解析サービスでは、検索語はそのまま表示されず、たとえばhttp://www.google.co.jp/search?q=%E6%B4%A5%E6%9D%91%E3%82%86%E3%81%8B%E3%82%8....のように表示され、クリックすれば検索結果のページへ移動して検索語がわかるようになっている。つまり、10回分の検索語を知るには、10回検索結果ページを表示しなければならない。これは手間のかかることで、とても全部は見ていられなかった。infoseekの解析では、全ページ分の検索語がアクセス回数とともに瞬時に表示される。私は読者とのコミュニケーション手段として検索語を重視しているので、たいへんありがたい。
BIGLOBEの閲覧用アクセスログは、100アクセスを超えたら古いものから消去されてしまう。(統計データは6ヶ月間保存される。)infoseekのログは1ヶ月保存。ログを全部読むのはそもそも無理なことだけれど、それにしても暇なときには100件よりは多く目を通すことができる。保存期間は長いほうがよい。
一ヶ月当たりの利用価格はBIGLOBEが150円(月払い)、infoseekが250円(年払い)。infoseekの解析はホームページがどこにあっても利用できるのに対し、BIGLOBEはBIGLOBEで開設しているページのみが対象。サポートはBIGLOBEの方が初心者向けで親切だ。解析タグの埋め込みなど、HTMLファイルの書き方を知らなくてもできるよう、トータルにサポートされている。infoseekは上級者向けなのか、そこまで手取り足取りやってくれない。もっとも、私程度の勉強でも、タグの埋め込みは全然たいしたことではない。私は自分でタグを埋め込んでいる。
不便を感じているのは、自分自身のアクセスがカウントされてしまうこと。チェックのためにアクセスする時は仕方ないと思うが、自分のコンピュータに保存しているファイルを読んでもカウントされる。従って編集作業時にはオフラインにしている。(これはinfoseekの解析に限っての話。BIGLOBEの方は、そもそも私のアクセスに反応しないのでどうなっているかわからない。)特定のアクセス者をカウントしないサービスを提供しているところもある。(例。)それから、BIGLOBEのサービスでは、1時間ごとのアクセス数データを6ヶ月分、CSVファイルとしてまとめてダウンロードできる。infoseekのサービスは集計結果をグラフ等で示すだけで、表形式のファイルで提供されるデータはない。データの保存を重視する人にとっては不便かもしれない。
上記のような比較の結果私は、BIGLOBEの解析は今月一杯で解約してinfoseekのものだけにすることにした。解析サービスはこの2社以外からも多数提供されている。解析をどのように利用するかは人それぞれだが、私の場合はメールや掲示板を使う代わりにアクセスログを使っており、集計前のログをときどき読む。infoseekを選んだのは、ログの読みやすさや保存期間を他と比較しての選択だ。もっとも、サービスの比較検討にたいした労力を使ったわけではないので、より私の目的にかなったサービスが他で提供されている可能性は大いにある。有用な利用体験をお持ちの方は、メールで教えてほしい。
(注)
この部分の表現は読者にセキュリティ上の不安を抱かせるかもしれないのでちょっと補足。「888888」とおかしなカウントが表示されてしまう現象は、ブラウザが「Referer:」というHTTPヘッダを出力していないことが原因であり、私が読んだ限りの解説によれば、ブラウザを最新バージョンに更新すれば解決するらしい(解説の例)。しかし、それに従って対策してみたけれどまだ解決していない。なお、私のコンピュータのウイルスチェックは、Norton AntiVirusを使用してオンラインごとに自動でライブアップデートを行っている。
追記(2007/12/22)
アクセス解析サービスをinfoseekのものからAccessAnalyzer.comのものに変更しました。
管理者:津村ゆかり yukari.tsumura@nifty.com