WordPressで使えるアクセスカウンタープラグイン Counterize II を利用させてもらっているのですが、昨日検索クローラを発信している Baidu.jp に自身のURLを興味半分で登録してみてからアクセス数が少し変化したので調べてみました。
名高いBaidu。そのクロールは結構ヤンチャで有名。Baiduのユーザーエージェントを詐称してアタックしてくる輩もいるわけで、なかなか気に入られるチャンスがないクローラーだ。
今日気づいたのは、
Counterrize IIが認識しているクローラーのUser-Agentの中に、Baidu.jpが示すUser-Agentが記載されていないので、Counterize IIはBaidu.jpからのクロールをカウントしてしまうようです。
Counterize IIのphpファイル、counterize.phpに以下の記述がありました。
[php]
598 //
599 // Bots detected and excluded
600 //
601 // To add an entry to the array, simply create line looking like this:
602 // $botarray[] = “<text in user-agent string>”;
[/php]
なので、Baidu.jpが示すUser-Agentに含まれる「baidu」をcounterize.phpに追加してあげました。
Baiduが示すUser-Agentの一覧はこちら
[php]
598 //
599 // Bots detected and excluded
600 //
601 // To add an entry to the array, simply create line looking like this:
602 // $botarray[] = “<text in user-agent string>”;
603 $botarray[] = “baidu”; //追加
604 $botarray[] = “bot”;
605 $botarray[] = “Yahoo! Slurp”;
[/php]
以上
コメント