现在很多博主都喜欢用 WordPress 博客程序来给自己搭建一个个人独立博客,而且很多都是新手建的新站,我们在运营网站的时候肯定是希望查看我们当前的网站的运行状态,内容是不是有被搜索引擎抓取。在发表了几篇文章后会经常关注搜索引擎的收录情况,不过很遗憾,搜索引擎都有一个考核期,这样很多新站刚开始的时候就不会被收录,最后就会想,搜索引擎的蜘蛛到底来过没有啊?其实查看蜘蛛来访记录的方法很多,有插件、后台日志查看等,不过最近我收藏了一个用代码来实现的小方法,用过之后感觉还挺好的,所以放在这里和需要的朋友分享一下吧!
下面我给大家记录一下无插件,仅需要几行代码就可以轻松实现查看网站蜘蛛爬行记录。
- function get_naps_bot(){
- $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
- if (strpos($useragent, 'googlebot') !== false){
- return 'Googlebot';
- }
- if (strpos($useragent, 'msnbot') !== false){
- return 'MSNbot';
- }
- if (strpos($useragent, 'slurp') !== false){
- return 'Yahoobot';
- }
- if (strpos($useragent, 'baiduspider') !== false){
- return 'Baiduspider';
- }
- if (strpos($useragent, 'sohu-search') !== false){
- return 'Sohubot';
- }
- if (strpos($useragent, 'lycos') !== false){
- return 'Lycos';
- }
- if (strpos($useragent, 'robozilla') !== false){
- return 'Robozilla';
- }
- return false;
- }
- function nowtime(){
- date_default_timezone_set('Asia/Shanghai');
- $date=date("Y-m-d.G:i:s");
- return $date;
- }
- $searchbot = get_naps_bot();
- if ($searchbot) {
- $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
- $url=$_SERVER['HTTP_REFERER'];
- $file="robotslogs.txt";
- $time=nowtime();
- $data=fopen($file,"a");
- $PR="$_SERVER[REQUEST_URI]";
- fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n");
- fclose($data);
- }
然后我们将代码插入到当前的主题 Functions.php 文件中,然后我们需要在网站根目录创建一个文件,文件名命名为:robotslogs.txt。
并且需要给予写入的权限。这样,我们可以通过这个 TXT 文本定期检查是不是有蜘蛛爬行记录。我们还可以利用这个日志文件进行可视化数据展现,这个需要用到数据调取方式。
文章標題:代码实现WordPress获取搜索引擎蜘蛛抓取记录
文章連結:https://www.wuyanshuo.cn/1416.html
更新時間:2022年10月20日
1、本站所有資源均不添加推廣檔案或浮水印,壓縮包內若有廣告檔案和浮水印請勿輕易相信。
2、本站資源均為兩層壓縮,第一層7z(尾碼若為wys,請自行修改為7z)有解壓密碼; 第二層zip或cbz,無解壓密碼,可直接使用漫畫類軟件程式查看; 詳情可參攷解壓教程。
3、本站大部分內容均收集於網絡! 若內容侵犯到您的權益,請發送郵件至:admin#wysacg.top我們將第一時間處理! 資源所需價格並非資源售賣價格,是收集、整理、編輯詳情以及本站運營的適當補貼,並且本站不提供任何免費技術支援。 所有資源僅限於參攷和學習,版權歸原作者所有!