大家都知道在網(wǎng)站優(yōu)化過程中需要進行數(shù)據(jù)分析,而收錄指標(biāo)是眾多數(shù)據(jù)里尤為重要的一個,并且很多時候我們不僅要查看網(wǎng)站每天更新的收錄情況,還要查看整個網(wǎng)站更新頁有哪些頁面沒有收錄,而通過百度站長平臺查看子欄目收錄量或通過在百度利用site+inurl 高級搜索只能查看更新欄目頁的收錄量,還是不能知道哪些沒收錄。一般情況下都是利用批量收錄查詢,但是這個問題來了,這個需要網(wǎng)址,大量的網(wǎng)址,如何快速獲得網(wǎng)站更新頁全部網(wǎng)址呢? 今天就給大家講一個方法。
一、打開火車采集器,新建一個名為“更新欄目網(wǎng)址”的任務(wù)。
二,點擊起始網(wǎng)址框的添加按鈕,如下圖,選擇“批量/多頁”。這一步是最重要的了,我以木木seo 博客為例,大家可以看到更新欄目頁一共12 頁,地址基本一樣,只不過是最后一個數(shù)字在等差遞增,所以可以利用通配符和等差關(guān)系按下圖進行設(shè)置,大家的網(wǎng)站更新欄目也肯定是有這個規(guī)律的,仔細看一下就可以進行設(shè)置。
三、點擊多級網(wǎng)址獲取的添加按鈕,選擇網(wǎng)址獲取選項,按照頭尾從選定區(qū)域提取網(wǎng)址,這里我用的這樣的個頭尾,為什么?因為查看博客源代碼可以發(fā)現(xiàn)更新頁的每頁所有文章的網(wǎng)址都位于這2個注釋代碼之間,你的網(wǎng)站也一樣,觀察網(wǎng)站源代碼,然后加入包含列表頁的頭尾代碼或其他特征文字,點擊保存。
四、到這里可以說就完了,我們不用設(shè)置內(nèi)容采集和發(fā)布,直接點擊測試網(wǎng)址采集,在彈出的框里面點擊導(dǎo)出一級節(jié)點就OK 了。
好了,到這里就完了,在圖上可以看到導(dǎo)出的一級節(jié)點網(wǎng)址,和博客總共的更新文章數(shù)量完全吻合。