查證 SEO 都市傳說:痞客邦部落格會偷改文章日期?

什麼是 SEO? 基本上就是針對搜尋引擎的各種功能特性,還有預期使用者會在網路上尋找的東西,進行有價值的線上內容的佈局。

但卻總有人以為 SEO 就只是網頁設計公司或工程師的責任,網頁排名沒有在第一名,一定是網站沒有某某功能,一定是網站用一些 SEO 檢測工具測出來沒有滿分的缺失,責任通通在部落格/網站CMS系統上。

今天(其實這是很久以前在別的地方寫的啦,重新整理後在這邊PO)來檢驗一個流傳幾年的 SEO 界的都市傳說,剛好跟修改網頁程式有關,就是「Pixnet 痞客邦部落格會偷改文章日期來提升排名?」

在社群網站隨便找了幾篇被人抱怨截圖的痞客邦部落格文章,這些文章有一個共同問題:在 Google SERP 顯示文章日期年份為今年或去年,但點進去一看,日期卻是很久以前的文章,類似下圖這種


(截圖的時候是 2022 年,SERP 顯示 2021 年,文章日期是 2011 年,差了 10 年)

SEO 又有不少關於文章日期與排名的都市傳說,一些部落客如果碰到競爭對手用痞客邦寫文章,明明內容寫得不怎樣,卻排在自己前面時,難免心裡犯嘀咕,懷疑是不是平台的 SEO 系統功能差異導致的?

對於瀏覽者也非常困擾,要上網找個食記或消費參考,明明看 SERP 上顯示今年的日期,結果點進去都是10年前的過期資訊。

而且剛好 pixnet 部落格特別多這種情況,來研究看看難道真的痞客邦網頁有什麼神奇的設計?

檢視原始碼可以找到 2021 年或 2022 年?

我不是痞客邦的員工,也沒去研究他們用什麼 tech stack,但考慮網頁內可能有 server side 或 client side render,所以直接檢視原始碼,或是使用 Devtool 檢查 DOM。

可惜日期相關的東西完全與發文日期相同,沒有發現網頁內有 2021, 2022 年的日期,也沒有日期被竄改的跡象。

文章內文本身通常也沒有其他時間日期,2011 年的食記,怎麼會平白無故提到 10 年後的東西呢?

meta dateModified 屬性的值有誤?

之前看到一位 SEO 前輩討論過此事,原文截圖中,有其中一個論點是說網頁裡的 meta dateModified 屬性放到 1970-01-01 錯誤的日期,所以 Google 會用其他日期來替代(例如爬蟲每次重新檢索時的日期),最終導致 SERP 出現異常的日期。

(看不到的可以點連結食夢黑貘 – 有人說搞不太懂網頁的時間,事實上的確有時沒那麼簡單)

但大 概2022/7 月檢查時發現那個 1970-01-01 的問題似乎已經被修正了,看似是正常的日期。
<meta itemprop="dateModified" content="2011-12-25T00:08:03.000000+0800">

其他相關的 meta 屬性中也沒發現有 2021 或 2022 的異常日期。

RSS feed 的日期有誤?

承上,該大大的論點之一是 Google bot 會抓 RSS Feed,
但檢查那些部落格的 rss feed,每一則文章的 pubDate 都與文章日期相同,沒有竄改年份 ,
整個 rss feed 檔案的 lastBuildDate,也是都與部落格的最新一篇文章日期相同,沒有竄改年份的現象。

sitemap 的 lastmod 有誤?

sitemap 內的連結有 lastmod 屬性,但也沒有發現竄改年份的現象,大致都與文章日期相同。

網頁針對爬蟲特製內容?

有沒有一種可能,痞客邦根據 Google bot 的 ip 和 userAgent 給出竄改日期的網頁?
測試把網頁丟到 Google rich results test tool 或相關工具檢查 Schema,抓到的日期大致也都是正常的。

之前有個沒在用的痞客邦部落格,把一篇從 2017 年就沒改過的的文章丟到 GSC 的網頁測試工具,從爬蟲拿到的網頁原始碼內,也沒找到日期被竄改的證據,所以這種針對爬蟲偷換網頁的陰謀論基本上也無法證實。

至於爬蟲第一次抓到的時間與更新時間,這只能站長到自己的 GSC 裡面看了。

而且如果是爬蟲來抓的時間,或是因為改了網頁資源的 cache busting version 文字,讓爬蟲以為網頁有更新。
也無法解釋為什麼通常只有年份異常,但是月份跟日期完全正確?

結論1: SEO 果然是玄學。
結論2: 如果有人指定要用這些奇怪的黑暗兵法,無法保證成效。

延伸閱讀

Tags: #meta#SEO
留言:

近期熱門 Hot Posts