關鍵字和競品流量分析網站真的準嗎? 用手上的網站實測
市面上有一些競品流量工具,號稱可以看別人的網站流量(traffic,不是 bandwidth)狀況、分析別人網站的熱門關鍵字,費用一個月上百美金不等,那系統上面的數字真的準嗎?
本篇沒有要討論那些競品流量或關鍵字分析工具,究竟是跟誰買資料、有沒有主機商或 CDN 業者在賣資料,用了哪些爬蟲技巧、統計學方法來產生數據? 只是拿手上真的有資料的網站,跟那些系統上的數據比比,看那些工具上的數據是否神準。
為了避免傷害代理商或愛用者的感情,本文所提 6 款關鍵字分析或流量分析工具,皆用隨意的英文字母代號 A、B、C、D、E、F 來稱呼。
開頭先爆雷:就是不太準
在生物課應該都學過一個測量方法。 大概是說要知道一個地區內有多少隻某生物? 在選定的調查地區內,抓幾隻生物進行標記,然後放回,過一定時間再重新抓,根據第二次抓的裡面有記號的比例,就可以估計出該地區範圍中的特定生物數量。當然還有很多細節,但這樣算出來的生物數量,跟一隻一隻去抓來數,可能會得到截然不同的數字。
另一個知名的例子是「全臺電影票房」,當然也不是售票系統資料庫直接下 SQL 算出來的,甚至連一個一個縣市加總都沒有,早期的做法是台北的數字直接乘2來求得全台電影票房數。電影票房的計算竟然是黑箱作業?幕後黑手究竟是誰?| 志祺七七,跟精準的數字可能很有差異,但就是種種現實因素不可能得到精準的數字。
各大分析工具內無中生有的推估數字,跟其他較有根據的資料相比,還真的有些不少的落差,看看下文的測試…
號稱可以檢視任何網站的 A 工具
首先測試 A 工具,A 工具號稱可以檢視、分析任何網站,基本數據其中有一個「過去 3 個月的訪問量」的資料,用此工具測試一下開頭提到的那個網站,兩者不是同一套工具,但數據曲線跟開頭提到的那篇別人發文提到的大致雷同。
GA 小 icon 是什麼
A 工具有個功能,有的網站圖表上會有像 GA 的小 icon,有的網站沒有
有 GA 小 icon 指的是這個網站的站長有註冊這個工具,並且完成認證程序,並授權 GA 資訊給 A 工具,A 工具在此處顯示的數據是完全從 GA 抓的,A 工具的系統會把數據存起來,即使網站管理者解除授權之後,這些歷史資料在 A 網站還是看得到。
經過比對,A 工具圖表上的訪問量數字,是對應到 GA 的「工作階段」數。
這邊不再做 GA 使用者、工作階段、瀏覽量的名詞解釋,也不討論 GA 的工作階段數跟 GA4 的功能定義和統計方式有什麼差異。
現代網路環境基本上有些使用者會使用一些把 GA 等各種追蹤套件擋掉的工具,所以網站實際的數字,通常會比此處的數字更高。
過去 3 個月的訪問量
有些網站用 A工具是查不到數據資料的,頁面上有明文寫說「不會展示上個月預估造訪量低於 5 千的網站資料」,即使到了註冊後才能使用的進階介面去查(別人的網站),能顯示的資訊也非常少。
我挑了一個手上很久沒更新內容的遊戲攻略類型內容小網站
– 造訪量大於 5 千,在 A 工具有數據
– 沒有把 GA 授權給 A 工具,所以他肯定不會從 GA 偷到數據,管理者也只有我,肯定也不會有其他人使用 A 工具的時候誤授權出去。
跟 GA 裡的數據來比一比…
(上圖為 A 工具,下圖為 GA)
A 工具提供的訪問量在 12 月似乎爆增,但管理者知道這是幻覺,除了 GA 的在各項主要指標都無法發現 A 網站講的那種爆增情況,在其他比較有根據數據,12月也都是往下掉的,例如伺服器端的流量數據(包含搜尋引擎等各種爬蟲)、廣告系統的曝光量等等,畢竟這網站的內容至少一兩年沒更新了,只靠舊內容吃老本。
另外試了幾個網站也是一樣,A 工具顯示的 3 個月的訪問量跟 GA 或其他部分的頗有差異。
A 工具的 knowledge center 和 FAQ 上並沒有特別寫明原因,多半是請使用者確認時間區間、裝置類型、指標是否相同,是否每一頁都有安裝,其餘大多是 “intelligent estimations”, “from sample to estimation” 之類的字詞,店內外充滿了快活的空氣。
熱門關鍵字
A 工具對於網站概況總覽有兩種介面,兩種上面都有一個「網站熱門關鍵字」的清單:
一個是不用註冊也能看到的(如下圖)
沒有顯示熱門關鍵字的時間區間,要網站的預估造訪量大於 5 千才會顯示,不然就會空空的。說好的可以檢視任何網站呢?
另一個是註冊後才能使用的進階介面,如下圖:
網站的預估造訪量不用大於 5 千,在進階介面也會顯示部分資料,
有時間區間為前三個月(例如現在是2023/1,那介面上顯示的是 Oct 2022 – Dec 2022)。
兩者的共同處是不花錢的話,大致可以看到網站的前 5 個熱門關鍵字,付費的話才能看到更詳細的資料。反正只是參考,光看前 5 個也夠用了,
A 工具在上述兩個介面上顯示的熱門關鍵字卻不相同,跟 Google Search Console 裡面顯示得更是大相逕庭。
本想說 A 系統的熱門關鍵字的定義不知道是什麼? 是曝光度高的嗎? 是點擊數高的嗎? 是點閱率(曝光/點擊)高的嗎? 是排名高的嗎? 是網站熱門頁面包含哪些熱門關鍵字嗎? 這不得而知,在 GSC 試了幾種排序方式都無法得到與 A 工具比較接近的前 5 名報表。
A工具的網頁上並沒有明顯的特別寫說統計方式為何、包含哪些搜尋引擎之類的,就先當成是我不會用好了。
號稱是國內外 SEO 顧問公司必備的 B 工具
B 工具號稱是國內外 SEO 顧問公司必備的工具之一,但 B 工具要看數據要先註冊會員和驗證網站,免費方案只能看自己的網站,無法查看別人的網站,不過沒差,只是測試而已。
驗證網站的方式有上傳檔案、或增加 DNS 紀錄等等,或是授權 Google Search Console 的資料……套路! 這又是套路!
我當然是直接跳過沒有給,有了資料之後,系統透過 API 直接拿資料來顯示,當然就有「系統很準」的幻覺。
而且我貢獻自己網站的數據資料給平台,然後別的使用者付費給平台可以看到我貢獻的資料? 我也要付費給平台才能看到別人貢獻的資料? 不知道有沒有進貢分潤之類的,不然網頁設計公司手上一堆網站通通把數據授權進去,平台上的網站資料越來越準,進貢的人還可以拿到報酬,豈不是雙贏?
免費版功能有限,例如自然排序關鍵字不能選日期區間,只能看到今天的,
而 Google Search Console 剛剛好相反,就是不能看今天的,用「最近活動日期」頂多也只有昨天或是四五天前的,所以兩者無法一起比較。
那我用近一兩天搜尋引擎進站,比較多人造訪的頁面,來跟他的關鍵字清單比對,應該稍微合理一些吧?
B 工具的系統給的是一個依照 Traffic 大到小排序的清單,系統上顯示 Traffic 的定義為 An estimation of the number of monthly visits that your target gets from organic search for a keyword. We base this on the number of searches for that keyword over the latest month.
預設為台灣,日期是2023/1/7,數字不準就算了,網站熱門關鍵字相關內容相當過時,五倍券的文章是 2021/9 月份,Wordle 的文章是 2022/1 約一年前,相關的文章在 GSC 和 GA 老早就排不上榜了。
如果有人用了 B 工具查詢同一個網站,看到這些舊內容信以為真,想要針對關鍵字開始製作什麼五倍券之類的文章,那可以直接點播黑人抬棺的音樂了…
這種東西真的可以拿來評估別人的網頁嗎…
多試了幾個網站,產品官網之類頁數越少的網站看起來數據越準,因為內容少,關鍵字怎麼顯示就是那幾個。但只要像部落格媒體這種內容比較發散、有時效性的,馬上就可以看出問題。
B 工具的官方 FAQ 則一再強調系統內的數字都是估算值,不可能 100% 準確 (The number that [B工具] shows is an estimate, not the actual search traffic data of a website. . It’s not possible for all the variables in our traffic estimation formula to be 100% accurate),並舉了一篇撰寫於 2018 年的自家部落格文章,提出了一些資訊說他們比 A 工具的準確度高。
當然因為免費的功能有限,上面還是有不少有趣的工具,值得去做更多的利用。
分析關鍵字等 SEO 常見指標的 C 工具
C 工具比較常被拿來跟 B 工具一起比較,兩者的功能比較相近,有一個搞笑的說法說只要老闆們搞數位行銷不再討論如何下廣告,而是在討論會用到 B 工具和 C 工具的場合,那就是廣告成效很差,廣告沒什麼效的時候。
C 工具使用時沒有像前述 A、B 兩個工具的套路,不需要貢獻自己的網站 GA 或 GSC 數據讓報表看起來顯示得很準,別人的網站也可以看。
但免費版限制比較多,也是一堆功能都鎖住:
– 無法查看子域名和子資料夾的網站(subdomains and subfolders is only available for paid users),所以測試方式比較有限
– 數據預設是 Desktop,無法選行動版
– 日期時間鎖住
– 每天只能查看 10 次
搜尋流量 Organic Traffic
C 工具提供一個搜尋流量概況圖,可以選近一個月、近六個月、近一年、近二年、所有時間。
圖表顯示 2022/10 月有個高峰,實際一查發現又是幻覺。
在 GA 選擇差不多的條件,organic search & desktop & 台灣地區,並沒有觀察到此情況。
這類工具也可以查網站的付費流量(CPC廣告)流量圖、付費關鍵字與排名之類的,當然結果也是非常不準,如果每個月都在儲值廣告的企業主,或是有 Google Ads 和 Bing Ads 每個禮拜都在看廣告數據的人,看到這些圖表應該會傻眼。
熱門搜尋關鍵字 Top Organic Keywords
此工具一樣有 Top Organic Keywords (系統說明是 Keywords that generate the most organic traffic to an analyzed domain via Google’s top 100 search results, based on the selected database.),關鍵字清單預設是照 Traffic (The percentage of organic traffic driven to the website with the given keyword for the specified period.)從大到小排序,用與 GA 和 GSC 不同的計算指標,似乎技巧性避免被人一眼看出數據不太對勁的問題。
不過實測發現關鍵字的搜尋量 (Volume, The average number of times users have searched for a given keyword per month. We calculate this value over the last 12 months.) 比 GSC 的數字要低很多。官方的 FAQ 也有解釋 Search Volume 和各項數字是用機器學習搭配演算法云云,官方 FAQ 原文轉貼如下。
Traffic Analytics reports are based on petabytes of clickstream data that comes from multiple proprietary and 3rd party data sources, [C工具]’s proprietary AI and machine learning algorithms and Big Data technologies. The data is accumulated and approximated from the user behavior of over 200 million real internet users, and over a hundred different apps and browser extensions are used to collect it.
As Traffic Analytics data is not obtained from any website’s internal analytics, the numbers you see here might differ from what you see in your Google Analytics or similar trackers you use. However, if you want to analyze only your own website traffic without comparing it with others, we recommend that you refer to your own Google Analytics.
台灣的 D 工具
D 工具比較實在一點,沒有像上面那些假裝知道別人網站流量的圖表,沒有假裝知道每個關鍵字的點擊入站數,只有別人網站的關鍵字清單,或是關鍵字的延伸關鍵字建議功能之類的。
註冊時一樣會引誘人授權 GSC 或 GA,我當然是直接跳過,免費版一個月可以查詢 10 次。
網址丟進去之後,會得到這網站的相關關鍵字、這網站在這些關鍵字的相關頁面、還有每個關鍵字每月大約有多少搜尋量)、Google 搜尋廣告的 CPC 金額 、排名…等資訊。
但因為此工具的查詢功能並沒有提供日期時間的查詢選項,也因為沒有日期時間查詢功能,例如想查一些食記類&近一年的熱門關鍵字資料,這個就比較難達成。
系統顯示的資料可能是從爬蟲不知道哪天爬到的時間點開始累積統計,同樣技巧性地避免一眼就被人看出資料有問題的情況,但稍微摸一下就發現 3 個疑點:
1.不知道哪生出來的關鍵字
如果用排名來排序資料,會看到一些在 GSC 或 BWT 裡壓根沒看過的關鍵字,甚至頁面或文章也跟那個關鍵字無關,例如列出一個關鍵字是某某東西+一個動詞,那文章介紹的東西跟動詞沒啥相關,文章裡也沒提到那個動詞,GSC&BWT也沒看到有那頁跟那個動詞有扯上關係過。
2.搜尋量數字靠譜嗎?
依官方說明文章,這邊的搜尋量是「此關鍵字每月大約有多少被搜尋的次數,數字越大,代表搜尋次數越高。」
我暫且先理解為此關鍵字預估每月被搜尋的次數,而不單單只是這個網站在搜尋引擎搜尋此關鍵字的曝光數,那問題來了,依漏斗理論正常來講點擊數一定會比曝光數少,如果一個關鍵字的預估搜尋量是 320,但 GA 跟 GSC 裡面每個月的搜尋引擎來源點擊數都遠遠大於這數字,那這個搜尋量的準確度應該比實際還要少很多。
ps.依照 GSC 的官方說明,返回搜尋結果再點選同一個連結,這樣只計為一次點擊,所以應該不是 GSC 記錄到重複點擊的問題。
3.數據更新需要時間
官方說明是說「排名更新時間:近3個月」,現在是2023/1,而匯出關鍵字清單來仔細查詢,網站近 4 個月的新增頁面或文章都還沒有出現在表上,不知何時才會處理完。可能數據量越來越大,需要開更多機器來跑了…
關鍵字分析用途的 E 工具
E 工具一樣是蒐集關鍵字、擴充關鍵字、關鍵字流量的工具,有台灣地區可選,免費版一天可以用三次。
有一個 Top Pages by Traffic,也是失誤率不低,跟剛剛上面的選手一樣,跑出五倍券之類現在已經過時、沒什麼人在搜的文章
搜尋引擎流量的圖表曲線不準,數字嚴重低估,想要誣陷廠商或人員都沒在幹活的時候,可以參考這家的數據。
Keywords by Traffic 清單也是有點離譜,
但不得不說這家是數據更新速度相對較快的,一兩個月前的文章數據已經有出現在清單上。
監控關鍵字排名的 F 工具
F 工具是以監控 SEO 關鍵字排名成效為主,用了比較合理的方式去追蹤關鍵字排名,有台灣地區可以選,有14天試用。但似乎也沒有解釋應對個人化搜尋結果(不同人使用同一個關鍵字搜尋,得到的結果和各網站排名會不同),要如何避免錯誤解讀數據。
主要機制是爬蟲,不是那些數學預測或統計模型,每日查詢次數有上限,所以關鍵字越多、網站越多,要更即時的資料,要繳更多月費買更多 bot。
因為操作用途與設計邏輯的不同,此工具無法像上面的選手憑空瞎猜一堆奇怪的歷史數據,也無法直接產生某網站的相關關鍵字、排名、流量。
此工具還有自創兩個指標
– The average monthly search volume in a local country. (關鍵字在該地區的平均月搜尋量)
– The global option shows you the average monthly searches worldwide. (全球的平均月搜尋量)
此工具不會要求導入 GA 或 GSC 數據,關鍵字也需要自己手動加入才會開始監測,所以如果一開始選關鍵字就選錯了,可能是在看身體健康的,如果想找一些意想不到的長尾關鍵字,或機緣巧合之下賽到的關鍵字,此工具可能也不太適合。
問題總結
先以外人的角度,模擬別人透過這類工具來查我手上的網站,看看能查到的數據長怎樣? 再跟手上較為有根據的數據做對比,最終比較的結果:
- 在這些外部分析工具內出現某月份指標飆高或降低等情況,而比對 GA, GSC, Bing Webmaster tool, Google Ads 報告, 或其他伺服器端的 log 或流量工具,現實中並未發生此情況,都是幻覺。
- 使用工具模擬觀察競品網站的關鍵字或頁面數據,與實際情況不合或資料太舊。
- 各家的數據與其他較有根據的系統相比,發生誤差,甚至大幅失真的情況,平台官方說明則使用一些這些數字都是統計估計值、AI 演算法、數學模型、誤差比別家低…之類的帶過。
- 數據較不即時,可能近三四個月的新文章或新頁面表現都不會在統計中,可能比較不適合評估每個月有新內容的網站或具有時效性的關鍵字。
- 運用一些誘拐技巧讓網站管理者授權 GA 或 GSC 的 API 存取權限,供平台運用網站數據。
雖然說資訊系統是全球化競爭,很多時候沒有地區之分,不必非要找本國的,世界上還有很多類似的工具,但在這個使用情境,網站語言是中文、目標客群為台灣使用者的情況下,有些工具的報表地區連 Taiwan 都沒得選,或是聽說對於中文關鍵字比較沒特別處理的,就略過不測了。
各系統實務上還有很多用法,拿不同的系統數字互相比較,都是不對的用法,這些系統的主要價值不只在於此。
心得感想
最早接觸這類工具是 N 年前,有一些應該是代理商之類的,在社群積極地在賣課程賣工具。去年部落格碰到一些大陸軟體公司不請自來邀稿寫業配文,讓我好奇是不是部落格出現在哪個分析工具的網站排行榜上面去了? 回頭再使用後,有一天周末下午突然決定來寫這個主題。
回到開頭的議題,流量下跌是因為網站被 Google 認證成內容欠佳嗎? 會不會是本來高流量的關鍵字或內容在這幾個月風潮過了,完全沒人看…之類的問題?
有些人會用這種競品流量預估工具,作為行銷策略、市場分析等用途的立論基礎之一,用數據說話嘛!總比一些大師見風轉舵,本來用了 A 方法沒效,就指責說肯定是 A 方法有問題,當初應該用 B, C, D 方法,用了 B 方法沒效之後又說 blahblah….怎麼講怎麼對,員工或是乙方還只能乖乖聽話照做,有些人覺得這樣沒什麼,有些人則非常厭惡,像我就是非常討厭不看數據在那邊瞎扯的。
在合理的資訊系統工程認知,正常情況下是沒辦法知道別人網站的數據的,我們沒有別人家的 GA 什麼的工具權限,也沒有主機端的 log 紀錄。
問工程師要怎樣偷看別人的網站概況,就像有人問財務會計人員,知不知道某某公司去年賺多少錢? 某某公司不是上市櫃公司,連財報都沒得看,也沒有發什麼新聞稿,也不是幫他做帳/往來銀行/政府稅務單位,不能拿到 401 或各種報表或財務資料,最後為了交差可能用一些奇異的方法去估,例如看訂單流水編號數、開門與打烊的發票號碼、看人家換車或裝潢搬家花多少錢………這樣估出來會準才有鬼。
統計學是一門玄學,猜別人的數據也是一門玄學,就連 GA 可能因為使用者安裝阻擋工具而記錄失真,但大家都在用,就與世推移乖乖跟著用吧,不要想這麼多。