9 個小工具查出網站用的主機、程式語言、架站工具、字型
就像問 Nusret Gökçe 說他的鹽是哪裡買的一樣,
網站用什麼程式語言寫的,跟網站系統的洞多不多、好不好用,其實幾乎沒什麼關聯。
不管多好的系統或架構,常常還是敗在人員的技術,還有經營的思維、時程、投入的金錢、管理能力上面。
雖然是個偽需求,但是既然有需求,那就要有 solution,於是介紹幾個工具讓人查出網站所用的主機、程式語言、字型。
Buildwith
這是一個線上的工具,把網站網址丟進去,就可以看出網站用的伺服器、聯播網廣告、JS 框架或程式庫、外部小工具(網頁推播、webfont、社群分享)、CDN 等資訊,很簡單。
https://builtwith.com
不過看起來有些是依賴於讀取 meta 屬性,像我把一些 wp 版本相關的 meta 屬性弄掉,即使原始碼中的有一堆 wp-content 的資料夾路徑,它也完全顯示不出部落格是用 WordPress 架的。
Wappalyzer
Wappalyzer 有網頁版,也有瀏覽器擴充套件,兩大瀏覽器Firefox 版 跟 Google Chrome 版 都有,功能跟 Buildwith 差不多,安裝了之後,只要點擊瀏覽器工具列上的圖案,就可以顯示網站的主機資訊、第三方套件等等,非常簡單。
訊息簡單明瞭,還可以偵測到我用 Disqus 的評論系統,不過仍然是一個把網站的 WP 相關 meta 屬性去掉之後,就認不出 wordpress 的玩意。
WhoIsHostingThis
WhoIsHostingThis 是一個網站,可以查網站是用誰家的主機,主要原理大概我猜是靠網站的主機 IP 來反查這個 IP 的註冊登記資訊,然後根據登記的資訊顯示一些主機商 LOGO 之類的。捕夢網、weebly 之類的都查得到。
(客戶的主機迷思之一,看某競爭對手用 GoDaddy,然後就也想跟著用。不得不說,主機滿不穩,技術客服也滿菜的。)
不過只要機制上是用 IP 去判斷的,基本上缺陷都差不多,
只要網站掛個 CDN,就只顯示得出 CDN 的資訊。
服務背後是用 AWS 、阿里雲之類的,會直接顯示雲端服務商的資訊。
然後國內很多主機商丟到這網站查,只會顯示「HiNet」,不會顯示智邦生活館之類的。
NetCraft – What’s That Site Running
NetCraft 提供很多服務,我們要用的是 What’s That Site Running 這項,它還可以看出主機在哪個國家,網站有沒有在一些高風險或黑名單上,項目挺多的,一樣丟個網址就能看到結果。
這套我覺得比起 Buildwith 跟 Wappalyzer ** 強得多**,至少他還看得出我是用 WordPress Self-Hosted ,資訊也比較詳細,雖然操作介面比較素,像是給工程師看的。
WordPress Theme Detector
這也是一個線上網站,不只一個,把網址丟進去之後,就能反查 WordPress 用的是哪個佈景主題,裝了那些擴充套件。
可是擴充套件大概都只列得出 4~5 項,沒辦法通通列出來。然後用啥擴充套件一樣是偽議題,因為你不知道人家的擴充套件和佈景主題還做了哪些客製化調整。
然後有些 WordPress 部落格跑不出結果…
WhatFont
這是一個瀏覽器擴充套件,我都用Google Chrome版的,只要滑鼠點一下就會顯示文章段落用了什麼字體、字型大小、行距等資訊,一目瞭然,不用再看瀏覽器開發者工具內的 computed style。
不過他當然只能辨識網頁上的純文字,無法辨認圖片上的文字字型。
ScamAdviser
把網址貼到 ScamAdviser,就會依據網站的 IP 資訊、主機所在地等等,評比這網站是否值得信任。
起初是在一個網購詐騙的討論版看到有人在推這工具,說看到可疑網站就可以丟上去測。
但是把一些自己做的玩具,或幫廠商做的網站丟上去實測之後,發現非常不靠譜。
– 域名註冊時間占非常大的評分比重,不管公司多正經,資料多齊全,網站是 .org 還是 com.tw,網站有掛 GlobalSign 之類的有賠償保險的 SSL 憑證。只要網站的域名註冊不到半年,都很難拿到綠燈。
– 他有一個判斷主機可能在哪個國家的機制,例如如果測出來在大陸,網頁上會提示 This website setup involves countries known to be high risk。但跟上述工具一樣,網站有掛 CDN 之類的,即使真實主機在台灣,網站內容是中文,註冊資料是台灣地址,跑出來的結果也不會看到半面台灣國旗,完全就是美國的形狀。
– 沒有SSL,域名註冊資訊用保密資料,域名不是.com 或 .com.tw 。還是也可以得到 High Trust Rating 綠燈。
所以說,詐騙網站想在 ScamAdviser 得到高分,去買一個 N 年前被註冊,但後來沒續約的網址。或是找一個活很久的域名,在他的子網域底下開網站,只要結尾不要是 .cn 的就好。然後掛個 cloudflare 之類的免費 CDN,即使網站內容胡說八道,應該還是可以拿到高分。
24H.cc 查詢網站是使用哪一個開店平台
不用先看原始碼,也不用從網站的一些共用 UI 的樣式(像對話視窗、結帳流程)的特徵看出人家是用哪個套板電商,可以先上24H.cc 電商便利中心所製作的 https://24h.cc/ 查看看。
貼上網址後,可以比對特徵,查出購物網站是用 91APP, Cyberbiz, EasyStore, SHOPLINE, shopify 還是哪個線上開店系統做的。
但只要不在系統的範圍內,例如比較不知名的購物車系統,或是請人自己寫的,基本上就查不出來了。但就算查出來也沒什麼特別的,只看得到人家是用那個電商系統賣東西,還是不知道人家從進貨、出貨、印單…等流程有用了那些進銷存、金流物流、帳務等管理工具。
CMS Detector
這個也有好幾款,應該是因為這個名字的關鍵字比較直覺,所以不只一家在做,基本功能跟上述的差不多,以下舉兩個。
What CMS?,會偵測出伺服器環境、使用的程式語言、CDN 之類的,如果是用一些套裝平台或軟體架的,會列在 CMS 一欄,但實測時發現有些套裝開店平台無法辨認出來,例如 91app 可以認出來,但 Shopline 認不出來,
CMS Detect,偵測時會跳一個廣告,可以打叉略過,主要是以偵測「平台系統名稱」為主(例如 WordPress, Wix…),所以不會像本文提的某些工具列一堆程式語言、伺服器環境名稱、開發框架(framework) 之類的。
而且似乎有跟 SEMrush 這種關鍵字和競品流量分析工具合作,所以會列出查詢的網址在 SEMrush 上的一些域名分數、反向連結、關鍵字等資訊。
GENELIFY – Website Technology Lookup
跟 buildwith 之類的工具類似,貼上網址後,會列出網站使用什麼後端技術之類的。
但是 GENELIFY 這套更強大的是,還會列出所使用的 WordPress 佈景主題與套件,例如 SEO 套件、區塊編輯器、表單等基本的都會偵測到(如下圖)。
結論
雖然這些工具還是不夠強大,通常弱點在於一些地區的在地服務,或是 Saas 類型的會查不出來,也看不出一些 Linux 虛擬主機上的 Sitebuilder 工具之類做出來的網站,但是專業人員用肉眼一看就知道,那副死樣子就是智邦生活館的輕鬆架站版型、ShopLine、Wix、QDM、91APP…之類的。不過已經可以快速地滿足基本需求了。
講到看網站掛了什麼東西,最後分享一個親身遇到的小故事,
之前某一天上班的時候,接到台灣的宰羊網路廣告商業務打電話來開發,
她說「你們的某某網站之前有投放 FB 廣告,怎麼後來沒做了呢? 」
我心想,只是把會員名單當廣告受眾丟上去跑一下測試數據而已,還投電腦網頁側邊欄那種沒人看的版位,她怎麼會看到廣告?
我就問他「妳怎麼知道我們之前有投 FB 廣告呢?」
業務說「因為你們網站有裝 FB 像素碼呀!」
我擦,竟然還有這招?
可惜我沒問她是用 Facebook Pixel Helper 看的,還是公司有做專門的工具來爬?