從 OpenAI 的 GPT 爆紅,到 Bing 搜尋引擎和 Edge 瀏覽器整合 GPT 的功能,子彈已經飛了一陣子,不時就會有數位科技相關媒體發布 Bing 搜尋市佔率的新聞,多 1% 少 1% 都會被人大作文章,例如數位時代的文章 微軟搶先奪得AI先機,Bing訪問量上升15.8%!Google怎麼保住搜尋龍頭?

一些大型企業都有資料科學家相關的職位,有些甚至像 Pornhub InsightsWikimedia Statistics 還會提供更即時的公開數據,或是定期的公開數據報告。談到流量成長,引用此類資料可能相對較合理,但 Google 沒有直接公布此類數據,這種新聞可信嗎?

有些人看完可能只留個 Google 要倒了之類的印象,可能 3 分鐘後就忘了,或是腦補 A 產品用量上升 = B 產品用量下降的錯誤邏輯。
Bing 訪問量上升幾 % 也只是一種說法,換個立場也可以說:
Google 繼續蟬聯全球最受歡迎的搜尋引擎,每日搜尋次數幾億次,
Bing 搜尋成長已見頹勢,爆發不符預期(不管成長幾%都可以寫成不符預期),Google 老神在在,
Google 市占率仍高達 90幾%,由於市占率太高了所以增長空間有限,
微軟耗資幾百億想撼動搜尋引擎龍頭地位,最終失敗云云,
…就是政治新聞最常見的立場偏頗,睜眼說瞎話之術。

但不知道有沒有人想過,那些搜尋引擎市佔率相關報導,這堆報導裡的數字是哪來的?

數位時代報導那篇的數字從何而來?

文章是對岸翻譯來的,報導底下已經有寫「本文授權轉載自:網易科技」和「市場分析公司的數據顯示」,追本溯源,其實就是大陸科技媒體拿了一個西方國家公司發布的文章 With AI Boost, Bing.com Recent Traffic Up 15%, Google.com Down 2.4% ,用該文章內的數據做延伸寫了一篇中文報導。

以下繼續整理一些號稱有提供搜尋引擎市佔率數據的網站:

來源一:Similarweb

除了數位時代和網易科技,在這波對話式搜尋引擎熱潮,談論 Google 與 Bing 流量增長的國際媒體,不少科技媒體都是引用 Similarweb 的數據,Similarweb 比較 bing.com 和 google.com 的流量,不計入其他子網域。是用獨家的方法蒐集資料,概略的資料可以看 Similarweb Data Methodology

除了可以直接查詢 google.com流量分析和市場份額 | Similarweb,Similarweb 本身也非常有 SEO 的思維,相關行業的人要上網抄資料,不用看著報表上一堆數字發呆,部落格上已經有分析整理好的數據重點、圖表、結論、引用說明,不只是搜尋引擎,對於其他產業像是航空、汽車、旅遊、都有緊跟時事做出分析。

不過這類工具在之前的文章已經討論過,可能會有引誘網站管理員綁定帳號,提供 GA 等相關數據為系統貢獻養分、讓快樂表變得看似比較合理,或是用數學模型、統計估算值之類產生一些壓根不存在的流量波動、靈異現象,還有各種但書和免責條款。不過就連 WSJ 都會引用這家的數據,一般人就乖乖地用吧,想太多容易增添煩惱。

來源二:Statcounter Global Stats

Statcounter Global Stats 這也是一間每次談到瀏覽器、搜尋引擎市占率的時候常用的數據來源,最大的優點就是篩選器選項很多,有電腦與行動裝置、國家、日期時間等等,而不是只有一個寫死的表格。國家清單中還把 Taiwan 跟 China 分成兩個國家,最快可以看到前一天的數據,非常的好用。

那這間的資料是哪來的? 不管是寫前端還是寫後端的網頁工程師,都知道有方式可以取得一個網頁的前一個來源網址(例如從 www.google.com 點進去 A 網頁,可以在 A 網頁透過某些方式知道使用者是從 www.google.com 進來的,但是有很多但書),所以我只要在 A 網頁上偷埋我的程式,我就可以統計 A 網頁,甚至所有有埋我的程式的網頁,進站來源為何都可以統計,當然此舉要耗費不少儲存成本跟運算成本。
對 A 網頁而言,為何沒事要讓在網頁上埋第三方程式? 除非那個程式有什麼好用的功能? 是的…Statcounter 主功能就是一個網頁計數器服務,這些數據就是從全球超過 150 萬個有裝它家計數器的網站上蒐集而來的,150 萬這個數字在它家官網首頁和 QA 都有提到。QA 中有提到關於這些使用者行為(樣本數)大多數位於美國。

實測可以觀察到是把來源網址放在 camefrom 參數,從 https://c.statcounter.com/t.php 送出去,AdBlock 預設的名單不會擋。

來源三:Statista

Statista 是一個德國的全球市場調查數據公司,亞洲的話在新加坡跟東京也有設點,Worldwide desktop market share of leading search engines 是他們吸引客源的一個服務之一,提供圖表讓人免費查閱每個月的搜尋引擎市佔率波動。

覺得現在已經 4 月了,怎麼數據還停留在 1 月?
可以看的國家好像很少? 只有歐美國家嗎?
如有以上疑問,可以付費解鎖…

資料來源說是

Our statistics, surveys, and forecasts are based on the primary data gathered by our research teams and on secondary data from our partners.
(但從上圖可以看到,來源也是 Statcounter…)

來源四:NetMarketShare

NetMarketShare 也是一個提供搜尋引擎市佔率、裝置市佔率等數據的公司,從 Market Share Statistics for Internet Technologies – Search Engines 可以看到上個月的 Google 的市佔率將近 8 成,比起其他家超過 8 成,甚至超過 9 成,可以說相對少了一點。

NetMarketShare 的資料來源 說是一些聯播網,由每月約一億次的工作階段評估而來(100 million valid sessions per month),還排除了一些 bot 或無效流量。

其他

基本上使用 Search engine market share 之類的關鍵字就可以找到不少資料,但要看「最新的」,或是單獨某些國家的,有的要付費,最簡單無腦的只能看新聞,但有的新聞也只是互相抄來抄去,既然 Google 跟 Bing 官方自己不會公布,資料源頭從哪來的,就是一個疑雲。

除了上文的競網分析、網頁計數器網站,一些市場調查公司也會不定時發布這類市占率數據,像 Hitwise 曾在 2010/1 公布 Google 在美國的市占率為七成左右(調查方式大致如圖,樣本數 1000 萬人)。

hitwise - bing_rising_success_rate

但是 Hitwise 後續被收購,文章連結已經失效了,新網站也沒在定期探究這個題目,可能覺得 Google 搜尋已經天下無敵,完全沒想到後來竟然有不是搜尋引擎的工具,可以滿足一些使用者的搜尋意圖?

除了網頁計數器之外,一些網站會放的第三方套件,在技術上也滿足上述提到的可以偷拿 referrer 的條件,所以社群分享套件 Shareholic 也曾在 2018 年公布 Pinterest, Google, & Instagram big winners as Facebook share of visits falls 8% in 2017,主軸雖是探討使用者從搜尋引擎或社群平台進站的比例,但也有各大搜尋引擎的使用比例,但沒有像上述的網站有定期公布、完整的歷史資料、篩選條件,實用度比較低一些。

EcommerceDB 上面搜尋 search engine 比較多一些產業 CPC 出價之類的資料,搜尋引擎市占率只有看到一篇 2023/4 寫的 Google Dominates Search Engine Market – but Not in China,但是裡面也是引用 Statcounter 的資料,然後說中國地區最多人使用的是 Bing (The most frequently used search engine in China is Bing),令人懷疑報告可信度。

Google 自己沒公布過搜尋市占率

拷問 Google 自家的 Bard AI,會得到

Google does not publish its search engine data publicly. However, there are a number of sources that estimate this data.(然後給一些外部資料)

Bard 的回答能不能代表 Google? 這可能很有爭議。如果用人工認真去查資料,先不討論一些 Google 高級主管在推特的發文,也不討論某年某月在某國的研討會上的 QA 環節回答的內容,Google 沒有定期公布自己搜尋引擎最新的 DAU、MAU、之類的公開數據。

頂多只有每秒有幾次搜尋,每日搜尋幾億次,例如十幾年前(2012 年)的 Google 有個專門介紹搜尋技術的 Inside Search 網站,上面說每天有 10 億搜尋次數,而近幾年一些不知來源的新聞報導則是說每日有 85 億(8.5 billion)搜尋次數。
其餘還有一些跟 Google Trend 相關,某地區年度十大熱門關鍵字之類的企劃。

這陣子 Alphabet 公司的董事長 John Hennessy 曾在路透社的訪談中提到加入 LLM 可能會讓 Google 搜尋成本提高 10 倍,Reuters – For tech giants, AI like Bing and Bard poses billion-dollar search problem,但報導看起來也並沒有直接提及「本來是多少、上個月平均每天有幾次」的相關數字。

Bing 有公布過搜尋市占率嗎?

Windows 10 跟 Windows 11 工具列上的搜尋按鈕,預設會使用 Microsoft Edge 瀏覽器和 Bing 搜尋,就算把按鈕藏起來,搜尋引擎預設值改掉,有時候系統更新完還會自己跑出來,所以 Bing 市占率就等於作業系統市占率嗎? 想必不是,這個跟上述 Google 一樣,也找不到有直接定期公布、即時讓人查詢的公開數據。
比較近期的是 2023/3,Bing 自己在官方部落格內第一手公布The New Bing and Edge – Progress from Our First Month,摘錄幾點:
– 超過一億 DAU (we have crossed 100M Daily Active Users of Bing)
– 超過 4500 萬次對話 (roughly three chats per session with more than 45 million total chats since the preview began)
– 三分之一是新使用者(it’s great to see that roughly one third are new to Bing)

2023/5/4 更新:在微軟的官方部落格文章 Announcing the next wave of AI innovation with Microsoft Bing and Edge 又有揭露新的使用情況數據,其中有提到 Bing 有超過 1 億的 DAU,Bing app 的安裝量增長 4 倍。

Bing has grown to exceed 100 million daily active users and daily installs of the Bing mobile app have increased 4X since launch.

結論

想寫這篇文章是平常有在關注這類數字,AI 神蹟喊得滿天價響,但似乎都沒有反映出明顯巨量大幅波動或黃金交叉,唯獨上個月看到開頭的那個新聞,標題的數字看似特別驚人,是又裝了什麼快樂表?
不過稍微想想,Bing 市佔率本來就很低,在用的人就很少,只要稍微變多一點,馬上標題就可以開始大吹特吹,就像如果昨天營收 10 元 ,今天營收 1000 元,也可以號稱使用了某某方法之後「營收成長百倍」,聽起來多好聽。

搜尋引擎的市佔率究竟多少,可能不是非常重要,數字跟現實也不一定相關,幾年前也是說沒人在用 IE,沒人在用 XP,沒人在用 Yahoo 搜尋,市佔率非常低,但現實上相關從業人員就還是會碰到,時不時仍要為這些「沒人在用」的東西花時間排解疑難雜症。
甚至每份數據用的指標都不同,有的是講瀏覽量,有的是講搜尋次數,有的是講活躍使用者,有的樣本數都來自美國,就算真的有非常精準,完全符合所需受眾條件的數字,反正最後也只是在一句話中引用一個數字而已。
但背後的研究方法跟技術思維,能運用的地方可能不少。還有養成不要被媒體隨便牽著走的習慣。