Google 的爬蟲將只爬取檔案前 15MB 的內容

一個 HTML 網頁檔案(不含內嵌的圖片或影片),通常不會超過 15MB,對大部分的人來說,Google 只爬取檔案的前 15MB 的內容並編入索引,其實沒甚麼影響,沒甚麼好擔心的。

不過要注意的是,Google 不只是爬取 HTML 網頁檔案而已,Google 會爬取並建立索引的文件檔案,有 20 幾種,包括常見的 PDF、Word、PowerPoint、XML 檔。

Google 可建立索引的檔案類型請參考 :
https://support.google.com/webmasters/answer/35287

每一個檔案,都有可能會網站到來曝光,如果你的網站也靠這些文件帶來流量,那可能要檢視一下這個改變是否會帶來影響,將大檔案拆分成數個小檔案,或將內容多轉成一份其他格式的精簡檔案,都是可以嘗試的方式。

資料來源 : Google Search Central
https://developers.google.com/search/docs/advanced/crawling/googlebot

=====================================================
MarTech 行銷科技洞察社團 - GA4、SEO、GTM、Search Console、Looker Studio、社群、內容、廣告
OpenCart 台灣技術支援 - OpenCart 網站代管、客製、維護
OpenCart 台灣電商社團 - 台灣 OpenCart 使用者交流
=====================================================