文章最後修改於 2024-11-07
重複內容是什麼?Google 如何看待重複內容?
在 SEO 中,重複內容(Duplicate Content)是指在同一網站不同網頁出現相同或非常相似的內容。
如果多個頁面內容高度相似,搜尋引擎將難以判定哪個版本更應該顯示,影響到搜尋結果的排序,甚至影響到網站成效。
延伸閱讀:🎈搜尋引擎優化教學:SEO是什麼意思?Google SEO怎麼做?
重複內容的情況有哪些?出現重複內容有 5 種原因
(一)網站不同的 URL 版本沒有統一
網站會有不同 URL 版本常發生在 HTTP、HTTPS 或是 www、non-www。
早期網站多使用 HTTP 協定傳輸資料,隨著網路資安需求的提升,網站逐漸轉向用加密過的 HTTPS 協定。
當品牌網站從 HTTP 轉換到 HTTPS 後,如果沒有將 HTTP 版本的頁面轉址到 HTTPS 版本,這兩個版本的頁面就會同時被搜尋引擎索引。
由於這些頁面的內容相同,搜尋引擎就會判斷為重複內容。
- https://adbest.com.tw/
- https://adbest.com.tw/
www 與 non-www 也是類似的問題。
早期網際網路時代,www 象徵該網站屬於全球資訊網的一部分,因此大量用於網址的前綴。
之後,越來越多品牌網站選擇省略 www,為的就是讓網址更短、更容易記住。
網站管理者在設定網站時,如果在 DNS(網域名稱系統,將人們網域名稱轉換成 IP 地址的系統)或伺服器設定中同時讓 www 和 no-www 版本共存,而沒有經過轉址處理的話,搜尋引擎就會判斷為重複內容。
- www.adbest.com.tw
- adbest.com.tw
(二)網址參數問題
網址參數是附加在基礎網址後的附加字串,用來追蹤使用者行為、提供商品資訊或區分不同的廣告活動等。
例如,同一篇文章有兩個不同的網址版本。
一個是基礎網址、另一個則帶有 UTM 參數來追蹤點擊來源,但因為網址不同,搜尋引擎就會視為不同的頁面,產生重複內容問題。
電子商務網站上,顏色、尺寸、口味等產品的附加資訊,也常會透過不同的網址參數來展示。
同一種糖果因為有不同的口味,被分配到不同的網址,但內容除了口味資訊其他全部相同,就會被判定成重複內容。
(三)不同裝置使用相同網頁內容
隨著行動裝置的多樣化,網站必須能在桌面電腦、平板電腦和智慧型手機等不同裝置上呈現最佳的使用者體驗,網站有時會針對不同的裝置版本提供不同的 URL 或網頁版本。
舉個例子:
- 桌電版使用:www.example.com
- 手機版使用:m.example.com
雖然兩個頁面的內容幾乎相同,卻由於閱讀載具的差異而導致的 URL 不同,就會產生重複內容的問題。
(四)媒體轉載
如果是側重經營內容的品牌要注意了,重複內容可能源於媒體轉載這一行銷管道。
合法轉載指的媒體網站經原作者允許,可以複製並發布該內容。
但如果媒體轉載的內容沒有經過適當的標註,例如沒有提供原始文章的超連結或是使用 canonical 標籤,搜尋引擎就會認定是重複內容。
延伸閱讀:🎈社群媒體有哪些?社群網站趨勢?社群平台影響讓人更焦慮?
(五)抄襲問題
抄襲則是指在未經原作者許可的情況下,某些網站直接複製他人的內容並發布在自己的平台上。
抄襲不僅直接涉及到《著作權法》,且可能導致搜尋引擎判定為重複內容,影響網站的排名。
重複內容的影響是什麼?如何影響搜尋引擎&網站?
(一)SEO(搜尋引擎)
💡無法提供優質的搜尋結果
搜尋引擎面對重複內容時,不知道應該將哪一個版本納入或排除在搜尋結果頁之外。導致搜尋引擎無法有效地為使用者提供最相關的搜尋結果。
💡影響使用者體驗
當使用者在搜尋結果中查到相似的內容時,會認為搜尋引擎沒辦法提供足夠的價值或資訊,使用者會轉向使用其他搜尋引擎或資訊來源,導致該搜尋引擎的使用率下降。
延伸閱讀:🎈Google演算法是什麼?搜尋引擎演算法有哪些?2024 Google 做 SEO 正確的態度!
(二)網站成效
💡降低內容曝光度
為了提供最佳的搜尋體驗,搜尋引擎通常不會在搜尋結果中顯示多個相同內容的版本。
搜尋引擎會選擇其中一個版本作為顯示結果,而其他重複內容的版本可能會被忽略,這將導致這些被忽略的網站曝光量降低。
💡稀釋連結權重
當重複內容出現在同個網域內不同網頁時,其他網站在連結到這些內容時,可能會隨機選擇其中一個重複版本,而非將所有連結集中在一個頁面。
這樣一來,連結權重會分散到多個重複的頁面上,導致每個頁面獲得的權重減少。
由於這些重複頁面無法集中特定的連結權重,不僅會削弱這些頁面的搜尋排名,還會影響整個網站的整體關鍵字排名和流量。
💡被視為非原創內容
搜尋引擎依賴各種數據來判斷哪個內容是原創。
當你辛辛苦苦撰寫的文章被其他網站抄襲時,如果對方的網站權重較高,容易導致搜尋引擎將他們的內容視為原創,反而將你自己的網站認定為非原創內容。
若站上內容被視為非原創內容,搜尋引擎就會降低你網站的搜尋排名,導致流量減少,最糟糕的狀況是爬蟲不再爬取你的網站,永遠消失在搜尋結果。
💡浪費爬取預算
搜尋引擎在爬取每一個網站時會分配有限的資源來索引頁面,這些資源被稱為爬取預算(Crawl Budget)。
當你的網站有著大量重複內容時,搜尋引擎容易將這些資源浪費在重複的頁面上,無法爬取新的或更重要的內容。
搜尋引擎可能因此錯過重要頁面的更新,傷害品牌網站在搜尋結果中的表現。
💡頁面無法集中連結指標
重複內容使得搜尋引擎無法確定應該將連結指標(例如信任度、權威性、錨文字、連結權重等)集中在某一個頁面,或是分散到多個版本之間。
這些重要的連結指標無法集中在同一個頁面上,將削弱原始內容的優勢。
如何解決重複內容?視情況運用這 4 種方式
(一)使用 301 轉址
如果你有同一個頁面多版本的重複內容,就可以利用 301 轉址來解決。
假設你的網站有以下三種網址版本:
- https://www.adbest.com.tw
- https://adbest.com.tw
- https://adbest.com.tw
你需要重新選定一個標準網址,然後使用 301 轉址將其他版本的網址導向到這個標準網址。
這個作法是在告訴搜尋引擎:「我搬家到這個新地址了,你可以傳遞舊地址的權重到這裡來,以後都以這個新地址為主。」
301 轉址是永久轉址,如果不小心將網址指向不正確的頁面,會導致原本頁面累積的權重和流量大幅下降,甚至完全消失。
此外,當 301 轉址設定完成後,原本被轉址的網址將不再出現在搜尋結果中,使用者也無法再直接造訪這些網址。在進行轉址前,務必要確定選定的標準網址是最終版本。
(二)使用 canonical 標籤
如果你的網站上有多個相似頁面,這些頁面雖然內容相似但各自具有不同的價值和功能,301 轉址可能就不適用了,這個時候就可以使用 canonical 標籤。
假設你經營一個糖果電商網站,網站上有三個頁面分別展示不同顏色的糖果:
- https://candyhouse.com/candy-yellow
- https://candyhouse.com/candy-red
- https://candyhouse.com/candy-blue
這三個頁面對消費者來說確實有存在的必要,他們可能會在購買前進行顏色比較,因此不適合使用 301 轉址將其合併為單一頁面。
你可以使用 canonical 標籤告訴搜尋引擎,這些頁面雖然內容相似,應該將它們的權重集中到一個標準版本上,不要將這些相似頁面視為重複內容。
如果你希望指定 https://candyhouse.com/candy-yellow 是主要被搜尋引擎索引的頁面,就可以在其他顏色糖果頁面的 HTML 原始碼內加入 canonical 標籤:
<link rel=”canonical” href=”https://candyhouse.com/candy-yellow” />
設定好後,這三個頁面就會被指向同一個標準頁面,重複內容的問題也就解決囉!
(三)從根本解決重複內容問題
💡全面啟用 HTTPS
解決重複內容問題需要從根本著手,針對前述的 HTTP 問題,品牌可以請工程師確認網站的所有資源(包括頁面、圖片、腳本等)都已完成 HTTPS 設置,並且在伺服器層面禁止使用 HTTP。
為了避免由 HTTP 導致的重複內容問題,你需要將網站完全切換到 HTTPS。
包括以下步驟:
1. 使用 HTTPS
確保網站上的所有頁面、圖片和腳本都使用 HTTPS,而不是 HTTP。(HTTPS 是一種更安全的協議,它加密了網站和訪客之間的數據傳輸。)
2. 設置自動轉址
在網站伺服器上設置自動轉址,意思是,當有人進入 HTTP 的舊版網址時,伺服器會自動將他們轉到 HTTPS 的新版網址。
這樣,你的網站上的所有內容都會統一使用 HTTPS,搜尋引擎也只會索引一個版本的頁面。
簡單說:
- 切換到 HTTPS
讓你的網站使用 HTTPS,這是更安全的網站協議。
- 自動轉址
設置你的網站,讓所有用 HTTP 訪問的請求自動跳轉到 HTTPS,這樣你就不會有重複內容問題了。
💡媒體授權
盡量避免重要內容讓媒體轉載,如果要提供內容可以給媒體經過濃縮和簡化的版本,避免重複內容或是被搜尋引擎認定為非原創者。
如果媒體需要轉載網站內容,可以要求在轉載的文章中使用 canonical 標籤,將權重導向你的原創內容頁面。
不過,媒體設定 canonical 標籤會告訴搜尋引擎該內容的原始版本不在他們的網站上,降低獲得流量和 SEO 權重的機會,實務上更容易放棄轉載。
有鑒於此,為了降低重複內容的影響,可以延後 2 週至 1 個月後再開放授權轉載。
延後授權時間可以使原創內容在最初發布的期間內得到最大的曝光和權威性。
💡惡意抄襲
定期監測關鍵字的搜尋結果,確認是否有他站抄襲你的內容而影響你的網站 SEO 表現。
如果發現有高度相似的結果,可以去信或去電請對方下架。
必要的時候也可以發出 DMCA 申訴,DMCA 會保護著作權持有人免受未經授權的內容使用。
當發現你的內容被其他網站或平台未經授權地使用或抄襲時,你有權根據 DMCA 向該網站或搜尋引擎提出申訴,要求移除這些未經授權的內容,減少抄襲導致的重複內容對 SEO 造成的影響。
(四)解決重複內容要注意的事情
💡謹慎使用 301 轉址
如果你的網站有許多過時的內容頁面,例如舊的產品或服務介紹頁面,一般人可能會直覺使用 301 轉址到新產品頁面。
但如果這些頁面所覆蓋的內容差異較大,或是對不同的使用者群體具有不同的價值,301 轉址後可能會混淆,使用者找不到他們過往購買過的商品資訊。
這時候可以思考重新編寫內容、提供前後版本的產品差異說明,或者建立一個彙總頁面幫助使用者找到他們需要的資訊。
另外,有些網站在重新設計或改版時會改變其 URL,原有頁面會變成無效頁面。
雖然 301 轉址可以將這些舊的 URL 轉向到新的 URL,但如果涉及的頁面數量龐大,301 轉址會影響網站的整體性能。
這種情況下,宜重新規劃網站結構,並利用其他方法如 404 錯誤頁面來處理已不存在的內容。
如果你的網頁是用 WordPress 製作,WordPress 有許多好用的 301 轉址功能,像是:
- Redirection
- Safe Redirect Manager
- 301 Redirects – Easy Redirect Manager
- Yoast SEO
你可以在這些工具裡面找到「新增 301 轉址規則」或類似字眼,填寫以下欄位:
- 舊網址:造成重複內容的原因、不再使用的網址
- 重定向網址:用戶最後將會看到的統一版本網址
💡設定 Canonical 標籤不一定有用
必須要注意,搜尋引擎不見得會全數採用 Canonical 標籤。
即使你在頁面上正確設定 Canonical 標籤,搜尋引擎還是有可能忽略它,或是根據其他因素(例如內部連結結構或外部連結)來決定哪個頁面應該被視為標準網址。
如何檢測重複內容?GSC 不夠全面怎麼辦?
(一)Google Search Console
首先,登入 Google Search Console 並選擇你要檢查的網站。
在左側選單點擊「產生索引」、「網頁」,這個報表會列出 Google 對於你網站中所有頁面的索引狀態。
這份報表中,你可以看到「已建立索引」、「未建立索引」等分類。你需要特別注意「未建立索引」部分,下方會列出了 Google 對某些頁面不進行索引的原因。
如果有發現「這是重複網頁;使用者未選取標準網頁」的註記,可以點進去獲得這些網頁的清單,逐一檢查、修復。
(二)SEO 工具
如果你網站上有重複內容問題,但 Google 還沒爬取到這些頁面,那麼 Google Search Console 的報表就不會顯示出來。
因此光是依賴 Google Search Console 的報表來檢測重複內容問題其實還不夠全面。
專業的 SEO 公司會購買 Ahrefs 和 Screaming Frog 等 SEO 工具,它們會派爬蟲快速掃描整個網站,詳細檢查標題、內容以及網址等元素,藉此找出重複內容的問題。
Google 會懲罰重複內容嗎?Google 更在意這件事!
Google 在 2008 年明確表示,重複內容本身不會直接導致網站受到懲罰。
但這個聲明有一個重要的前提:這些重複內容並非出於欺騙使用者或操縱搜尋引擎排名的目的。
這句話代表 Google 更加關注「用重複內容誤導使用者或操控搜尋結果的行為」。
如果網站使用這類黑帽 SEO 策略,關鍵字排名可能下降,或是從搜尋索引中移除,對網站的曝光和流量將造成嚴重影響。
為了保證有完整 SEO 效果,還是建議避免網站出現大量重複的內容。
如果你的網站沒有在搜尋結果中出現,你不只流失大量的客戶,競爭對手也正在用 SEO 蠶食你的訂單!
想透過 SEO 增加業績嗎?立即聯繫 ADBest!
延伸閱讀:
🎈SEO文章不只關鍵字|我靠5步驟、3技巧寫出衝擊排名的文章!
🎈E-E-A-T是什麼?與你分享10種技巧提升網站E-E-A-T的技巧!
🎈黑帽SEO風險有8種,最嚴重會被刪除網站內容!若被抓到請這樣做!
🎈關鍵字蠶食是什麼?關鍵字互相競爭?提供4種修復方法與預防建議