Canonical SEO: Hướng dẫn cài đặt, sử dụng thẻ Canonical

  • canonical seo là gì

    Với một người làm SEO chuyên nghiệp, chắc hẳn không còn quá xa lạ với thuật ngữ Canonical. Tuy nhiên, nếu mới tìm hiểu và bước vào lĩnh vực SEO, bạn chắc chắn sẽ quan tâm: Canonical SEO là gì? Vai trò và tầm quan trọng của Canonical trong SEO, cách cài đặt và sử dụng. Hãy cùng Miliseo chúng tôi tìm hiểu về vấn đề này ngay trong bài viết sau đây. 

    Canonical SEO là gì

    Thẻ Canonical (hay rel=”canonical”) là một đoạn mã HTML để quản trị web khai báo và định danh URL gốc của trang web đang bị trùng lặp nội dung với công cụ tìm kiếm. Nếu nội dung trên nhiều URL của trang web bị trùng lặp thì nên sử dụng thẻ Canonical để các Bot của Google nhận biết đâu là URL bạn muốn được xuất hiện trên công cụ tìm kiếm và không bị đánh giá là Duplicate content website. 

    canonical seo là gìCấu trúc chuẩn của thẻ Canonical SEO

    Thẻ Canonical có cú pháp đơn giản và nhất quán hơn so với các thẻ khác. Thẻ này thường đặt đặt ở <head>, còn với các website sử dụng mã nguồn mở thì thẻ Canonical được tạo tự động. 

    Theo đó, cấu trúc chuẩn của Canonical tag sẽ là: 

    <link rel=”canonical” href=”https://example.com/”>

    Mỗi phần trong đoạn mã này Canonical URL này sẽ có ý nghĩa khác nhau cụ thể: 

    link rel=“canonical” được hiêu là liên kết trong thẻ này là bản gốc của trang này.

    href=“https://example.com/sample-page/”: được hiểu là truy cập vào bản gốc tại đây.

    Tầm quan trọng của thẻ rel=“canonical”  trong SEO

    Khi website ngày càng lớn và được lấp đầy bằng nhiều thông tin thì việc xuất hiện các nội dung giống nhau, trùng lặp nhau là điều hoàn toàn không thể tránh khỏi. Điều này, nếu bị các thuật toán của google phát hiện thì website đó rất dễ bị phạt. Đồng thời nếu các URL trùng lặp nội dung đó, nếu đủ điều kiện được Google index và xếp hạng cho một cụm từ khóa nhất định thì việc xếp hạng cho URL bạn không mong muốn cũng rất dễ xảy ra. Và Canonical tag là giải pháp được sinh ra để giải quyết vấn đề về trùng lặp nội dung. Cụ thể, vai trò của thẻ Canonical là:

    – Chỉ định một URL gốc mà bạn mong muốn người dùng khi tìm kiếm sẽ nhìn thấy kết quả trên công cụ tìm kiếm.

    – Hợp nhất các URL có nội dung bị trùng lặp

    – Đơn giản hoá việc theo dõi các chỉ số cho một chủ đề hay một sản phẩm

    – Quản lý nội dung được xuất bản trên các tên miền khác nhau: 

    – Tránh làm mất thời gian tìm kiếm và thu thập dữ liệu trùng lặp của bots tìm kiếm google. Như vậy, các bots sẽ dành nhiều thời gian để khai thác tối đa trang web và thu thập dữ liệu các khai thác tối đa các trang mới hoặc đã cập nhật trên web thay vì thu thập dữ liệu các phiên bản dành cho thiết bị di động và máy tính để bàn của cùng một trang 

    Khi nào thì nên sử dụng canonical URL?

    Rel canonical thường được sử dụng trong các trường hợp cụ thể như sau: 

    • Khi Website của bạn có nhiều các phiên bản khác nhau
    • Khi bạn thiết lập URL động cho trang tìm kiếm, bộ lọc hoặc ID phiên hoạt động…
    • Khi Blogs tự động lưu nhiều URL khi lưu nội dung dưới nhiều chuyên mục khác nhau 
    • Bài viết được phân phối trên nhiều tên miền khác nhau
    • Nội dung được phân phối trên nhiều biến thể web khác nhau như: http; https hay www/non-www
    • Hoặc khi nội dung của bạn có nhiều phần.

    canonical seo là gì

    Quy tắc sử dụng Canonical Tag

    Thẻ Canonical đóng vai trò vô cùng quan trọng ở trong SEO, nó xác định được phiên bản URL chính thức cho một trang web khi website có nhiều phiên bản có nội dung trùng lặp trên nhiều URL khác nhau. Để sử dụng Canonical tag bạn cần tuân thủ các quy tắc dưới đây: 

    Sử dụng URL tuyệt đối

    Google đã đưa ra thông báo rằng cách tốt nhất là tránh sử dụng rel=“canonical” với các đường dẫn tương đối. Nghĩa là bạn nên dùng rel=canonical khi đường dẫn của bạn đã được tối ưu tuyệt đối. 

    Dùng chữ viết thường trong URL

    Thông thường, Google sẽ coi URL viết chữ hoa và viết chữ thường là 2 đường dẫn khác nhau. Vì thế, để đảm bảo google lập chỉ mục đúng URL, bạn nên sử dụng chữ viết thường cho URL trên máy chủ, sau đó dùng URL chữ thường sử dụng cho Canonical tags. 

    canonical seo là gì

    Dùng đúng phiên bản miền chính xác HTTPS hoặc HTTP

    Nếu trang web của bạn đã chuyển sang SSL thì hãy đảm bảo rằng bạn không khai báo với Google bất kỳ URL nào trong các thẻ rel=canonical. Làm như vậy thường sẽ dẫn đến những nhầm lẫn và ảnh hưởng đến kết quả SEO. 

    Bạn có thể sử dụng thẻ Canonical theo cú pháp sao: <link rel=“canonical” href=“https:// dichvuseodanang.vn/sample-page/” />.

    Còn nếu trang web của bạn chưa chuyển từ HTTP sang HTTPS, bạn có thể sử dụng rel=canonical theo cú pháp sau: <link rel=“canonical” href=“http:// dichvuseodanang.vn/sample-page/” />.

    canonical seo là gì

    Dùng một thẻ Canonical cho mỗi trang

    Nếu mỗi trang của bạn có nhiều hơn một Canonical Tag thì Google sẽ thực hiện bỏ qua tất thảy gợi ý rel=canonical. Vì vậy bạn chỉ nên sử một thẻ Canonical chuẩn trên mỗi trang.

    Dùng Canonical tags tự tham chiếu

    Canonical tự tham chiếu được hiểu là thẻ canonical trên một trang mà trỏ link về chính nó.

    Ví dụ, nếu url là của bạn là: https://dichvuseodanang.vn/blog thì, Canonical trên trang đó sẽ là:

    <span style=”color: #808000;”><link rel=”canonical” href=”https://dichvuseodanang.vn/blog/” /></span>

    Thẻ canonical tự tham chiếu không bắt buộc nhưng đây là lựa chọn đáng cân nhắc. Vì nó sẽ giúp bot công cụ tìm kiếm hiểu rõ được bạn đang muốn lập chỉ mục trang nào, cấu trúc như thế nào khi được index.

    Hiện tại, các CMS hầu hết đều được thêm canonical tự tham chiếu. Chỉ với những CMS thì bạn mới cần nhờ đến sự trợ giúp của các thiết kế web. 

    Hướng dẫn chi tiết sử dụng Canonical từ A->Z

    Cách cài đặt thẻ Canonical

    Cài đặt Canonical bằng thẻ rel = “canonical” trong HTML

    Để chỉ định liên kết gốc thì việc sử dụng thẻ rel = “canonical” trong html là cách đơn giản nhất. Bạn chỉ cần thêm đoạn mã nhỏ vào phần <head> của bất kỳ trang trùng lặp nào. Cụ thể cách thực hiện với các bước như sau: 

    Bước 1: Trong số các trang trùng lặp, chọn 1 trang được đánh giá là quan trọng nhất để làm phiên bản chuẩn. Hoặc bạn cũng có thể ưu tiên chọn URL có lưu lượng truy cập cao hoặc được liên kết với nhiều trang khác. 

    Bước 2: Thêm đoạn mã ở phía dưới vào các trang trùng lặp. Khi đó các đường dẫn trùng lặp sẽ liên kết đến Canonical URL trong phần <head> của trang như sau: 

     <link rel = “canonical” href = “url-chuan”>

    Theo đó, “url-chuan” là URL quan trọng được chọn ở bước đầu tiên. 

    Cài đặt thẻ rel= “canonical” trong WordPress

    Bước 1: Đăng nhập vào tài khoản quản trị WordPress, chọn các bài viết trùng lặp cần cần đặt thẻ <link rel= “canonical”

    Bước 2: Kéo xuống phía dưới ở cuối bài viết, chọn vào phần Advanced.

    Bước 3: Bạn copy URL chuẩn đã chọn và dán vào phần Canonical URL

    Bước 4: Cuối cùng để hoàn tất bạn bấm chọn Update

    canonical seo là gì

    Cài đặt thẻ Canonical trên Shopify

    Trên Shopify sẽ tự động thêm URL gốc tự tham chiếu cho các sản phẩm và bài đăng trên blog theo mặc định. Để thêm mục tùy chỉnh cho đường dẫn gốc, bạn cần chỉnh sửa trực tiếp các tệp mẫu (.liquid).

    Cài đặt thẻ Canonical trên Squarespace

    Trên Squarespace các URL tự tham chiếu cũng được thêm theo mặc địn. Vì vậy bạn cũng sẽ làm tương tự Shopify, nếu muốn thêm tùy chỉnh vào đường dẫn gốc cần chỉnh sửa mã trực tiếp.

    Cách kiểm tra thẻ Canonical tags

    Để biết thẻ Canonical đã được thiết lập thành công hay chưa, bạn thực hiện kiểm tra theo các cách sau: 

    Kiểm tra bằng nguồn trang

    Để kiểm tra bằng cách này, trên giao diện chính của website bạn click chuột phải sau đó chọn View page source hoặc nhập view-source: https: //domain.com vào thanh địa chỉ. Hoặc bạn cũng có thể sử dụng phím tắt CTR +U trên website để kiểm tra.  Ngoài ra bạn cũng có thể sử dụng tổ hợp phím CTR + U trên website bạn cần kiểm tra thẻ Canonical.

    Lúc này, sẽ xuất hiện tab mã nguồn và bạn chỉ cần tìm kiếm thẻ URL chuẩn trong <head>. Nếu thẻ Canonical được đặt trong cặp thẻ <head> sẽ rất tốt. 

    Sử dụng công cụ như Mozbar, SeoQuake để kiểm tra

    Bạn có thể sử dụng các công cụ như: Mozbar, SeoQuake hoặc bất kỳ công cụ nào có thể kiểm tra được thẻ Canonical của mình có đang hoạt động tốt hay không.

    Cách khắc phục sự cố Canonicalization 

    Trong quá trình đặt Canonicalization rất dễ xảy ra sai sót. Vì vậy, bạn cần kiểm tra Canonical Tag và khắc phục chúng càng sớm càng tốt. Và để giải quyết các vấn đề về Canonical URL bạn có thể sử dụng công cụ Site Audit của Ahrefs. 

    Dưới đây là các vấn đề mà Site Audit có thể tìm ra và khắc phục sự cố Canonicalization hiệu quả:

    Trang được chuẩn hóa Canonical trỏ đến 4XX

    Đây là cảnh báo được kích hoạt khi 1 hay nhiều trang được chuẩn hóa đến URL 4XX. 

    Vấn đề ở đây là các trang 4XX không hoạt động nên Google không index các trang này. Do đó, các thẻ Canonical được trỏ đến các trang 4XX sẽ bị Google bỏ qua và chọn 1 trang bất kỳ không có Canonical để index. 

    canonical seo là gì

    Cách khắc phục: Nếu muốn được index, bạn hãy thay thế Canonical (4XX) đã chết và các trang bị ảnh hưởng bằng các liên kết đến các trang (200) đang hoạt động. 

    Trang được chuẩn hóa Canonical trỏ đến 5XX

    Đây là cảnh bảo được kích hoạt khi 1 hay nhiều trang được chuẩn hóa đến URL 5XX.

    Vấn này này xảy ra khi có sự cố máy chủ làm cho page gốc không thể truy cập được. Google không có khả năng index các trang không thể truy cập, điều này sẽ dẫn đến trang gốc bị bỏ qua. 

    Cách khắc phục vấn đề này là thay thế các URL gốc xảy ra sự cố bằng các URL hợp lệ. Trong trường hợp URL gốc vẫn hoạt động ổn định thì kiểm tra các cấu hình của máy chủ có sai sót. 

    Trang được chuẩn hóa Canonical trỏ đến URL Redirect

    Nếu 1 hay nhiều trang được chuẩn hóa đến URL redirect thì cảnh báo này sẽ xuất hiện. 

    Vấn đề: Canonicals phải được trỏ đến một phiên bản có thẩm quyền nhất của một trang mà URL redirect không thuộc dạng bản này. Nếu xảy ra tình trạng này, thẻ URL redirect có thể bị các công cụ tìm kiếm bỏ qua hoặc có thể bị hiểu sai. 

    Để khắc phục vấn đề này, bạn hãy thay thế các Canonical URL bằng các kết nối trực tiếp đến một phiên bản có thẩm quyền nhất của một trang. 

    canonical seo là gì

    Duplicate Pages nhưng không có trang nào được gắn thẻ Canonical

    Nếu tồn tại một hoặc nhiều trang giống nhau hoặc trùng lặp nhưng không có trang nào là bản gốc thì cảnh báo sẽ được kích hoạt. 

    Vấn đề bạn gặp ở đây là sẽ không có trang gốc được chỉ định. Vì vậy, Google tự cố gắng xác định trang phù hợp nhất để hiển thị trong kết quả tìm kiếm. Đây có thể là kết quả mà bạn không muốn index.

    Do đó, bạn cần khắc phục vấn đề này bằng cách các trang duplicate, sau đó lựa chọn và chỉ định một 1 bản tốt nhất và chọn làm bản gốc để đặt thẻ Canonical tự tham chiếu. 

    canonical seo là gì

    Thẻ Hreflang được liên kết đến các trang Non-Canonical

    Khi 1 hay nhiều trang chỉ định URL Non-Canonical trong Hreflang thì cảnh báo này sẽ xuất hiện. 

    Vấn đề là các liên kết thẻ Hreflang phải luôn được trỏ đến các trang Canonical. Việc liên kết đến Non-Canonical của trang từ các chú thích Hreflang có thể là hành vi đánh lừa và gây nhầm lẫn cho Google. 

    Để khắc phục bạn cần thay thế các liên kết trong các chú thích Hreflang trong các trang bị ảnh hưởng bằng các Canonical.

    Nhiều Canonical URL không chứa liên kết nội bộ 

    Đây là cảnh báo sẽ kích hoạt khi một hoặc nhiều Canonical URL không có liên kết nội bộ.

    Như vậy khách hàng khi truy cập website sẽ không thể truy cập được các Canonical URL không có liên kết nội bộ. Và người dùng có thể được chuyển hướng đến trang non-Canonical.

    Bạn có thể khắc phục vấn đề này bằng cách thay thế bất cứ link nội bộ nào đến các trang Canonical bằng các liên kết trực tiếp đến trang gốc. 

    Trang Non-Canonical liệt kê trong Sitemap

    Khi một hoặc nhiều trang Non-Canonical được liệt kê trong sitemap thì cảnh báo này sẽ xuất hiện. 

    Lời khuyên của Google là bạn không nên đưa Non-Canonical URLs vào sitemap. Nguyên nhân, các trang hiển thị trong sitemap nên là Canonical page (là trang mà bạn muốn index).

    Vì vậy hãy loại bỏ Non-Canonical URLs ra khỏi Sitemap.

    canonical seo là gì

    Trang Non-Canonical được chỉ định thành trang Canonical

    Nếu một hoặc nhiều trang chỉ định 1 URL chuẩn thì cảnh báo này sẽ được kích hoạt. URL chuẩn của trang này lại được Canonical cho một trang khác. Điều này sẽ tạo ra một “chuỗi canonical”. Trong đó Canonical của trang A sẽ chuyển đến trang B, sau đó lại Canonical đến trang C. 

    Chuỗi Canonical có thể gây ra sự nhầm lẫn và đánh lừa công cụ tìm kiếm làm cho chúng hiểu sai hoặc bỏ qua các trang được Canonical.

    Vì vậy, hãy thay các liên kết Non-Canonical trong Canonical Tag của trang bị ảnh hưởng (tức trang A) bằng liên kết trực tiếp đến trang Canonical (trang C) 

    URL bên trong thẻ Open Graph không giống với Canonical Page

    Nếu Canonical Tag và URL bên trong Open Graph URL trên một hoặc nhiều trang không khớp nhau thì cảnh báo này sẽ kích hoạt. 

    Nếu URL bên trong Open Graph URL không khớp với Canonical URL. Khi ấy Non-Canonical URL sẽ được thay thế, được chia sẻ trên các mạng xã hội. 

    Hãy khắc phục nó bằng cách thay thế URL trong thẻ Open Graph URL trên các trang bị ảnh hưởng bằng Canonical URL. Đảm bảo 2 URL này giống nhau bạn nhé. 

    Canonical từ HTTPS sang HTTP

    Khi một hoặc nhiều secure (HTTPS) pages chỉ định non-secure (HTTP) page làm trang Canonical thì cảnh bảo sẽ xuất hiện

    HTTPS là yếu tố xếp hạng quan trọng vì vậy nếu có thể hãy chỉ định bản secure pages làm Canonical.

    Bạn có thể khắc phục lỗi này bằng cách chuyển hướng trang HTTP sang HTTPS tương đương. Hoặc thêm liên kết rel = “canonical” từ phiên bản HTTP của trang vào phiên bản HTTPS nếu không thể khắc phục bằng cách trên.

    canonical seo là gì

    Canonical từ HTTP sang HTTPS

    Khi một hoặc nhiều phiên bản non-secure (HTTP) page chỉ định phiên bản secure (HTTPS) pages làm trang Canonical thì cảnh báo này sẽ xuất hiện. 

    HTTPS sẽ luôn luôn được ưu tiên hơn HTTP. Vì vậy, việc non-secure (HTTP) của một trang chỉ định secure (HTTPS) là trang Canonical là điều hoàn toàn không hợp lý.

    Do đó bạn cần thực hiện chuyển hướng 301 từ HTTP sang HTTPS và đặc biệt nên thay thế các liên kết nội bộ tới secure HTTP của trang bằng các liên kết trực tiếp đến HTTPS.

    Trang Non-Canonical nhận được lưu lượng truy cập Organic 

    Là cảnh báo được kích hoạt khi một hoặc nhiều trang Non-Canonical không nhận được lưu lượng truy cập organic và hiển thị trong kết quả tìm kiếm.

    Nguyên nhân xảy ra trường hợp này là do thẻ Canonical được thiết lập không chính xác hoặc thẻ do bạn chỉ định bị Google bỏ qua. 

    Để khắc phục hãy kiểm tra thẻ rel = canonical trên tất cả các trang báo cáo có được thiết lập chính xác hay không. Nếu không có vấn đề xảy ra, bạn hãy sử dụng công cụ Google Search Console để kiểm tra URL xem liệu họ có chấp thuận URL Canonical mà bạn đã chỉ định hay không.

    canonical seo là gì

    Sai lầm thường gặp khi dùng thẻ rel=“canonical”

    Canonical là những lỗi kỹ thuật SEO thường gặp nhất của người làm SEO. Dưới đây là một trong những sai lầm phổ biến khi sử dụng thẻ canonical mà mọi người thường mắc phải. 

    Sai lầm 1: Chặn URL đã được chuẩn hóa qua Robots.txt 

    Việc chặn URL đã được chuẩn hóa trong robots.txt sẽ làm Google không thể thu thập dữ liệu. Nghĩa là Google không thể thấy bất cứ Canonical Tag nào trên đó. Điều này làm Google không thể chuyển hóa “link equity” từ Non-Canonical sang Canonical.

    Sai lầm 2: Đặt URL đã được chuẩn hóa thành ‘noindex’

    Noindex và Canonical là 2 yếu tố đối lập nhau, vì vậy không nên kết hợp thẻ canonical với noindex lại với nhau. Hơn nữa, Google cũng thường ưu tiên thẻ Canonical hơn “noindex”. 

    Nếu muốn thực hiện đồng thời việc gắn thẻ Tag và “noindex”, hãy sử dụng 301 redirects. Còn nếu không, bạn nên ưu tiên dùng dùng rel = canonical.

    Sai lầm 3: Không sử dụng Canonical Tags với Hreflang

    Để chỉ định target đối tượng dựa vào vị trí địa lý và ngôn ngữ của website thì sẽ sử dụng Hreflang tags. Khi dùng hreflang nếu không thể tìm ra ngôn ngữ chung cho cả Canonical Tags với Hreflang thì bạn nên “chỉ định URL gốc về cùng ngôn ngữ với website hoặc chọn ngôn ngữ thay thế tốt nhất. 

    canonical seo là gì

    Sai lầm 4: Có quá nhiều thẻ rel=canonical 

    Google sẽ bỏ qua tất cả nếu có quá nhiều thẻ rel = canonical. Nguyên nhân xảy ra là do các thẻ được thêm vào hệ thống khác nhau ở điểm thêm như: CMS, plugin và theme. Đây là lý do hiện nay, plugin có tùy chọn ghi đè để đảm bảo Canonical URL là nguồn duy nhất.

    Hiện nay cũng có nhiều trường hợp thẻ rel = canonical được thêm vào bằng JavaScript. Google chỉ chấp nhận trường hợp này khi URL gốc không xuất hiện trên HTML và thẻ rel = canonical bạn thêm với JavaScript.

    Ngược lại, nếu trên HTML đã xuất hiện thẻ rel = canonical mà bạn tiếp tục hoàn đổi page khác bạn thích với JavaScript thì bạn sẽ tạo ra hàng loạt tín hiệu hỗn hợp khiến Google không thể xác định. 

    Sai lầm 5: Đặt thẻ rel=canonical trong phần Body web

    Rel = canonical nên xuất hiện ở phần < head > của tài liệu và ở vị trí càng cao càng tốt. Nếu thẻ Canonical được gắn ở phần < body > của web, thẻ sẽ rất dễ bị bỏ qua và không có giá trị.

    Hi vọng qua bài viết này, Miliseo – dịch vụ SEO Đà Nẵng đã giúp bạn biết cách sử dụng và triển khai thẻ rel=canonical cho website của mình để góp phần giúp Google tìm kiếm thu thập thông tin dễ dàng và tăng thứ tự xếp hạng cho website.

    >> Xem thêm các bài viết của Miliseo về kiến thức SEO:

    ăn thịt từ khóa là gì 

    technical seo

    seo entity là gì

    backlink là gì

    How useful was this post? post