Skip to main content

Công cụ kiểm tra trùng lặp nội dung

Trùng lặp nội dung là việc nội dung bài viết trên website của bạn giống với nội dung nào đó tương tự trên Internet. Có hai kiểu trùng lặp nội dung là trùng lặp nội dung trong bản thân website và trùng lặp nội dung ngoài website

 Trùng lặp nội dung trong bản thân website là lỗi khá phổ biến nếu bạn không hoàn thành đạt 100% SEO onpage. Vấn đề này xảy ra do việc bạn bỏ xót các vấn đề như: chưa khai báo để bỏ hay không bỏ "www" trước tên miền. Như vậy khi người dùng truy cập vào hai địa chỉ www.tenmien.comtenmien.com đều ra 1 website có nội dung như nhau. Đối với người dùng thì họ không để ý việc này nhưng nó là một lỗi rất nặng và chính vì sự trùng lặp nội dung này mà website của bạn không có được thứ hạng tốt. Google sẽ đánh giá những website có chứa nhiều nội dung trùng lặp là những website ít có giá trị. Vậy nên bạn hãy kiểm tra xem website mình có bị lỗi này không. Nếu có thì hãy vào file htacess thêm đoạn code sau

RewriteEngine on
RewriteCond %{HTTP_HOST} !^www.tenmien.com [NC] 
RewriteRule ^(.*)$ http://www.tenmien.com/$1 [L,R=301]  

Chú ý là: tenmien.com là địa chỉ tên miền của website.

Trên các CMS (Hệ quản trị nội dung) hiện nay đều có các module giúp bạn tránh việc trung lặp nội dung trong bản thân website bằng việc thêm tag 

<link rel="canonical" href="http://www.vietnoiviet.com/" /> vào trong phần head 
 
tag canonical

Hình trên đây là mã code của trang vietnoiviet.com. Có thẻ canoncial

Việc thêm thẻ canoncial để chắc chắn rằng nội dung trên website chỉ có một đường dẫn duy nhất và Google chỉ cần đánh chỉ mục (index) theo đường dẫn đó.
Đối với việc trùng lặp nội dung ngoài website. Việc này hoàn toàn do con người cố ý làm. Bạn có thể đi sao chép nội dung ở một website khác và mang về website của mình và mong muốn rằng sẽ google sẽ hiểu đó là nội dung gốc. Nghe có vẻ dễ dàng. Nhưng hầu hết đều gây ra một cuộc cạnh tranh không lành mạnh. Nếu cả website bạn và website nơi bạn copy đều có những chỉ số về độ tin cậy đó là PA và DA tương tự nhau.
Sau đây chúng ta sẽ tìm hiểu rõ hơn về chỉ số PA ,DA :
 
PA là gì ?
 
PA ( Page Authority ) nó là chỉ số ảnh hưởng đến 90% việc link làm Seo của chúng ta có nằm ở vị trí cao hay thấp.Chỉ số này được hiểu như là sức mạnh và độ uy tín của một web page  riêng lẻ, đưa ra kết quả xem page đó  nằm thứ hạng cao hay thấp  và nó được đánh giá theo thang điểm là 0 đến 100 nên chỉ số càng cao thì thứ hạng càng cao và ngược lại.
 
Vậy làm sao để tăng chỉ số PA này lên ?
 
Rất đơn giản, đó là chất lượng backlink, cải thiện chất lượng backlink là 1 cách tốt để tăng chỉ số PA. Hãy rải backlink ở các website uy tín, chất lượng nhiều người truy cập, nội dung hấp dẫn, như vậy chỉ số PA sẽ tăng.
 
DA là gì ?
 
DA ( Domain Authority ) là chỉ số đánh giá sức mạnh tên miền (domain) do đơn vị SEOMoz phát triển , Đơn vị xếp hạng được biểu diễn từ 0 đến 100 trên tất cả các tên miền dựa vào khoảng hơn 150 yếu tố được phân tích từ thứ hạng website trên Google.
 
Chỉ số DA của bạn càng cao thì cũng đồng nghĩa với việc bạn đang làm SEO đúng hướng, tự nhiên.  Tất nhiên, làm tăng chỉ số này lên cũng là một cách tối ưu hóa chiến dịch làm SEO của bạn hơn, nhưng Chúng ta không thể tối ưu hết được 150 yếu khác nhau mà chỉ cần tập trung vào 3 yếu tố quan trọng dưới đây là đủ cơ bản để đánh giá domain.

Việc đi sao chép nội dung nếu bị Google phát hiện thì sẽ bị phạt rất nặng. Và website của bạn có thể không còn tìm thấy được ở trên Google Search với nhiều từ khóa khác nữa. 
Để kiểm tra xem website bạn có bị trùng lặp nội dung hay không. Bạn vào công cụ http://www.copyscape.com. để kiểm tra.