Bạn đang cảm thấy hoang mang dù đã nỗ lực SEO website rất nhiều nhưng vẫn dính thuật toán Google Panda.
Vậy thuật toán Google Panda Back là gì, nguyên nhân dẫn đến án phạt và làm thế nào để khắc phục?… Tất cả sẽ có trong bài viết dưới đây.
Cùng tôi vén màn “bí mật” của thuật toán Panda nào!
Google Panda (hay còn gọi là Panda Back) là một thuật toán được Google tạo ra nhằm thay đổi cách xếp hạng các kết quả tìm kiếm tốt hơn và công bằng hơn. Nó được phát hành lần đầu tiên vào tháng 2/2011.
Các điểm nổi bật trong Google Panda sẽ loại bỏ những nội dung rác, nội dung copy hay không mang lại giá trị cho người dùng… Đây được coi là bộ lọc quan trọng nhằm cải tiến các kết quả tìm kiếm mới của Google.
Đặc biệt, “tiêu diệt” các trang chuyên sao chép lại nội dung (content farms) và tạo điều kiện đưa các trang có chất lượng nội dung tốt và thông tin gốc lên thứ hạng cao hơn trong kết quả tìm kiếm.
Trong suốt khoản thời gian đầu ra mắt Google Panda đã được cập nhật nhiều lần, cho đến tháng 04/2021 nó đã đạt mức ảnh hưởng toàn cầu. Đồng thời, Google cũng cung cấp bộ câu hỏi gồm 23 câu hỏi hướng dẫn giúp các nhà quản trị đánh giá nội dung website của mình có vi phạm thuật toán Panda.
Năm 2010, chất lượng kết quả tìm kiếm của Google ngày càng giảm và sự trỗi dậy của mô hình “content farm” đã trở thành những chủ đề liên tục gây tranh cãi.
Như Amit Singhal của Google trao đổi với Wired tại TED, bản update “Caffeine” cuối năm 2009, đã thúc đẩy đáng kể khả năng index content của Google, cũng đã đưa “một số nội dung không tốt” vào chỉ mục của họ.
Trong khoản thời gian đó, rất nhiều người sở hữu số lượng website lớn đã lợi dụng “sơ hở” của Google để kiếm tiền bằng cách đăng tải hàng ngàn bài viết mỗi ngày… nhưng đều không có giá trị cho người dùng.
Vâng, bạn không nghe nhầm đâu. Hàng ngàn bài viết mỗi ngày và mục tiêu hướng tới là Google, sau đó họ làm cho nó lan truyền thông qua phần mềm social và kiếm nhiều tiền thông qua quảng cáo.
Nguyên nhân bởi vì thuật toán của Google lúc bấy giờ chỉ coi trọng số lượng nội dung và được bổ sung liên tục hơn chất lượng. Dẫn đến những nội dung này có vị trí cao trên các trang kết quả của công cụ tìm kiếm của họ.
Sau khi bị chỉ trích từ các trang báo khác nhau thì Google đã có phản hồi bằng cách phát triển thuật toán Google Panda.
Đến đây bạn đã biết được lý do tại sao Google tạo ra thuật toán Panda Back rồi đúng không!?
Quay trở lại nội dung chính, trong phần tiếp theo tôi sẽ liệt kê giúp bạn 12 nguyên nhân lớn khiến website bị dính thuật toán Panda. Vì vậy, bạn hãy tập trung và note lại tất cả những lưu ý này nhé!
Dưới đây là 12 nguyên nhân chính website của bạn bị dính thuật toán Panda, gồm:
# 1. Nội dung mỏng, thiếu độ sâu (Thin content)
Nếu website bạn đang sở hữu các trang có nội dung “mỏng”, rất ít văn bản và thiếu thông tin, tài nguyên liên quan.
Ví dụ: Với bài viết “Google Panda”, tôi chỉ viết định nghĩa khoảng 200 chữ và không có thêm bất kỳ thông tin nào như nguyên nhân, giải pháp hay hình ảnh liên quan, thì chắc chắn bài viết sẽ bị liệt kê vào “Thin Content”.
# 2. Nội dung trùng lặp (Duplicate content)
Nội dung trùng lặp là nội dung được sao chép thành ít nhất 2 bản trên Internet. Nó có thể xảy ra trên các website khác nhau hay trên chính website của bạn.
Trên website của bạn có nhiều trang có cùng một văn bản (có thể giống nhau toàn bộ hay một phần) thì rất dễ bị dính đến thuật toán Panda. Thông thường, tôi thường giữ mức tỷ lệ nội dung trùng lặp dưới 20% (chủ yếu là câu trích dẫn từ diễn giả hay website gốc) để tránh bị dòm ngó.
Một ví dụ trùng lặp điển hình thường gặp là ở các công ty làm dịch vụ và có nhiều chi nhánh như dịch vụ vệ sinh máy lạnh, sửa chữa máy in, thay mực máy in…
Ví dụ: Một công ty sửa chữa máy lạnh đã tạo ra 22 trang cho 22 quận, huyện khác nhau tại TP. HCM. Nội dung mỗi trang đều gần giống nhau như dịch vụ, quy trình và bảng giá… và chỉ khác nhau ở tiêu đề như Dịch vụ sửa chữa máy lạnh tại quận 1 hay Dịch vụ sửa chữa máy lạnh tại quận Bình Thạnh.
# 3. Content chất lượng thấp (Low-quality content)
Content chất lượng thấp là những nội dung không ngắn gọn hoặc không đầy đủ. Chỉ cần đọc một vài câu, bạn có thể chắc chắn rằng nội dung đã được viết bởi máy móc hoặc do “xào nấu” và không hề được đầu tư.
Chúng cung cấp ít giá trị cho người đọc vì chúng thiếu thông tin chuyên sâu. Nếu nội dung của bạn bị Google coi là content chất lượng thấp thì website sẽ không bao giờ được xếp hạng trong bảng kết quả tìm kiếm.
# 4. Website/Tên miền thiếu độ tin cậy
Nội dung được tạo ra bởi các nguồn không chính xác hoặc chưa được xác minh. Vấn đề này thường gặp ở website chưa được Google nhận diện và Entity chưa đủ mạnh.
Google cũng đã tuyên bố rằng các trang web không muốn bị tác động từ Panda nên cố gắng trở thành một website có thẩm quyền trong chính lĩnh vực của mình. Doanh nghiệp của bạn không chỉ xây dựng sự tin cậy với Google, mà còn cần tạo dựng lòng tin với người dùng, thậm chí người dùng sẽ cảm thấy thoải mái nếu cung cấp thông tin cá nhân như thẻ tín dụng.
# 5. Trang trại nội dung (Content Farm)
Số lượng lớn các trang chất lượng thấp, thường dùng nội dung của website khác để thêm từ khóa, tối ưu SEO.
Một website được xem là “trang trại nội dung” khi có nhiều bài viết ngắn hướng tới nhiều loại truy vấn khác nhau. Những nội dung trang web này được tạo ra nhằm “lách luật” các thuật toán và đạt được thứ hạng trên công cụ tìm kiếm, nhưng không có thẩm quyền và bất kỳ giá trị gì cho người dùng.
Mục tiêu của những người sử dụng “trang trại nội dung” là doanh thu đến từ quảng cáo nhờ vào lượng traffic tự nhiên từ công cụ tìm kiếm như Google.
# 6. Nhồi nhét quảng cáo vào website
Tỷ lệ quảng cáo trên nội dung cao – Các trang được tạo chủ yếu từ quảng cáo trả tiền hơn là nội dung gốc.
# 7. Vấn đề liên quan đến Schema
Các thông tin cung cấp trên Schema không trùng khớp với dữ liệu của website.
Ví dụ: Khi thực hiện schema review, bạn khai báo website có 500 lượt review và được đánh giá 5 sao,… Nhưng thực tế website bạn hiện chỉ đạt 100 lượt review và không thật sự được 5 sao, chính sự cung cấp thông tin sai này có thể khiến trang web bị dính án phạt Google Panda.
#8. Nội dung chất lượng thấp do người dùng tạo (UGC)
Trang website có nhiều bài viết do người dùng đăng tải dưới dạng Guest Post. Và hầu hết các bài viết đều có nội dung mỏng, đầy lỗi chính tả, ngữ pháp và thiếu thông tin có thẩm quyền.
#9. Nội dung không khớp với truy vấn tìm kiếm
Các trang “hứa” cung cấp câu trả lời có liên quan nếu click vào kết quả tìm kiếm, nhưng sau đó lại cung cấp một thông tin khác.
Ví dụ: Một trang có thể có tiêu đề “Phiếu giảm giá 50% cho combo gà rán”, nhưng khi click vào thì không có phiếu giảm giá hoặc có thể chỉ là một trang quảng cáo, dẫn đến sự thất vọng cho người dùng.
#10. Trang web bị người dùng chặn
Các trang web mà người dùng đang chặn trực tiếp trong kết quả tìm kiếm của Google hoặc sử dụng tiện ích mở rộng của trình duyệt Chrome, cho thấy đây là các trang web đã bị “cạch mặt” vì chất lượng thấp.
# 11. Xào lại nội dung cũ (Spin content)
Spin content (xào nội dung cũ) bạn có thể hiểu là hành động trộn – xào nội dung lại với nhau nhằm tạo ra những bài viết mới.
Hình thức Spin Content tạo ra những nội dung được Google xem như là nội dung rác. Chính vì thế, Google liên tục update nhiều thuật toán nhằm xóa các nội dung rác này. Đặc biệt, nhất vẫn là dùng thuật toán Google Panda để xóa nó.
# 12. “Ăn thịt” từ khóa (Keyword Cannibalization)
Trên website có nhiều hơn một trang cùng nói về một chủ đề hay cùng tối ưu một số keyword cụ thể. Dẫn đến các URL dù được hiển thị trên công cụ tìm kiếm, nhưng kết quả không có trang nào lên vị trí top 10.
Các trang này tuy có nội dung khác nhau nhưng đều hướng tới cùng chủ đề sẽ khiến Google “bối rối” không biết trang nào là chính và nên chọn trang nào để lên TOP. Do đó, chính các trang này lại tự kìm hãm lẫn nhau, dẫn đến đều được hiển thị trên công cụ tìm kiếm, nhưng kết quả không có trang nào lên vị trí top 10.
Trên đây là tất cả 12 nguyên nhân khiến website của bạn dễ bị dính án phạt từ thuật toán Panda. Tuy nhiên, làm thế nào để nhận biết hay dựa vào dấu hiệu gì giúp bạn phát hiện nhanh nhất website đang dính Panda Back?
Tada… mẹo nhanh giúp bạn trả lời cho câu hỏi trên được thể hiện ngay phần dưới đây!
Dấu hiệu chính cho thấy website bạn đang dính án phạt Panda đó là:
Một dấu hiệu dễ nhận biết là website bạn đang hoạt động bỗng dưng mất đi một nửa traffic tự nhiên (lưu lượng truy cập không phải trả tiền).
Điều này có thể xảy ra trong các đợt cập nhật Thuật toán cốt lõi của Google – thời điểm mà một lượng lớn bot Google sẽ vào thu thập các trang trên website của bạn.
Thuật toán Google Panda có thể ảnh hưởng trên toàn bộ website hoặc trên một số trang nhất định. Lúc này, bạn cần xem xét kỹ sự biến động thứ hạng từ khóa mỗi trang để đưa ra nhận định đúng.
Nếu bạn là người luôn theo dõi số liệu website định kỳ, bạn sẽ nhanh chóng phát hiện ra sự thay đổi này. Có thể trong khoảng thời gian đầu việc traffic giảm sẽ không ảnh hưởng quá nhiều đến trang web. Nhưng chỉ cần thêm 1 hoặc 2 tháng hay nguy hơn là chỉ trong vài tuần, mọi việc sẽ trở nên trầm trọng đấy.
Tuy nhiên, đừng lo lắng quá, bây giờ nếu bạn đang trong trường hợp nội dung bị trùng lặp nhưng không quá 20-30% thì hãy khắc phục ngay – không thì traffic sẽ bị kéo thẳng xuống, mọi việc sẽ trở nên khó khăn hơn.
Lưu ý nhỏ:
Dấu hiệu giảm traffic đều xảy ra ở cả hai thuật toán cốt lõi của Google là Panda và Penguin. Tuy nhiên, đối với hình phạt từ Panda thì traffic sẽ giảm dần theo thời gian, còn với Penguin thì ngược lại hoàn toàn.
Thuật toán Penguin sẽ phạt thẳng tay và traffic website bạn có thể giảm xuống tận đáy.
Ngoài ra, bạn cũng cần lưu ý một số trường hợp website bị giảm traffic nhưng không phải do Panda:
Bạn vẫn không chắc liệu mình có bị phạt hay không? Kiểm tra lưu đồ tiện lợi này:
Lưu đồ tiện lợi giúp phát hiện website bạn đang dính án phạt Panda hay không
Còn nếu như trong trường hợp website đã bị Google tuyên án Panda, thì bạn cần thực hiện theo 5 bước tôi hướng dẫn ngay nội dung tiếp theo để trang web phục hồi lại và note ngay những thông tin quan trọng nhất nhé!
Đừng dừng lại ở những gì Google nghĩ về nội dung của website. Bạn phải nghiên cứu cách người dùng tương tác với các bài viết của trang web.
Để hiểu rõ hơn về nội dung website trong “mắt” người dùng, bạn có thể truy cập Google Analytics và sắp xếp tất cả các trang theo lượt xem trang. Click vào Behavior – Site Content – All Pages.
Đối với tất cả các trang, bạn nên phân tích thời gian trung bình trên trang (Average time on page), tỷ lệ bỏ trang (Bounce rate) và tỷ lệ thoát (Exit rate). Ba chỉ số này sẽ cho bạn biết người đọc có thích nội dung của bạn hay không.
Đồng thời, bạn nên tổng hợp lại các bài đăng hoạt động kém nhất trong 1 file excel và đưa ra được phương án tối ưu. Dưới đây là 1 số cách mà tôi đã áp dụng khi Audit Content:
Lưu ý: Sau khi xóa các trang kém chất lượng, bạn cần kiểm tra lại các liên kết nội bộ để tránh việc các liên kết bị hỏng (404).
Nghe có vẻ điên rồ, tôi có thể xóa thẳng tay hàng trăm bài viết kém chất lượng và không mang lại chút giá trị gì cho người dùng. Bởi vì đó chính xác là những lỗi nghiêm trọng khiến tôi bị dính án phạt Google Panda.
Việc trùng lặp nội dung là nguyên nhân chính dẫn đến website bị án phạt Panda. Nếu website của bạn có nội dung trùng lặp trên 20%, đó có thể là rủi ro khá cao và giải pháp duy nhất là xử lý các vấn đề trùng lặp ngay lập tức.
Có 2 cách xử lý trùng lặp mà tôi thường áp dụng:
Thật khó để phát hiện ra các đoạn văn trùng lặp. Với kinh nghiệm “chinh chiến” với một vài website đã bị dính Panda, tôi có thể bật mí giúp bạn một số mẹo.
Tôi thường chọn các URL có xếp hạng không tốt cho một truy vấn cụ thể hoặc lọc các URL bị ảnh hưởng nghiêm trọng khi website có dấu hiệu giảm traffic, để kiểm tra thử xem có nội dung trùng lặp không.
Bạn có thể sử dụng các công cụ kiểm tra nội dung trùng lặp như CopyScape, Duplichecker,… hoặc áp dụng cách sau:
Thuật toán của Google gần đây đã phát triển rất nhiều và giờ đây nó đã hiểu nội dung của bạn tốt hơn nhiều. Nếu nội dung của bạn có nhiều lỗi ngữ pháp, hãy khắc phục ngay nhé.
Google Search Console (tên cũ là Google Webmaster Tool) là công cụ quản trị website của Google và là người bạn tốt nhất cho bạn. Bất kể bạn đang phải đối mặt với hình phạt nào, điều quan trọng là phải vượt qua tất cả các lỗi và đề xuất mà Google Search Console đưa ra.
Tại đây, bạn có thể xác định các liên kết bị hỏng trên trang web, lỗi thu thập dữ liệu hoặc lập chỉ mục và nhiều vấn đề khác.
Trong Google Search Console, bạn vào “Phạm vi lập chỉ mục”. Đây là báo cáo trạng thái URL của Google sau khi thu thập các trang trên website của bạn, trong đó:
Bạn nên rà soát kỹ các vấn đề lỗi trong báo cáo của Google Search Console và đưa ra giải pháp giải quyết. Việc lập chỉ mục đúng những trang cần thúc đẩy và loại bỏ những trang trùng lặp nội dung hay nội dung mỏng, trang kém chất lượng, 404… sẽ giúp website của bạn tăng điểm với Google và thoát thuật toán Panda nhanh chóng.
Sau khi xóa hoặc chuyển hướng URL có nội dung kém chất lượng, bạn nên sửa tất cả các lỗi nội bộ 404 và các vấn đề khác. Bạn có thể tìm thấy các Internal Link bị lỗi 404 và 301 bằng công cụ Screaming Frog và bước tiếp theo, bạn hãy vào trang chứa Internal Link đó và xóa bỏ hoặc thay thế bằng các link đúng.
Cách làm như sau:
Để tìm tất cả các trang web đang liên kết đến các trang đã xóa, bạn có thể sử dụng bằng Ahrefs hoặc qua công cụ Monitor Backlinks tôi giới thiệu dưới đây.
Bằng cách này, bạn giữ link juice (dòng chảy sức mạnh) liên kết đến một trang đang cung cấp nhiều giá trị hơn.
Để kiểm tra các backlinks đã trỏ với URL đã xóa, bạn vào mục “Site Explorer” => Thêm URL đã xóa vào ô search và chọn “Exact URL”.
Sau đó, ở thanh Menu bên trái màn hình chọn “Backlinks”, bạn sẽ có tất cả thông tin của backlinks trỏ đến URL đã xóa như Referring page, Anchor and backlink, DR, UR,…
Monitor Backlinks có thể giúp bạn tìm thấy các website bên thứ ba liên kết đến 404 và trang chuyển hướng của trang web.
Chuyển đến tab “Your Links” trong Monitor Backlinks và click vào “Filters” ở phía bên phải, sau đó click vào “Destination page with” và chọn “Pages with errors/redirects”.
Sau khi lọc ra các backlinks liên kết đến trang đã xóa, bạn có thể trao đổi với chủ website để đề xuất đổi URL đúng. Chắc chắn rằng sẽ không có chủ website nào lại muốn các liên kết ngoài của mình (external link) của mình bị hỏng.
Trong quá trình tạo trải nghiệm người dùng tốt hơn, bạn nên loại bỏ các quảng cáo trên màn hình đầu tiên và có thể để lại một vài quảng cáo trên thanh bên của trang web.
Người dùng không thích được chào đón bằng quá nhiều quảng cáo và Google cũng vậy. Thêm các menu và tăng trải nghiệm người dùng tổng thể để tăng thời gian trung bình trên website cho mỗi khách truy cập sẽ là điều tốt nhất dành cho bạn.
Cuối cùng, tôi có một số bí mật nhỏ gửi đến bạn nhằm giúp website tránh án phạt Google Panda. Đó là các yêu cầu của Google Panda Back nhất định bạn phải biết để vừa tránh vừa tăng độ tin cậy website với Google.
Click Through Rate (CTR): Yếu tố này rất quan trọng đối với website vì nó ảnh hưởng trực tiếp đến Điểm chất lượng của bạn (Quality Score).
Nó có nghĩa là nếu nhiều người chọn click vào liên kết dẫn đến website thì chứng tỏ website bạn có uy tín và thu hút nhiều người.
Mẹo: Hãy xếp các keyword quan trọng vào tiêu đề hợp lý và tối ưu meta description để tăng thu hút người đọc.
Backlink và traffic được xem là một trong những thành phần rất quan trọng quyết định thứ hạng, uy tín website bạn.
Tuy nhiên, hiện nay có rất nhiều SEOer mắc một lỗi nghiêm trọng đó là phân bố backlink không đồng đều. Ví dụ: chỉ tập trung phân bổ backlink vào trang chủ mà bỏ quên các liên kết dẫn đến trang khác trong website. Chính điều này dẫn đến website bị réo tên bởi Google Panda Back.
Do đó, tránh lặp lại lỗi đáng tiếc trên và tránh Google hiểu website bạn chỉ có 1 trang chủ là nội dung chất lượng, bạn hãy phân bố backlink để traffic được chia đều đến các trang.
Có một thời, chúng ta luôn cố gắng tìm cho mình một domain sở hữu tên dịch vụ để tối ưu nhất thứ hạng website. Tại sao?
Vì vậy, bạn có thể nhận thấy EDM không phải là điều quyết định tất cả, điều bạn cần là những nội dung chất lượng và phù hợp.
Hiện nay, Google đã update rất nhiều thuật toán và tất nhiên mọi thứ luôn vận hành theo cách người tiêu dùng mong muốn nhất. Do đó, sự thay đổi và phát triển cần thiết dành cho bạn là những nội dung dựa vào trải nghiệm người dùng.
Website có thể đạt được xếp hạng cao là website sở hữu những nội dung không chỉ dành cho Google mà còn phải thỏa mãn nhu cầu tìm kiếm của con người.
Trong quá trình làm SEO, tôi đã gặp rất nhiều website khách hàng bị ảnh hưởng bởi thuật toán Google Panda. Thông thường, website bị dính thuật toán Panda sẽ bị giảm traffic dần nên khách hàng thường ít chú ý và khi tình trạng trở nên tồi tệ thì việc tìm nguyên nhân và chỉnh sửa sẽ khó khăn hơn.
Dưới đây là 1 case study mà tôi và đội ngũ FIEX đã phục hồi một website bị dính án phạt Panda:
Tình trạng website: Website có số lượng trang sản phẩm lớn và các trang sản phẩm có nội dung trùng lặp lẫn nhau. Một số bài viết thông tin, đánh giá sản phẩm, mẹo… đã “lỗi thời”, chưa được cập nhật cho các dòng sản phẩm mới nhất. Ngoài ra, website còn có nhiều bài viết cùng chủ đề dẫn đến bị Keyword Canibalization…
Giải pháp FIEX:
Kết quả: Traffic website dần phục hồi và tăng trưởng dần từ 22,000 đến hơn 50,000 ở giai đoạn 2 (17.6 – 13.9.21)
Từ quan điểm và những trải nghiệm thực tế, tôi nhận thấy để tránh thuật toán Panda là phát triển một thương hiệu được công nhận, có thẩm quyền trong lĩnh vực và xây dựng một website trở thành một nguồn đáng tin cậy nhờ nội dung xuất sắc.
Đồng thời, bạn nên ghi nhớ các khái niệm cốt lõi của thuật toán Google Panda là gì. Tránh các chiến thuật mũ đen, liên kết spam, tập trung vào nội dung chất lượng cho người dùng và trải nghiệm của họ.
Tôi là Thủy, hiện nay đang là SEO Manager tại FIEX Marketing. Với kinh nghiệm trên 4 năm trong lĩnh vực SEO và Marketing, đảm nhận vị trí SEO Leader cho hơn 20 dự án lớn nhỏ khác nhau và giúp website doanh nghiệp tăng trưởng hàng trăm ngàn traffic mỗi tháng, tôi hiểu được khó khăn của các bạn mới bắt đầu tìm hiểu về SEO. Do đó, tôi muốn chia sẻ đến các bạn những kiến thức SEO thật chất lượng để bạn có thể hiểu và áp dụng "thực chiến" tốt nhất.