Thuật toán Google Panda và cách gỡ phạt

Panda là tên chính thức của bản cập nhật thuật toán Google được phát triển để giảm mức độ phổ biến của nội dung mỏng, chất lượng thấp trong kết quả tìm kiếm cà để thưởng cho nội dung độc đáo, hấp dẫn.

Vào thời điểm Panda ra mắt, những phàn nàn của người dùng về ảnh hưởng ngày càng tăng của các trang web nội dung trên mạng đã phát triển rầm rộ.

thuat-toan-Google-panda

Thuật toán Panda của Google chỉ định các trang phân loại chất lượng của con người, được kết hợp làm yếu tố xếp hạng.

Các trang web phục hồi từ tác động của Panda làm như vậy bằng cách cải tiến các trang có nội dung chất lượng thấp, thêm nội dung chất lượng cao mới, loại bỏ các từ điền và trên quảng cáo gấp, và nói chung là cải thiện trải nghiệm người dùng vì nó liên quan đến nội dung.

Tại sao Google tạo Panda?

 

Vào năm 2010, chất lượng kết quả tìm kiếm của Google giảm xuống và sự trỗi dậy của mô hình kinh doanh nội dung trên mạng đã trở thành một chủ đề được lặp đi lặp lại.

Như Amit Singhal của Google sau đó đã nói tại TED, bản cập nhật của caffeine vào cuối năm 2009, đã tăng tốc đáng kể, khả năng của Google để lập chỉ mục nội dung một cách nhanh chóng, cũng đã giới thiệu một số nội dung không tốt vào chỉ mục của họ. Matt Cutts của Google đã nói với Wired vấn đề nội dung msoiw này thực sự không phải là vấn đề về thư rác, nhưng một trong những điều tối thiểu mà tôi có thể làmđó không phải là thư rác.

ReadWriteWeb đã chỉ ra:

“By the end of [2009], two of these content farms – Demand Media [of eHow infamy] and Answers.com – were firmly established inside the top 20 Web properties in the U.S. as measured by comScore. Demand Media is the epitome of a content farm and by far the largest example of one, pumping out 7,000 pieces of content per day…The company operates based on a simple formula: create a ton of niche, mostly uninspired content targeted to search engines, then make it viral through social software and make lots of money through ads.”

Vào tháng 1 năm 2011, Business Insider đã xuất bản một tiêu đề nói lên tất cả: Thuật toán tìm kiếm của Google đã bị hủy hoại, thời gian để quay trở lại Curration.

Trong một bài viết khác, họ đã chỉ ra:

“Demand [Media] is turning the cleverest trick by running a giant arbitrage of the Google ecosystem. Demand contracts with thousands of freelancers to produce hundreds of thousands of pieces of low-quality content, the topics for which are chosen according to their search value, most of which are driven by Google. Because Google’s algorithm weights prolific and constant content over quality content, Google’s algorithm places Demand content high on their search engine result pages.”

Không còn nghi ngờ gì nữa, các tiêu đè như thế này là một ảnh hưởng lớn đến Google, đã phản ứng bằng cách phát triển thuật toán Panda.

Google Panda ra mắt cập nhật mới

Panda được giới thiệu lần đàu tiên vào ngày 23 tháng 2 năm 2011.

Vào ngày 24 tháng 2, Google đã xuất bản một bài đăng trên blog về bản cập nhật và chỉ ra rằng họ đã đưa ra một cải tiến thuật toán lớn cho xếp hạng của chúng tôi, một thay đổi đáng chú ý ảnh hưởng đến 11,8% các truy vấn của chúng tôi.

“This update is designed to reduce rankings for low-quality sites—sites which are low-value add for users, copy content from other websites or sites that are just not very useful. At the same time, it will provide better rankings for high-quality sites—sites with original content and information such as research, in-depth reports, thoughtful analysis and so on.”

Người sáng lập của Search Engine Land, Daniel Sullivan ban đầu gọi nó là bản cập nhật của Farmer, mặc dù sau đó Google tiết lộ rằng bên trong nó được gọi là Panda, tên của kỹ sư đã đưa ra bước đột phá thuật toán chính.

Các phân tích của SearchMetrics và SISTRICK trong số những người chiến thắng và thua cuộc đã nhận thấy rằng các trang web bị ảnh hưởng nặng nề nhất khá quen thuộc với bất kỳ ai làm trong ngành SEO vào thời điểm đó. Các trang web này bao gồm Wisegeek.com, ezinearticles.com, suite101.com, v.v.

Sự thay đổi rõ ràng nhất trong ngành SEO là mức độ ảnh hưởng của nó đến tiếp thị bài viết, trong đó các học viên SEO đã sử dụng để xuất bản các bài viết chất lượng thấp trên các trang web như eznearticles.com như mọt hình thức xây dựng liên kết.

Tham khảo thêm: 10 cách để Google lập chỉ mục trang web của bạn

Rõ ràng là các trang web bị ảnh hưởng nặng nề nhất có thiết kế kém hấp dẫn hơn, quảng cáo nhiều hơn, số lượng từ bị thổi phồng, tiêu chuẩn biên tập thấp, cụm từ lặp đi lặp lại, nghiên cứu kém và nói chung không hưu ích và đáng tin cậy.

Những gì chúng ta biết về thuật toán Panda

Khi Google thảo luận về sự phát triển của thuật toán với Wired, Singhal nói rằng họ đã bắt đầu bằng cách gửi tài liệu kiểm tra tới những người đánh giá chất lượng, những người được hỏi những câu hỏi như Bạn có cảm thấy thoải mái khi đưa trang web này vào thẻ tín dụng của mình không? Bạn có thể thoải mái đưa thuốc theo quy định của trang này cho con bạn không?

Cutts cho biết kỹ sư này đã phát triển một bộ câu hỏi khắt khe, mọi thứ từ đó. ‘Bạn có xem trang web này là có thẩm quyền? Nó sẽ ổn nếu điều này là trong một tạp chí? Trang web này có quảng cáo quá mức không?

Theo cuộc phỏng vấn, sau đó họ đã phát triển thuật toán bằng cách so sánh các tín hiệu xếp hạng khác nhau so với bảng xếp hạng chất lượng con người. Singhal mô tả nó như là tìm một mặt phẳng trong không gian siêu âm ngăn cách các trang web tốt với cái xấu.

Vào tháng 3 năm 2011, SEO By The Sea đã xác định Biswanath Panda là kỹ sư có khả năng đứng sau tên của thuật toán. Một bài báo Biswanath đã giúp tác giả trình bày chi tiết cách sử dụng thuật toán học máy để phân loại chính xác về hành vi của người dùng trên trang đích.

Mặc dù bài báo không nói về thuật toán Panda, nhưng tác giả với sự tham gia và tên của chủ đề của nó, cho rằng Panda cũng là một thuật toán học máy.

Hầu hết trong ngành SEO hiện nay đã kết luận rằng Panda hoạt động bằng cách sử dụng máy học để đưa ra dự đoán chính xác về cách con người đánh giá chất lượng nội dung. Điều ít rõ ràng hơn là những tín hiệu nào sẽ được tích hợp vào thuật toán máy học để xác định trang web nào có chất lượng thấp và trang nào không.

Phục hồi Panda của Google

Con đường phục hồi từ Panda vừa đơn giản vừa khó khăn.

Vì Panda tăng hiệu suất của các trang web có nội dung được phân loại là có chất lượng cao, nên giải pháp là tăng chất lượng và tính độc đáo của nội dung của bạn.

Mặc dù nói dễ hơn làm, nhưng đã được chứng minh hết lần này đến lần khác rằng đây chính xác là những gì cần thiết để phục hồi.

Felix Tarcomnicu đã phục hồi một trang web bằng cách xóa nội dung mỏng, chất lượng thấp chưa bao giờ hoạt động tốt (dựa trên tỷ lệ thoát, thời gian trên trang web), làm sạch ngữ pháp và thêm nội dung chất lượng tốt hơn.

Alan Bleiweiss đã giúp một trang web phục hồi bằng cách giúp họ viết lại nội dung trên 100 trang.

WiredSEO đã giúp một trang web phục hồi từ Panda bằng cách thay đổi các nguyên tắc nội dung do người dùng tạo để khuyến khích bios cụ thể, độc đáo hơn, thay vì các trang được sao chép từ các trang web khác. Người dùng của trang web trước đây đã sử dụng bios từ các trang web khác của họ, nhưng WiredSEO khuyến khích họ thay đổi tiểu sử để đặt câu hỏi cụ thể, dẫn đến bios độc đáo không trùng lặp.

SEOMaverick đã giúp một trang web phục hồi bằng cách khử các trang cắt cookie, kết hợp nhiều trang trong cùng một chủ đề thành các trang duy nhất và cập nhật tất cả các trang còn lại với cấu trúc và bản sao tốt hơn.

Xem thêm: Tại sao Google phạt liên kết web không backlink?