Tất cả về thuật toán Yandex

Mục lục:

Tất cả về thuật toán Yandex
Tất cả về thuật toán Yandex
Anonim

Nhờ tiến bộ công nghệ, có thể thực hiện các thao tác cần thiết mà không cần rời khỏi nhà. Bây giờ bạn thậm chí có thể làm việc thông qua Web, và nhiều người từ lâu đã cảm thấy tốt trong lĩnh vực này. Cách phổ biến nhất để kiếm tiền trên Internet là tạo trang web hoặc blog của riêng bạn. Nhờ quảng cáo được đặt trên tài nguyên, chủ sở hữu của nó có thể kiếm được lợi nhuận tốt. Đúng, lược đồ này chỉ hoạt động khi trang web hoặc blog nằm trên các trang đầu tiên của tìm kiếm. Nói một cách đơn giản, mức thu nhập của chủ sở hữu nó phụ thuộc vào số lượng khách truy cập vào tài nguyên.

Và điều đầu tiên bạn cần biết khi bắt tay vào các hoạt động đó là cách thức hoạt động của các thuật toán tìm kiếm, đặc biệt là các thuật toán của Yandex, công cụ tìm kiếm lớn nhất trên Runet.

Thuật toán tìm kiếm là gì?

Thuật toán tìm kiếm, còn được gọi là thuật toán Yandex, là một loại công thức toán học mà truy vấn của người dùng là không xác định. Robot tìm kiếm giải quyết công thức này: thay thế các giá trị khác nhau cho giá trị chưa biết và chọn giá trị phù hợp nhất.

Các thuật toán Yandex
Các thuật toán Yandex

Nếu chúng ta đơn giản hóa định nghĩa, chúng ta có thể diễn đạt nó như sau: một thuật toán tìm kiếm làmột chương trình đặc biệt xử lý “vấn đề”, trong trường hợp của chúng tôi là một truy vấn tìm kiếm và cung cấp cho nó một “giải pháp”, tức là, nó hiển thị danh sách các trang web có thông tin mà người dùng cần.

Giải quyết "vấn đề", thuật toán xem xét tất cả các từ khóa trên các trang, sắp xếp dữ liệu nhận được và tạo ra kết quả tìm kiếm mà người dùng cần. Nhờ thuật toán tìm kiếm, robot có thể phân tích nội dung của từng tài nguyên. Dựa trên thông tin nhận được, vị trí của trang web trong kết quả tìm kiếm được xác định.

Điều gì ảnh hưởng đến thuật toán tìm kiếm?

Như bạn thấy, kết quả tìm kiếm cho cùng một truy vấn trong các công cụ tìm kiếm khác nhau là khác nhau. Vì vậy, thuật toán Yandex khác biệt đáng kể so với Google. Ví dụ: để kiểm tra độ tinh khiết của thử nghiệm, chúng tôi sẽ mở hai tab: một công cụ tìm kiếm từ Yandex, một từ Google. Nếu bạn nhập truy vấn "làm thế nào để đến Nhật Bản để thường trú" trong thanh tìm kiếm, bạn có thể thấy rằng trang web đầu tiên trong kết quả tìm kiếm của Yandex nằm ở vị trí thứ hai trong kết quả tìm kiếm của Google.

Các thuật toán của công cụ tìm kiếm được bảo mật nghiêm ngặt, chúng phân tích các thông số trang web giống nhau, nhưng không ai biết cái nào họ chú ý hơn và cái nào họ ít chú ý hơn. Ngay cả những người làm SEO cũng hỏi câu hỏi này.

Thuật toán phát hành Yandex
Thuật toán phát hành Yandex

Các tham số mà thuật toán hoạt động với

Như đã đề cập, các thuật toán tìm kiếm của Yandex được hướng dẫn bởi các tham số nhất định. Nói chung, chúng có thể được chia thành hai nhóm. Một số tham số chịu trách nhiệm về nội dung ngữ nghĩa của tài nguyên, chúng có thể có điều kiệngọi nó là "văn bản". Những người khác mô tả các đặc tính kỹ thuật (thiết kế, plugin, v.v.). Có thể chỉ định chúng là "chức năng-kỹ thuật" theo điều kiện. Để rõ ràng, bạn nên chia nhỏ tất cả các tham số thành các nhóm và đặt chúng vào một bảng.

"Văn bản" "Kỹ thuật và Chức năng"
Ngôn ngữ tài nguyên Tuổi trang, tên miền, vị trí.
Mức độ phổ biến của chủ đề và lượng văn bản trên mỗi trang. Số trang và "trọng lượng" của chúng
Tỷ lệ từ khóa trên tổng số văn bản. Sẵn có của giải pháp phong cách
Số lượng trích dẫn và mức độ độc đáo của nội dung Số lượng tìm kiếm cho một từ khóa cụ thể và tần suất cập nhật thông tin.
Kích thước phông chữ và kiểu chữ Sự hiện diện của các tệp đa phương tiện, khung, mô-đun flash và thẻ meta
Số lượng liên kết trong văn bản Kiểu của tiêu đề, tiêu đề phụ và COP
Từ khóa khớp với phần thư mục nơi trang web được đăng ký. Nhận xét trong mã, loại trang, trùng lặp

Xếp hạng

Các thông số này đóng vai trò quan trọng trong các thuật toán xếp hạng. Thuật toán xếp hạng là một cách để tìm ra giá trị của mỗi trang. Nói một cách đơn giản, nếutrang web có hiệu suất tốt trong tất cả các thông số này, thì nó sẽ cao hơn trong kết quả tìm kiếm.

Các thuật toán xếp hạng củaYandex hầu như thay đổi hàng năm. Những cái chính được đặt tên theo thành phố. Tên của khái niệm tìm kiếm mới bắt đầu bằng chữ cái cuối cùng của tên thuật toán trước đó. Vì vậy, công cụ tìm kiếm đã tạo ra các thuật toán:

  • "Magadan" (2008).
  • "Nakhodka" (2008).
  • "Arzamas" (2009).
  • "Snezhinsk" (2009).
  • "Konakovo" (2010).
  • "Obninsk" (2010).
  • Krasnodar (2010).
  • Reykjavik (2011).
  • "Kaliningrad" (2012).
  • "Dublin" (2013).
  • "Nachalovo" (2014).
  • "Odessa" (2014).
  • "Amsterdam" (2015).
  • "Minusinsk" (2015).
  • "Kirov" (2015).

Bên cạnh chúng, ba thuật toán tìm kiếm Yandex khác đã được phát hành trong hai năm qua. Ngoài ra còn có các thuật toán đặc biệt AGS-17 và AGS-30, nhiệm vụ chính là tìm kiếm các tài nguyên không đáp ứng được yêu cầu. Nói một cách đơn giản, các thuật toán này tìm kiếm các trang web có nội dung không độc đáo và nhiều từ khóa, sau đó áp dụng các hình phạt cho chúng. Và bây giờ là một chút về từng thuật toán.

Thuật toán xếp hạng Yandex
Thuật toán xếp hạng Yandex

Thuật toán 2008-2011

Trong hai năm, Yandex đã tạo ra bốn thuật toán tìm kiếmchất lượng khác với các phiên bản ban đầu, trước đó. Năm 2008, lần đầu tiên trong bảng xếp hạng tìm kiếm, họ bắt đầu tính đến tính độc đáo của nội dung ("Magadan"). Lần đầu tiên, một hệ thống mới đã được giới thiệu có tính đến sự hiện diện của các từ dừng ("Nakhodka").

Năm 2009, thuật toán tìm kiếm Yandex bắt đầu tính đến khu vực của người dùng, một bộ phân loại mới gồm các truy vấn phụ thuộc địa lý và không phụ thuộc địa lý đã xuất hiện. Công thức khu vực để chọn câu trả lời ("Arzamas") đã được cải thiện đáng kể. Vấn đề đã thay đổi rất nhiều, 19 công thức xếp hạng khu vực mới đã xuất hiện và các tiêu chí xếp hạng độc lập về địa lý đã được cập nhật ("Snezhinsk", "Konakovo").

Năm 2010, các thuật toán của công cụ tìm kiếm Yandex đã tích cực phát triển các công thức mới cho các truy vấn phụ thuộc địa lý và không phụ thuộc địa lý ("Obninsk", "Krasnodar"). Năm 2011 được đánh dấu bằng việc bắt đầu phát hành cá nhân hóa, sở thích ngôn ngữ của người dùng Internet bắt đầu được tính đến.

Xếp hạng tìm kiếm 2012-2014

Vào năm 2012, việc cá nhân hóa kết quả tìm kiếm đã thay đổi đáng kể: họ bắt đầu tính đến lợi ích của người dùng về lâu dài, mức độ liên quan của các trang thường xuyên truy cập (Kaliningrad) tăng lên. Vào năm 2013, thuật toán Yandex đã khéo léo điều chỉnh kết quả tìm kiếm theo sở thích của một người dùng cụ thể trong một phiên, có tính đến sở thích ngắn hạn ("Dublin"). Vào năm 2014, việc xem xét các liên kết cho các yêu cầu thương mại đã bị loại bỏ khi xếp hạng các câu trả lời ("Đang bắt đầu").

Amsterdam, Minusinsk, Kirov

Trong kết quả tìm kiếm, một thẻ có thông tin bắt đầu xuất hiện bên cạnh kết quả khi bạn di chuột qua liên kết ("Amsterdam"). Lần đầu tiên, nhiệm vụ của thuật toán Yandex là hạ thứ hạng của các tài nguyên có nhiều liên kết SEO. Sự hiện diện của một hồ sơ liên kết rộng rãi đã trở thành lý do chính dẫn đến việc mất các vị trí. Thuật toán "Minusinsk" của "Yandex" bắt đầu loại bỏ hàng loạt các liên kết SEO, một thời gian sau, việc tính toán các yếu tố liên kết đã được trả lại, nhưng chỉ ở khu vực Moscow.

Trong thuật toán thứ ba năm nay, ngẫu nhiên hóa các truy vấn có liên quan đã được giới thiệu. Nói một cách đơn giản, khi đưa ra các truy vấn, bạn có thể sắp xếp chúng theo ngày, mức độ phổ biến hoặc khu vực ("Kirov").

Thuật toán tác vụ Yandex
Thuật toán tác vụ Yandex

Vladivostok và Palekh

Thuật toán Vladivostok, bắt đầu hoạt động vào đầu năm 2016, bắt đầu tính đến khả năng thích ứng của tài nguyên với thiết bị di động và kết quả tìm kiếm trên thiết bị di động đã tăng lên.

Thuật toán Palekh, được trình bày vào tháng 11, đáng được quan tâm đặc biệt. Bản chất chính của nó là so sánh ý nghĩa của câu hỏi và các trang sử dụng mạng thần kinh - trí tuệ nhân tạo mô phỏng hoạt động của não người. Nhờ đó, việc phát hành các yêu cầu hiếm hoi đã tăng lên. Ban đầu, thuật toán này chỉ hoạt động với tiêu đề trang, nhưng, như những gì người sáng tạo nói, theo thời gian, nó sẽ học cách “hiểu” chính văn bản đó. Thuật toán hoạt động như sau:

  • Hệ thống sẽ tính đến số liệu thống kêkhớp với yêu cầu và tiêu đề, do đó tăng độ chính xác của kết quả tìm kiếm.
  • Làm việc với những tương ứng như vậy được gọi là "vectơ ngữ nghĩa". Cách tiếp cận này để xếp hạng tìm kiếm giúp tìm câu trả lời cho các truy vấn hiếm nhất. Một thuật toán đã học để hiểu văn bản có thể tạo ra kết quả trong đó sẽ không có một từ tương tự nào với truy vấn, tuy nhiên, chúng hoàn toàn khớp với nhau về nội dung.

Nói một cách đơn giản, Yandex đã cố gắng tạo ra một công nghệ "thông minh" tìm kiếm câu trả lời không dựa trên từ khóa mà dựa trên chính nội dung của văn bản.

Thuật toán tìm kiếm Yandex
Thuật toán tìm kiếm Yandex

Baden-Baden

Thuật toán Yandex mới, được phát hành vào tháng 3 năm 2017, đã trở thành một bước đột phá thực sự trong hệ thống xếp hạng tìm kiếm. Trong kết quả tìm kiếm, các trang web có nội dung hữu ích, dễ hiểu và dễ đọc bắt đầu xuất hiện ở vị trí đầu tiên. Nhiệm vụ chính của thuật toán này là cung cấp cho người dùng không phải văn bản phù hợp với yêu cầu mà là thông tin cần thiết.

Trong quá trình Baden-Baden, các tài nguyên có thông tin được tối ưu hóa lại và chất lượng thấp đã giảm trong kết quả tìm kiếm. Các chuyên gia chắc chắn rằng vị trí của các cửa hàng trực tuyến sẽ giảm xuống, vì có quá nhiều từ lặp lại và mô tả sản phẩm thực tế giống nhau. Nhưng các nhà phát triển của thuật toán đã tính đến rằng có những chủ đề cụ thể mà việc lặp lại các từ ghép là không thể tránh khỏi. Vậy những văn bản nào bị xử phạt? Tốt hơn là nên xem điều này bằng một ví dụ.

Các thuật toán của công cụ tìm kiếm Yandex
Các thuật toán của công cụ tìm kiếm Yandex

Văn bản không khớp với thuật toán tìm kiếm

Trước đó, rô bốt tìm kiếm đã đưa các tài nguyên có chứa từ khóa lên các vị trí hàng đầu. Nhưng các văn bản trên các trang web như vậy thường trông giống như một tập hợp các truy vấn được pha loãng với "nước" của các văn bản chất lượng thấp. Và ví dụ dưới đây là minh chứng cho điều đó:

Nike tung ra vô số sản phẩm thể thao mỗi năm. Giày thể thao, giày thể thao, ủng, bộ đồ Nike, áo phông Nike, quần short, bộ đồ thể thao Nike, quần dài, quần thể thao Nike, quả bóng đá - những sản phẩm này và các sản phẩm khác có thể được tìm thấy trong bất kỳ cửa hàng nào của công ty. Các bộ sưu tập dành cho nữ, nam và trẻ em của Nike truyền tải chủ đề chính của thương hiệu. Trang phục của Nike đặc biệt ở chỗ mỗi sản phẩm đều thể hiện được tinh thần của thương hiệu.”

Những văn bản như vậy chẳng có tác dụng gì, chúng chẳng khác gì những chiếc quan tài với những truy vấn chính. Đây là nơi mà thuật toán mới chiến đấu. Nội dung có chất lượng thấp chắc chắn sẽ mất vị trí. Có ba tiêu chí cho nội dung chất lượng thấp:

  • Thiếu logic trong văn bản.
  • Rất nhiều từ khóa.
  • Xuất hiện trong văn bản các cụm từ không tự nhiên xuất hiện do sự xuất hiện trực tiếp của các từ khóa.

Tất nhiên, không ai hủy bỏ việc tối ưu hóa SEO, các nguyên tắc cơ bản của công cụ tìm kiếm vẫn được giữ nguyên. Nhưng cách tiếp cận, trong đó có 15-20 truy vấn chính trên 1000 ký tự, từ lâu đã lỗi thời. Thuật toán "Baden-Baden" tập trung vào chất lượng của nội dung.

thuật toán yandex mới
thuật toán yandex mới

Kết quả tìm kiếm

Một vị trí quan trọng trong quá trình tìm kiếm thông tin làthuật toán phát hành. SERP là một trang kết quả phù hợp với một truy vấn cụ thể. Thuật toán phát hành "Yandex" được thiết kế theo cách mà nó có thể tính toán xác suất tìm được câu trả lời phù hợp nhất và tạo ra kết quả là mười tài nguyên. Trong trường hợp yêu cầu phức tạp, thì có thể tìm thấy 15 câu trả lời trong đầu ra.

1. Ngôn ngữ tài nguyên
2. Mức độ phổ biến của chủ đề và lượng văn bản trên mỗi trang.
3. Tỷ lệ từ khóa trên tổng lượng văn bản.
4. Số lượng trích dẫn và mức độ độc đáo của nội dung
5. Kích thước và kiểu phông chữ
6. Số lượng liên kết trong văn bản
7. Đối sánh từ khóa với phần của thư mục nơi trang web được đăng ký.

Trên thực tế, nó hoạt động như thế này: nếu thuật toán "quen thuộc" với yêu cầu và có câu trả lời phù hợp cho nó, thì kết quả đầu ra gồm mười câu trả lời sẽ được hình thành. Trong trường hợp công cụ tìm kiếm không thể tìm thấy các câu trả lời như vậy, 15 liên kết sẽ được hiển thị trong kết quả tìm kiếm.

Trên thực tế, đây là tất cả những điều cơ bản về cách hoạt động của các thuật toán tìm kiếm. Để trang web hoạt động tốt, cần phải điền vào trang web đó với nội dung chất lượng cao, nhiều thông tin và dễ đọc trong kết quả tìm kiếm.

Đề xuất: