1922 yếu tố xếp hạng SEO của yandex bị rò rỉ và Bài học làm SEO
Nội dung bài viết
- 1. Nhóm "Annotation - Chú thích"
- 2. Nhóm "Array - Mảng" - khá quan trọng
- 4. Nhóm "AuxBM25 - Mang tính location"
- 5. Nhóm BCLM
- 9 - Nhóm "Datetime"
- 10 - Nhóm DBM25
- 11 - Nhóm Domain - Tên miền
- 12 - Nhóm Dynamic
- 13 - NHóm ExactGroups
- 14 - Nhóm LegacyLR - Kế thừa LR
- 15 - Nhóm LegacyTR
- 16 - Nhóm LinkBM25
- 17 - Nhóm LinkForms
- 19 - Nhóm QI
Một cựu nhân viên bị cáo buộc đã làm rò rỉ kho lưu trữ mã nguồn Yandex. Đặc biệt là 1.922 yếu tố được các công cụ tìm kiếm sử dụng để xếp hạng các trang web trong kết quả tìm kiếm.
Tại sao chúng tôi quan tâm. Vụ rò rỉ này đã tiết lộ 1.922 yếu tố xếp hạng mà Yandex sử dụng trong thuật toán tìm kiếm của mình, ít nhất là vào tháng 7 năm 2022. Có lẽ Martin MacDonald đã nói điều đó tốt nhất trên Twitter ngày hôm nay: “Vụ hack Yandex có lẽ là điều thú vị nhất đã xảy ra trong lĩnh vực SEO trong nhiều năm”.
Yandex không phải là Google. Nếu bạn định đọc danh sách đầy đủ các yếu tố xếp hạng của Yandex, hãy nhớ rằng Yandex không phải là Google. Nếu bạn thấy một yếu tố xếp hạng được liệt kê bởi Yandex, điều đó không có nghĩa là Google cung cấp cho tín hiệu đó cùng mức độ quan trọng. Trên thực tế, Google có thể không sử dụng tất cả 1.922 yếu tố được liệt kê. Trên thực tế, nhiều yếu tố trong rò rỉ này không được dùng nữa hoặc không được sử dụng.
Điều đó nói rằng, rất nhiều yếu tố xếp hạng này có thể khá giống với các tín hiệu mà Google sử dụng để tìm kiếm. Vì vậy, việc xem xét tài liệu này có thể cung cấp một số thông tin chi tiết hữu ích để giúp bạn hiểu rõ hơn về cách thức hoạt động của các công cụ tìm kiếm, chẳng hạn như Google, từ quan điểm công nghệ.
Bức tranh lớn hơn. Đoạn mã này xuất hiện dưới dạng Torrent trên một diễn đàn hack phổ biến, theo báo cáo của Bleeping Computer :
…kẻ rò rỉ đã đăng một liên kết nam châm mà họ tuyên bố là 'nguồn git Yandex' bao gồm 44,7 GB tệp bị đánh cắp khỏi công ty vào tháng 7 năm 2022. Các kho lưu trữ mã này được cho là chứa tất cả mã nguồn của công ty bên cạnh các quy tắc chống thư rác.
Yandex gọi đó là rò rỉ. Vì đoạn mã này xuất hiện trên một diễn đàn hack phổ biến, nên ban đầu người ta cho rằng Yandex đã bị hack. Yandex đã phủ nhận điều này và đưa ra tuyên bố sau:
“Yandex không bị hack. Dịch vụ bảo mật của chúng tôi đã tìm thấy các đoạn mã từ kho lưu trữ nội bộ trong miền công cộng, nhưng nội dung khác với phiên bản hiện tại của kho lưu trữ được sử dụng trong các dịch vụ Yandex.
Kho lưu trữ là một công cụ để lưu trữ và làm việc với mã. Hầu hết các công ty đều sử dụng mã theo cách này trong nội bộ.
Kho lưu trữ là cần thiết để làm việc với mã và không dành cho việc lưu trữ dữ liệu người dùng cá nhân. Chúng tôi đang tiến hành một cuộc điều tra nội bộ về lý do phát hành các đoạn mã nguồn ra công chúng, nhưng chúng tôi không thấy bất kỳ mối đe dọa nào đối với dữ liệu người dùng hoặc hiệu suất của nền tảng.”
Đào sâu hơn. Bạn có thể tìm thêm thông tin về vụ rò rỉ trên Techmeme .
Danh sách các yếu tố xếp hạng Yandex. MacDonald đã chia sẻ danh sách đầy đủ 1.922 yếu tố ở đây trên Web Marketing School. Tôi thực sự khuyên bạn nên tải xuống vì tôi hoàn toàn mong đợi Yandex sẽ cố gắng xóa thông tin này khỏi internet. (Ghi chú của biên tập viên: Trong phiên bản trước của bài viết này, chúng tôi đã liên kết với một phiên bản đã dịch trên Dropbox, nhưng liên kết đó đã nhanh chóng biến mất.)
Phân tích sớm các yếu tố xếp hạng. Alex Buraks đã tạo hai chủ đề Twitter – chủ đề đầu tiên , chủ đề thứ hai – phân tích các yếu tố xếp hạng khác nhau. Có một chủ đề Twitter thú vị khác ở đây từ Michael King.
Dan Taylor cũng chia sẻ một số phát hiện trong Rò rỉ dữ liệu Yandex: Chúng tôi đã học được gì về thuật toán tìm kiếm trên Tin tức tìm kiếm của Nga.
Nhiều yếu tố xếp hạng của Yandex là những gì bạn muốn thấy:
- PageRank và nhiều yếu tố liên quan đến liên kết (ví dụ: độ tuổi, mức độ liên quan, v.v.).
- Sự liên quan của văn bản.
- Tuổi nội dung và sự tươi mới.
- Tín hiệu hành vi của người dùng cuối.
- Độ tin cậy của máy chủ.
- Một số trang web được ưu tiên (ví dụ: Wikipedia).
Một số yếu tố xếp hạng mà các SEOer thấy đáng ngạc nhiên: số lượng khách truy cập duy nhất, phần trăm lưu lượng truy cập không phải trả tiền và xếp hạng tên miền trung bình trên các truy vấn.
Và như Taylor đã chỉ ra, 244 trong số các yếu tố xếp hạng được phân loại là không sử dụng và 988 yếu tố không được dùng nữa, “có nghĩa là 64% tài liệu không được sử dụng tích cực hoặc đã được thay thế – vì vậy, nó giống như ~690 yếu tố xếp hạng tiềm năng và một rất nhiều trong số chúng chứa những mô tả sơ sài.
Trình khám phá yếu tố xếp hạng tìm kiếm Yandex . Rob Ousbey đã tạo Yandex Search Ranking Factor Explorer , một công cụ để tìm kiếm các yếu tố xếp hạng khác nhau.
Đào sâu hơn. Michael King đã đi sâu vào mã trong Yandex, thu thập thông tin về Google và các bài học SEO khác từ vụ rò rỉ mã nguồn tại đây trên Search Engine Land. Hóa ra thực tế có 17.854 yếu tố xếp hạng chứ không phải 1.922. Một số khám phá bổ sung: trọng số ban đầu của các yếu tố xếp hạng, 5 yếu tố xếp hạng ban đầu có trọng số tiêu cực và tích cực hàng đầu, các yếu tố liên kết và mức độ ưu tiên, v.v.
1. Nhóm "Annotation - Chú thích"
Lưu ý các chú thích từ bài hát, tài liệu, bình luận
ID | Name | Mô tả |
667 | NHopTextBclmWeighted | Bclm (có trọng số) dựa trên lời bài hát từ hoa bia. |
762 | QUBm15Weighted | Trọng số BM15 cho một truy vấn theo chỉ mục tài liệu - một danh sách các truy vấn được chuyển đến. |
772 | Bclmf | BCLM cho chỉ mục Chú thích, văn bản tài liệu và liên kết. |
796 | NHopTextBclmPlane | Bclm (máy bay) dựa trên lời bài hát từ hoa bia. |
896 | CorrectedCtrAnnotationMatchPrediction | Đã sửa yếu tố CtrReg trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
897 | CorrectedCtrQueryMatchPrediction | Đã sửa yếu tố CtrReg trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
898 | CorrectedCtrValueWcmAvg | Đã sửa yếu tố CtrReg trong chỉ mục chú thích, yếu tố ValueWcmAvg |
899 | CorrectedCtrBm15V4K5 | Đã sửa yếu tố CtrReg trong chỉ mục chú thích, yếu tố Bm15V4K5 |
904 | SamplePeriodDayFrcQueryMatchPrediction | Yếu tố SamplePeriodDayFrc trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
905 | SamplePeriodDayFrcAnnotationMatchPrediction | Yếu tố SamplePeriodDayFrc trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
906 | OneClickQueryMatchPrediction | Yếu tố OneClick trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
907 | OneClickAnnotationMatchPrediction | Yếu tố OneClick trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
908 | OneClickBm15AK4 | Yếu tố OneClick trong chỉ mục chú thích, yếu tố Bm15AK4 |
909 | OneClickBocmWeightedW1K3 | Yếu tố OneClick trong chỉ mục chú thích, yếu tố BocmWeightedW1K3 |
910 | LongClickQueryMatchPrediction | Yếu tố LongClick trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
911 | LongClickAnnotationMatchPrediction | Yếu tố LongClick trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
912 | LongClickBm15AK4 | Hệ số LongClick trong chỉ mục chú thích, hệ số Bm15AK4 |
913 | LongClickBocmWeightedW1K3 | Hệ số LongClick trong chỉ mục chú thích, hệ số BocmWeightedW1K3 |
914 | SplitDwellTimeQueryMatchPrediction | Yếu tố SplitDwellTime trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
915 | SplitDwellTimeAnnotationMatchPrediction | Yếu tố SplitDwellTime trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
916 | BQPRQueryMatchPrediction | Yếu tố BQPR trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
917 | BQPRAnnotationMatchPrediction | Yếu tố BQPR trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
918 | YabarVisitsQueryMatchPrediction | Yếu tố YabarVisits trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
919 | YabarVisitsAnnotationMatchPrediction | Yếu tố YabarVisits trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
920 | YabarTimeQueryMatchPrediction | Yếu tố YabarTime trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
921 | YabarTimeAnnotationMatchPrediction | Yếu tố YabarTime trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
922 | SimpleClickQueryMatchPrediction | Yếu tố SimpleClick trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
923 | SimpleClickAnnotationMatchPrediction | Yếu tố SimpleClick trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
924 | LongClickBocmPlain | Yếu tố LongClick trong chỉ mục chú thích, yếu tố BocmPlain |
925 | RandomLogDBM35XfactorFullMatchPrediction | Kết quả lọc cộng tác cho yếu tố FI_DBM35 từ nhật ký ngẫu nhiên trong chỉ mục chú thích, yếu tố FullMatchPrediction |
926 | RandomLogDBM35XfactorAnnotationMatchPrediction | Kết quả lọc cộng tác cho yếu tố FI_DBM35 từ nhật ký ngẫu nhiên trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
927 | OneClickSynonymMatchPrediction | Yếu tố OneClick trong chỉ mục chú thích, yếu tố SynonymMatchPrediction |
928 | OneClickFullMatchPrediction | Yếu tố OneClick trong chỉ mục chú thích, yếu tố FullMatchPrediction |
929 | OneClickValueWcmAvg | Yếu tố OneClick trong chỉ mục chú thích, yếu tố ValueWcmAvg |
930 | OneClickBocmWeightedMaxK1 | Yếu tố OneClick trong chỉ mục chú thích, yếu tố BocmWeightedMaxK1 |
931 | OneClickBm15StrictK2 | Yếu tố OneClick trong chỉ mục chú thích, yếu tố Bm15StrictK2 |
932 | OneClickBm15MaxK3 | Yếu tố OneClick trong chỉ mục chú thích, yếu tố Bm15MaxK3 |
933 | OneClickBclmPlainW1K3 | Yếu tố OneClick trong chỉ mục chú thích, yếu tố BclmPlainW1K3 |
934 | OneClickValueWcmMax | Yếu tố OneClick trong chỉ mục chú thích, yếu tố ValueWcmMax |
935 | OneClickValueWcmPrediction | Yếu tố OneClick trong chỉ mục chú thích, yếu tố ValueWcmPrediction |
936 | OneClickBclmWeightedK3 | Yếu tố OneClick trong chỉ mục chú thích, yếu tố BclmWeightedK3 |
937 | BQPRBocmWeightedW1K3 | Yếu tố BQPR trong chỉ mục chú thích, yếu tố BocmWeightedW1K3 |
938 | BQPRBm15StrictK2 | Yếu tố BQPR trong chỉ mục chú thích, yếu tố Bm15StrictK2 |
939 | SplitDwellTimeBocmWeightedMaxK1 | Yếu tố SplitDwellTime trong chỉ mục chú thích, yếu tố BocmWeightedMaxK1 |
940 | SplitDwellTimeFullMatchPrediction | Yếu tố SplitDwellTime trong chỉ mục chú thích, yếu tố FullMatchPrediction |
941 | SplitDwellTimeValueWcmAvg | Yếu tố SplitDwellTime trong chỉ mục chú thích, yếu tố ValueWcmAvg |
942 | CorrectedCtrBm15StrictK2 | Đã sửa yếu tố CtrReg trong chỉ mục chú thích, yếu tố Bm15StrictK2 |
945 | RandomLogDBM35XfactorValueWcmMax | Kết quả lọc cộng tác cho yếu tố FI_DBM35 từ nhật ký ngẫu nhiên trong chỉ mục chú thích, yếu tố ValueWcmMax |
946 | RandomLogDBM35XfactorValueWcmAvg | Kết quả lọc cộng tác cho yếu tố FI_DBM35 từ nhật ký ngẫu nhiên trong chỉ mục chú thích, yếu tố ValueWcmAvg |
947 | RandomLogDBM35XfactorBm15StrictK2 | Kết quả lọc cộng tác cho yếu tố FI_DBM35 từ chỉ mục chú thích đăng nhập ngẫu nhiên, yếu tố Bm15StrictK2 |
948 | RandomLogDBM35XfactorBclmPlainW1K3 | Kết quả lọc cộng tác cho yếu tố FI_DBM35 từ chỉ mục chú thích đăng nhập ngẫu nhiên, yếu tố BclmPlainW1K3 |
949 | RandomLogDBM35XfactorBclmWeightedK3 | Kết quả lọc cộng tác cho yếu tố FI_DBM35 từ chỉ mục chú thích đăng nhập ngẫu nhiên, yếu tố BclmWeightedK3 |
950 | RandomLogDBM35XfactorBocmWeightedW1K3 | Kết quả lọc cộng tác cho yếu tố FI_DBM35 từ chỉ mục chú thích đăng nhập ngẫu nhiên, yếu tố BocmWeightedW1K3 |
951 | CorrectedCtrXfactorAnnotationMatchPrediction | Đã sửa lỗi CtrXfactor trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
952 | CorrectedCtrXfactorQueryMatchPrediction | Đã sửa CtrXfactor trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
953 | CorrectedCtrXfactorValueWcmMax | Đã sửa lỗi CtrXfactor trong chỉ mục chú thích, hệ số ValueWcmMax |
954 | CorrectedCtrXfactorValueWcmAvg | Đã sửa lỗi CtrXfactor trong chỉ mục chú thích, hệ số ValueWcmAvg |
955 | CorrectedCtrXfactorBocmWeightedW1K3 | Đã sửa lỗi CtrXfactor trong chỉ mục chú thích, hệ số BocmWeightedW1K3 |
956 | CorrectedCtrXfactorBclmPlainK3 | Đã sửa lỗi CtrXfactor trong chỉ mục chú thích, yếu tố BclmPlainK3 |
957 | CorrectedCtrXfactorBclmMixPlainW1K1 | Đã sửa lỗi CtrXfactor trong chỉ mục chú thích, yếu tố BclmMixPlainW1K1 |
960 | SamplePeriodDayFrcValueWcmAvg | Yếu tố SamplePeriodDayFrc trong chỉ mục chú thích, yếu tố ValueWcmAvg |
961 | SamplePeriodDayFrcBm15MaxK3 | Yếu tố SamplePeriodDayFrc trong chỉ mục chú thích, yếu tố Bm15MaxK3 |
962 | SamplePeriodDayFrcBocmWeightedK3 | Yếu tố SamplePeriodDayFrc trong chỉ mục chú thích, yếu tố BocmWeightedK3 |
963 | SamplePeriodDayFrcBocmDoubleK5 | Yếu tố SamplePeriodDayFrc trong chỉ mục chú thích, yếu tố BocmDoubleK5 |
964 | SplitDwellTimeBm15MaxK3 | Hệ số SplitDwellTime trong chỉ mục chú thích, hệ số Bm15MaxK3 |
965 | SimpleClickBclmWeightedK3 | Hệ số SimpleClick trong chỉ mục chú thích, hệ số BclmWeightedK3 |
968 | PopularSEFRCBrowserAnnotationMatchPrediction | Phổ biếnSEFRCByếu tố trình duyệt trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
969 | PopularSEFRCBrowserSynonymMatchPrediction | Phổ biếnSEFRCCByếu tố trình duyệt trong chỉ mục chú thích, yếu tố SynonymMatchPrediction |
970 | PopularSEFRCBrowserValueWcmPrediction | Phổ biếnSEFRCByếu tố trình duyệt trong chỉ mục chú thích, yếu tố ValueWcmPrediction |
971 | PopularSEFRCBrowserBclmWeightedV2K3 | Phổ biếnSEFRCCBnhân tố trình duyệt trong chỉ mục chú thích, nhân tố BclmWeightedV2K3 |
972 | PopularSEFRCBrowserBclmMixPlainW1K1 | Phổ biếnSEFRCCByếu tố trình duyệt trong chỉ mục chú thích, yếu tố BclmMixPlainW1K1 |
974 | OneClickAnnotationMatchPredictionWeighted | Yếu tố OneClick trong chỉ mục chú thích, AnnotationMatchPredictionYếu tố có trọng số |
975 | LongClickAnnotationMatchPredictionWeighted | Hệ số LongClick trong chỉ mục chú thích, Hệ số AnnotationMatchPredictionWeighted |
976 | YabarTimeAnnotationMatchPredictionWeighted | Yếu tố YabarTime trong chỉ mục chú thích, AnnotationMatchPredictionYếu tố có trọng số |
978 | LongClickSPAnnotationMatchPrediction | Yếu tố LongClickSamplePeriod trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
979 | LongClickSPQueryMatchPrediction | Yếu tố LongClickSamplePeriod trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
980 | LongClickSPValueWcmAvg | Yếu tố LongClickSamplePeriod trong chỉ mục chú thích, yếu tố ValueWcmAvg |
981 | LongClickSPValueWcmPrediction | Yếu tố LongClickSamplePeriod trong chỉ mục chú thích, yếu tố ValueWcmPrediction |
982 | LongClickSPBclmPlainW1K3 | Yếu tố LongClickSamplePeriod trong chỉ mục chú thích, yếu tố BclmPlainW1K3 |
983 | LongClickSPBclmWeightedK3 | Hệ số LongClickSamplePeriod trong chỉ mục chú thích, hệ số BclmWeightedK3 |
984 | LongClickSPBocmWeightedW1K3 | Hệ số LongClickSamplePeriod trong chỉ mục chú thích, hệ số BocmWeightedW1K3 |
985 | LongClickSPBclmPlainK5 | Hệ số LongClickSamplePeriod trong chỉ mục chú thích, hệ số BclmPlainK5 |
986 | LongClickSPBclmWeightedV2K3 | Hệ số LongClickSamplePeriod trong chỉ mục chú thích, hệ số BclmWeightedV2K3 |
987 | LongClickSPBocmDoubleK5 | Yếu tố LongClickSamplePeriod trong chỉ mục chú thích, yếu tố BocmDoubleK5 |
988 | LongClickSPBm15StrictK2 | Hệ số LongClickSamplePeriod trong chỉ mục chú thích, hệ số Bm15StrictK2 |
991 | BQPRSampleWcmCoverageMax | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. Yếu tố WcmCoverageMax |
992 | BQPRSampleFullMatchPrediction | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. FullMatchHệ số dự đoán |
993 | BQPRSampleAnnotationMatchPredictionWeighted | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. Factor AnnotationMatchPredictionTrọng số |
994 | BQPRSampleValuePcmAvg | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. Giá trị nhân tốPcmAvg |
995 | BQPRSampleValueWcmAvg | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. Giá trị nhân tốWcmAvg |
996 | BQPRSampleBm15V4K8 | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. Yếu tố Bm15V4K8 |
997 | BQPRSampleBocmWeightedV4K8 | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. Yếu tố BocmWeightedV4K8 |
998 | BQPRSampleWcmMax | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. MẫuWcmMax Factor |
999 | BQPRSampleSynonymMatchPrediction | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. Từ đồng nghĩaMatchPrediction Factor |
1000 | BQPRSampleAnnotationMatchPrediction | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. AnnotationMatchPrediction yếu tố |
1001 | BQPRSampleSuffixMatchCount | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. SuffixMatchCount Factor |
1002 | BQPRSampleWcmCoveragePrediction | BQPR trong khoảng thời gian được lấy mẫu. Chỉ số chú thích. WcmCoverageYếu tố dự đoán |
1003 | DoubleFrcFullMatchPrediction | DoubleFrc trong chỉ mục chú thích, hệ số FullMatchPrediction |
1004 | DoubleFrcSynonymMatchPrediction | DoubleFrc trong chỉ mục chú thích, hệ số SynonymMatchPrediction |
1005 | DoubleFrcAnnotationMatchPrediction | DoubleFrc trong chỉ mục chú thích, yếu tố AnnotationMatchPrediction |
1006 | DoubleFrcAnnotationMatchPredictionWeighted | DoubleFrc trong chỉ mục chú thích, yếu tố AnnotationMatchPredictionWeighted |
1007 | DoubleFrcQueryMatchPrediction | DoubleFrc trong chỉ mục chú thích, yếu tố QueryMatchPrediction |
1008 | DoubleFrcValueWcmAvg | DoubleFrc trong chỉ mục chú thích, hệ số ValueWcmAvg |
1009 | DoubleFrcBocmWeightedMaxK1 | DoubleFrc trong chỉ mục chú thích, hệ số BocmWeightedMaxK1 |
1010 | DoubleFrcBm15V4K5 | DoubleFrc trong chỉ mục chú thích, yếu tố Bm15V4K5 |
1011 | DoubleFrcBocmWeightedV4K5 | DoubleFrc trong chỉ mục chú thích, hệ số BocmWeightedV4K5 |
1012 | DoubleFrcBocmDoubleK1 | DoubleFrc trong chỉ mục chú thích, hệ số BocmDoubleK1 |
1048 | OneClickFrcXfSpFullMatchPrediction | OneClickFrc được tính theo khoảng thời gian được lấy mẫu và cộng tác mở rộng, hệ số FullMatchPrediction |
1049 | OneClickFrcXfSpAnnotationMatchPredictionWeighted | OneClickFrc được tính toán từ khoảng thời gian lấy mẫu và cộng tác mở rộng, AnnotationMatchPredictionYếu tố có trọng số |
1050 | OneClickFrcXfSpValueWcmAvg | OneClickFrc được tính theo khoảng thời gian được lấy mẫu và cộng tác mở rộng, hệ số ValueWcmAvg |
1051 | OneClickFrcXfSpWcmMax | OneClickFrc được tính từ khoảng thời gian được lấy mẫu và cộng tác mở rộng, hệ số WcmMax |
1052 | OneClickFrcXfSpWcmCoveragePrediction | OneClickFrc được tính toán theo khoảng thời gian lấy mẫu và cộng tác mở rộng, hệ số WcmCoveragePrediction |
1053 | OneClickFrcXfSpWcmCoverageMax | OneClickFrc được tính theo khoảng thời gian được lấy mẫu và cộng tác mở rộng, hệ số WcmCoverageMax |
1054 | OneClickFrcXfSpPcmMax | OneClickFrc được tính toán từ khoảng thời gian lấy mẫu và cộng tác mở rộng, hệ số PcmMax |
1055 | OneClickFrcXfSpPrefixMatchCount | OneClickFrc được tính theo khoảng thời gian được lấy mẫu và cộng tác mở rộng, hệ số PrefixMatchCount |
1056 | OneClickFrcXfSpSuffixMatchCount | OneClickFrc được tính theo khoảng thời gian được lấy mẫu và cộng tác mở rộng, hệ số SuffixMatchCount |
1057 | OneClickFrcXfSpBm15V0W1K1 | OneClickFrc được tính từ khoảng thời gian được lấy mẫu và cộng tác mở rộng, hệ số Bm15V0W1K1 |
1067 | QueryDwellTimeFullMatchPrediction | Truy vấnDwellTime, hệ số FullMatchPrediction |
1068 | QueryDwellTimeSynonymMatchPrediction | QueryDwellTime, фактор SynonymMatchPrediction |
1069 | QueryDwellTimeAnnotationMatchPrediction | Yếu tố QueryDwellTime, AnnotationMatchPrediction |
1070 | QueryDwellTimeAnnotationMatchPredictionWeighted | QueryDwellTime, фактор AnnotationMatchPredictionWeighted |
1071 | QueryDwellTimeQueryMatchPrediction | QueryDwellTime, фактор QueryMatchPrediction |
1072 | QueryDwellTimeValueWcmAvg | QueryDwellTime, hệ số ValueWcmAvg |
1073 | QueryDwellTimeBclmPlainW1K3 | QueryDwellTime, hệ số BclmPlainW1K3 |
1074 | QueryDwellTimeBm15CoverageV4K3 | QueryDwellTime, hệ số Bm15CoverageV4K3 |
1075 | QueryDwellTimeBclmPlainK4 | QueryDwellTime, yếu tố BclmPlainK4 |
1076 | QueryDwellTimeBocmWeightedV4K5 | QueryDwellTime, hệ số BocmWeightedV4K5 |
1499 | VpcgCorrectedClicksSLPPerWordCMMaxPredictionMin | kết quả vpcg trong một thời gian dài, dữ liệu: CorrectedClicks. FullMatchHệ số dự đoán |
1500 | VpcgCorrectedClicksSLPAllWcmMatch95AvgValue | kết quả vpcg trong một thời gian dài, dữ liệu: CorrectedClicks. Yếu tố AllWcmMatch95AvgValue |
1501 | VpcgCorrectedClicksSLPCMMatchTop5AvgValue | kết quả vpcg trong một thời gian dài, dữ liệu: CorrectedClicks. Hệ số CMMatchTop5AvgValue |
1502 | VpcgCorrectedClicksSLPAnnotationMaxValueWeighted | kết quả vpcg trong một thời gian dài, dữ liệu: CorrectedClicks. Yếu tố AnnotationMaxValueWeighted |
1503 | VpcgCorrectedClicksSLPMixMatchWeightedValue | kết quả vpcg trong một thời gian dài, dữ liệu: CorrectedClicks. MixMatchWeightedValue yếu tố |
1504 | VpcgCorrectedClicksSLPCMMatchTop5AvgPrediction | kết quả vpcg trong một thời gian dài, dữ liệu: CorrectedClicks. CMMatchTop5AvgYếu tố dự đoán |
2. Nhóm "Array - Mảng" - khá quan trọng
Ưu tiên văn bản liên kết chính xác, văn bản liên kết có chứa, liên kết chứ từ đông nghĩa
STT | Name | Mô tả |
48 | LinkBM25 | BM25 đơn giản bởi các liên kết, trọng số liên kết không được tính đến. |
304 | LnkBm25Ex | BM25 đơn giản ở dạng chính xác trong văn bản liên kết |
307 | LnkBm25Sy | BM25 đơn giản trên các liên kết có từ đồng nghĩa |
393 | XLR_W1 | Tương tự của các yếu tố cùng tên, trọng lượng từ = 1 |
504 | InlinksModel | Mô hình xác suất được xây dựng trên văn bản của các liên kết đến |
3. Nhóm BestForm
STT | Name | Mô tả |
92 | BFexact | Có một dạng chính xác của tất cả các từ truy vấn trong văn bản/liên kết |
93 | BFlemma | Có một bổ đề của tất cả các từ truy vấn trong văn bản/liên kết |
189 | BFexactAll | Các biến thể của các yếu tố liên quan khi xem xét các từ dừng |
190 | BFlemmaAll | Các biến thể của các yếu tố liên quan khi xem xét các từ dừng |
4. Nhóm "AuxBM25 - Mang tính location"
Ưu tiên bản địa hóa
STT | Name | Mô tả |
269 | AuxTextBM25 | BM25 theo khu vực của người dùng đối với các yêu cầu có thể bản địa hóa, đối với các yêu cầu không thể bản địa hóa ở KUB - quốc gia. Có thể xem văn bản của các yêu cầu được gửi cho các khu vực trong relev_regions.txt trong sorcerer |
270 | AuxLinkBM25 | Tương tự cho mức độ liên quan của liên kết |
530 | AuxCTextBM25 | sử dụng 'cây phụ trợ quốc gia' (auxqc) |
531 | AuxCLinkBM25 | sử dụng 'cây phụ trợ quốc gia' (auxqc) |
771 | AuxTitleBM25 | Nó được coi là TextBM25 trong tiêu đề theo văn bản tên của khu vực của người dùng - tương tự như yếu tố 268. |
5. Nhóm BCLM
STT | Name | Mô tả |
523 | BclmLite | . Trong trường hợp này, khoảng cách giữa các từ chỉ được tính đến trong câu."}">Sửa đổi hệ số Bclm2, nhẹ để sử dụng trong fastrank. Sự khác biệt chính là BclmLite không sử dụng hiệu số từ tuyệt đối ngay từ đầu tài liệu. Thay vào đó, hệ số hoạt động với các vị trí thông thường có dạng |
6. Nhóm Bocm
Ưu tiên vị trí từ khóa trong tài liệu, càng top càng tốt.
STT | Name | Mô tả |
669 | Bocm | Đánh giá xem vị trí từ trong câu tài liệu có tương ứng với vị trí từ trong truy vấn hay không. |
7. Nhóm CombinedAbs
- Phải có kích thước tối thiểu
- Từ khóa xuất hiện nhiều nơi nhưng ko được quá gần nhau
- Từ khóa không ở phần đầu tài liệu sẽ không tối ưu
STT | Name | Mô tả |
493 | YmwFull | Kích thước của đoạn văn bản tối thiểu bao gồm tất cả các từ truy vấn trong tài liệu. Hiện tại không được sử dụng. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YMW thêm)) |
494 | Bclm | Yếu tố tên Buettcher, Clarke và Lushman (đã sửa đổi) |
514 | Mpsa | Ước tính khoảng cách tối thiểu giữa các cặp từ truy vấn, có tính đến khoảng cách của cặp từ đầu tài liệu (Kích thước cặp tối thiểu có suy giảm). Các cặp được hiểu là tất cả các biggram liên tiếp của các từ truy vấn. Do đó, số cặp bằng với số từ trong truy vấn, trừ đi 1. Theo đó, hệ số có ý nghĩa đối với các truy vấn bao gồm nhiều hơn một từ. TekushhieKomponenty/MPSA MPSA)) |
515 | Bclm2 | Khác với BCLm ở chỗ trọng số của tất cả các từ được coi là như nhau. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/BCLm2 BCLm2)) |
516 | AbsolutePLM | Mức độ liên quan của văn bản dựa trên mô hình ngôn ngữ, có tính đến vị trí tuyệt đối. Chúng tôi xem qua văn bản với một cửa sổ gồm 20 từ, xây dựng mô hình ngôn ngữ cho mỗi cửa sổ (nghĩa là phân phối xác suất trên các từ của tiếng Nga) và tính xác suất tạo truy vấn. Đối với việc xóa khỏi phần đầu của tài liệu, chúng tôi sẽ phạt mô hình. |
528 | YmwFull2 | Đã sửa lỗi YmwFull. Nó chỉ khác với phiên bản trước ở hành vi đối với các truy vấn 2 từ. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YMW thêm)) |
535 | QueryWordCohesionTR | Hệ số đánh giá cách các từ truy vấn được nhóm lại với nhau trong phần nội dung của tài liệu mà không quan tâm đến thứ tự của chúng. ((http://wiki.yandex-team.ru/SergejjKrylov/QueryWordCohesionTR mô tả)) |
562 | FiltrationSegments | Tỷ lệ phần trăm các phân đoạn truy vấn có trong văn bản |
622 | SmallWindow | Tổng trọng số tối đa của các từ truy vấn trong một cửa sổ 50 từ |
697 | BclmMax | Sự gần gũi của các từ truy vấn với từ nặng nhất. |
704 | DBM15Wares | |
714 | DBM15Wares2 | |
735 | SmallWindowAttenuation | |
866 | SmallWindowAttenuationQ | |
1471 | NoApproxSmallWindowAttenuation | |
1472 | NoApproxSmallWindowAttenuationQ |
8 - Nhóm CombinedSequences
181 | ExactWordOrderLen | Độ dài khớp tối đa của các biểu mẫu trong văn bản và truy vấn |
182 | ExactWordOrderWeight | Trọng số của sự phù hợp tối đa của các biểu mẫu trong văn bản và truy vấn |
183 | WordOrderLen | Độ dài của khớp tối đa theo bổ đề trong văn bản và truy vấn |
184 | WordOrderWeight | Trọng số của trận đấu tối đa theo bổ đề trong văn bản và truy vấn |
298 | JokerLen | Chúng tôi đếm các tính năng văn bản, giả sử rằng tiêu đề của trang được gán cho từng câu của nó, tức là khoảng cách giữa từ từ tiêu đề và bất kỳ từ nào khác là 1 câu. Len là tỷ lệ tối đa của các từ từ truy vấn được tìm thấy trong một số câu của văn bản (với tiêu đề được chỉ định) liên quan đến độ dài của truy vấn. Ví dụ [Kharms Circus Vertunov] cho ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fwww.wikilivres.info%2Fwiki%2F%25D0%25A6%25D0 %25B8%25D1%2580%25D0%25BA_%25D0%25A8%25D0%25B0%25D1%2580%25D0%25B4%25D0%25B0%25D0%25BC_%28%25D0%25A5%25D0%25B0%25D1%2580%25D0 %25BC%25D1%2581%29 của tài liệu này)) |
299 | JokerWeight | Tỷ lệ idf tổng của các từ gặp trong câu + tiêu đề cho tất cả các từ. |
300 | ExactJokerLen | Giống như JokerLen, ở dạng chính xác |
301 | ExactJokerWeight | Tương tự như JokerWeight, với hình dạng chính xác |
9 - Nhóm "Datetime"
STT | Name | Description |
346 | PageDate | Ngày của tài liệu được viết trên trang được ánh xạ lại bằng căn bậc hai |
381 | DaterAge | Sự khác biệt giữa ngày hiện tại và ngày của tài liệu được xác định bởi bộ dữ liệu, 1 - ngày của tài liệu bằng với ngày hiện tại, 0 - tài liệu từ 10 năm trở lên, Nếu ngày không được xác định, nó là 0 . Cảnh báo!((1 - DaterAge)*60)^2 = tuổi của trang tính theo ngày. |
443 | FirstValidTs10Days | Nó được tính bằng (10-x) trong đó x là số ngày trả lại chứng từ (liên tục) so với thời gian hiệu lực của chứng từ trong samovar |
451 | Timestamp | Được tính bằng (80 - x)/80, trong đó x là tuổi của tài liệu tính bằng giờ. Các yếu tố chỉ có ý nghĩa đối với cơ sở fastbot (80 giờ qua). Không được sử dụng trong xếp hạng. Được sử dụng trong sắp xếp lại. |
452 | AddTimeFull | Được tính bằng (80 - x)/80, trong đó x là tuổi của tài liệu tính bằng giờ. Các yếu tố chỉ có ý nghĩa đối với cơ sở fastbot (80 giờ qua). Không được sử dụng trong xếp hạng. Được sử dụng trong sắp xếp lại. |
1862 | DaterAddTime80Hours | Được tính là (80-x) trong đó x là tài liệu trả về tính theo giờ (liên tục). Sử dụng dữ liệu dữ liệu RobotAddTime |
1863 | DaterAddTime10Days | Được tính là (10-x) trong đó x là tuổi của tài liệu tính bằng ngày (liên tục). Sử dụng dữ liệu dữ liệu RobotAddTime |
1864 | DaterAge10Days | Sự khác biệt giữa ngày hiện tại và ngày của tài liệu được xác định bởi trình dữ liệu RobotAddTime, 1 — ngày bằng với ngày hiện tại, 0 — tài liệu đã được 10 ngày trở lên hoặc ngày không được xác định |
10 - Nhóm DBM25
Từ khóa phải liên kết với thông số kỹ thuật chuẩn, thậm chí đối tượng địa lý hoặc theo danh từ
STT | Name | Mô tả | Group |
534 | DBM25 | BM25, trong đó trọng lượng từ được khớp với máy | DBM25 |
564 | DBM25_2 | Biến thể của temu ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/DBM25 DBM25)), xem ysite/yandex/relevance/dbm25.cpp | DBM25 |
577 | DBM30Smerch | Biến thể của temu ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/DBM25 DBM25)), xem ysite/yandex/relevance/dbm25.cpp | DBM25 |
607 | DBM35 | BM25 theo văn bản và liên kết với thông số kỹ thuật. trọng số theo mức độ trùng hợp (dạng, bổ đề, từ đồng nghĩa) | DBM25 |
653 | DBM40 | Biến thể của temu ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/DBM25 DBM25)), xem ysite/yandex/relevance/dbm25.cpp | DBM25 |
655 | BM25_0 | Biến thể về chủ đề BM25 | DBM25 |
656 | BM25_1 | Biến thể về chủ đề BM25 | DBM25 |
657 | BM25_0123 | Biến thể về chủ đề BM25 | DBM25 |
663 | DBMNumbers | DBM riêng biệt bằng số | DBM25 |
664 | DBMGeo | DBM riêng theo yêu cầu đối tượng địa lý | DBM25 |
665 | DBMSubstantive | DBM riêng theo danh từ | DBM25 |
11 - Nhóm Domain - Tên miền
Ưu tiên từ khóa theo tên miền, và tỉ lệ nhập tên miền
193 | MaxWordHostRank | Xếp hạng máy chủ cho từ truy vấn rõ ràng nhất (thường là tên của trang web) |
194 | MaxWordHostClicks | Khả năng nhấp của domAttr cho từ được thể hiện tối đa. Ví dụ: đối với tất cả các truy vấn có chứa từ wikipedia, hãy nhấp vào các trang wikipedia. |
195 | DomPhraseRank | HostRank cho các từ riêng lẻ |
196 | DomPhraseClickRank | Tỷ lệ nhấp tên miền theo từ |
212 | DomPhraseYabar | Chuyển đổi sang trang web từ các công cụ tìm kiếm cho các từ riêng lẻ, theo thanh |
224 | MaxWordHostYaBar | Từ truy vấn đặc trưng nhất tương ứng với trang web, theo thanh |
225 | FirstWordHostClicks | Khả năng nhấp của máy chủ cho từ đầu tiên của truy vấn. Khá thường xuyên, từ đầu tiên (cuối cùng) của truy vấn là một dấu hiệu rõ ràng về trang web để tìm kiếm thông tin. |
628 | DomPhraseClickRankBi | Tỷ lệ nhấp vào tên miền theo bigram (không bao gồm tiện ích mở rộng truy vấn từ điển đồng nghĩa) |
629 | DomPhraseYabarBi | Chuyển tiếp đến trang web từ công cụ tìm kiếm bằng bigram, theo Bar (không bao gồm phần mở rộng truy vấn từ điển đồng nghĩa) |
630 | LastWordHostClicks | Lưu trữ CTR theo từ truy vấn cuối cùng (không bao gồm tiện ích mở rộng truy vấn từ điển đồng nghĩa) |
12 - Nhóm Dynamic
- Liên kết nên liên quan: đặc biệt chứa đầy đủ các truy vấn
- Xêp hạng máy chủ (Host)
- Xếp hạng nhấp vào tên miền
STT | Name | Mô tả |
3 | LR | liên kết liên quan. Yếu tố được ánh xạ lại. |
4 | PrBonus | Ưu tiên thưởng, ưu tiên 7 - ưu tiên văn bản. Yếu tố này là nhị phân, có giá trị 0 đối với tất cả các yêu cầu một từ và giá trị 1 đối với hầu hết tất cả các yêu cầu hai từ trở lên, ngoại trừ một số lượng rất nhỏ các câu trả lời mà không có một liên kết nào vượt qua đại biểu, và văn bản cũng không vượt qua đại biểu. |
7 | LRp1 | (nghiêm ngặt) có tất cả các từ truy vấn trong một liên kết. |
8 | LRp2 | (cụm từ) có tất cả các từ truy vấn liên tiếp trong một liên kết. |
27 | TRboost | Số mà một số yếu tố liên kết được nhân lên (cụ thể là các yếu tố số 6, 7, 47, 66), nếu mức độ liên quan của văn bản là 0 và có ít liên kết |
28 | TRLRlemma | Bổ đề trùng khớp về mặt văn bản. |
67 | LogLR | Logarit của LR được ánh xạ tuyến tính tới [0,1]. |
94 | SoftAndOk | Tài liệu đã thông qua phần mềm và về những hạn chế của thuật sĩ cú pháp. Chỉ dành cho các tài liệu có liên quan đến văn bản. Đối với truy vấn một từ, luôn luôn là 1. |
191 | PassageLegacyTR | TR của đoạn văn hay nhất - đoạn trích có thể có chất lượng cao như thế nào |
201 | LRWithStops | Trọng số của sự phù hợp tối đa của các biểu mẫu trong văn bản và truy vấn |
282 | LCor | Đặc trưng cho tần suất xuất hiện của các từ trong các liên kết. Yếu tố quan trọng nếu từ đóng vai trò liên quan đến liên kết là rất hiếm đối với các liên kết. |
284 | TRDocQuorum | Trọng lượng của các từ truy vấn trong văn bản |
285 | LRDocQuorum | Trọng số của các từ truy vấn trong các liên kết |
286 | TRLRDocQuorum | Trọng lượng của các từ truy vấn trong văn bản và liên kết |
295 | UrlDomainFraction | Phạm vi bảo hiểm tên miền với ba chữ cái từ truy vấn. (Xổ số Chelyabinsk - chelloto. Chúng tôi dịch yêu cầu sang phiên âm, chúng tôi tìm ba chữ cái được che (che, hel, lot, olo), chúng tôi xem phần nào của cả ba chữ cái chúng tôi đã đề cập) |
529 | FullQuorum | Yếu tố nhị phân, mỗi từ của truy vấn nằm trong văn bản hoặc trong các liên kết |
552 | IdfVariance | Phương sai IDF của các từ truy vấn tùy thuộc vào lần truy cập văn bản trong tài liệu (yếu tố văn bản truy vấn hỗn hợp) |
638 | SynSetLinkBM25 | Một bản sao của yếu tố LinkBM25 cho ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Synset của synsets)). |
725 | UrlDomainSimilarityFixed | |
1066 | FullUrlFraction | Bảo hiểm URL với bát quái từ yêu cầu. Một dạng tương tự của các yếu tố UrlDomainFraction, UrlPathAndParamsFraction. |
1272 | UrlHostFraction | Bản sao của phiên bản cũ No.294 yếu tố. Chỉ được thêm vào để sử dụng trên giai đoạn L3. Phạm vi bảo hiểm tên miền với ba chữ cái từ truy vấn. (Xổ số Chelyabinsk - chelloto. Chúng tôi dịch yêu cầu sang phiên âm, tìm các chữ cái có ba chữ cái được che (che, hel, lot, olo), xem phần nào của tất cả các chữ cái có ba chữ cái được che) |
13 - NHóm ExactGroups
STT | Name | Mô tả |
323 | Has2ExactQueryParts | Yêu cầu được bao phủ hoàn toàn bởi hai nhóm đối sánh chính xác bao gồm các từ truy vấn đối sánh chính xác liên tiếp ((http://wiki.yandex-team.ru/poiskovajaplatforma/tr/CoverageByGroups Giới thiệu về phạm vi nhóm)) |
324 | HasLevensht1QueryFragment | Có một nhóm từ khớp chính xác của truy vấn bao trùm truy vấn (có thể bỏ, thêm hoặc thay thế từ) |
325 | LargestSyInexactGroup | Phần truy vấn nằm trong nhóm dài nhất của bất kỳ lần truy cập nào (bao gồm cả dạng từ và từ đồng nghĩa). Có lẽ với một thiếu sót, bổ sung hoặc thay thế một từ |
14 - Nhóm LegacyLR - Kế thừa LR
STT | Name | Mô tả |
32 | LRHitNum100 | Số lượng từ truy vấn được chuyển đổi trong tất cả các liên kết của url. |
33 | LRHitNumGt16 | 20, số lần xuất hiện của từ truy vấn trong liên kết> 16, hệ số pro LR."}">Tài liệu có LR>20, số lần xuất hiện của từ truy vấn trong liên kết> 16, hệ số pro LR. |
34 | PctLinks | Đối với các tài liệu có LR cao - mức độ liên quan của liên kết được chuẩn hóa mà không có khoảng cách gần, đối với các tài liệu có LR thấp 0 |
35 | HasLR | Url cao LR. |
63 | HasNoLR | Tài liệu không có LR. |
187 | LRp1All | Các biến thể của các yếu tố liên quan khi xem xét các từ dừng |
414 | LRWithoutRare | liên kết liên quan loại trừ các từ hiếm |
15 - Nhóm LegacyTR
2 | TR | Mức độ liên quan của văn bản (maxfreq là tần số xuất hiện của từ thường xuyên nhất, nghĩa là độ dài của tài liệu). |
5 | TRp1 | Ưu tiên nghiêm ngặt cho TR là ưu tiên văn bản - có tất cả các từ truy vấn ở đâu đó trong tài liệu (ví dụ: trong khi chúng vượt qua các giới hạn ngữ cảnh truy vấn, cả hai từ phải nằm trong cùng một câu). |
6 | TRp2 | Ưu tiên cụm từ cho TR là ưu tiên văn bản - có tất cả các từ truy vấn trong một hàng trong tài liệu. |
9 | TRtitle | Sự hiện diện của cụm từ chính xác (văn bản truy vấn) trong tiêu đề (chính xác hơn là trong câu đầu tiên của tài liệu). Giới hạn ngữ cảnh và từ dừng được tính đến chính xác như trong TRp2, tức là yếu tố[8] yếu tố phụ[5] |
10 | TRhr | Có một phân đoạn đã vượt qua đại biểu, trong đó tất cả các vị trí từ được chỉ định là có mức độ liên quan BEST_RELEV (tiêu đề hoặc từ khóa meta). |
17 | TRhitw | Hitweigt là một biến thể của mức độ phù hợp về mặt văn bản trong đó trọng số của tất cả các lần truy cập được coi là bằng nhau (nghĩa là chúng không tính đến giá trị bổ sung cho tiêu đề và mức độ gần gũi của từ). Trong trường hợp này, các lần truy cập tương ứng phải vượt qua các giới hạn của trình phù thủy cú pháp, tức là chúng ta có thể giả định rằng hệ số TRhitw bằng 0 khi và chỉ khi SoftAndOk bằng 0 |
26 | TRref | 3 thì được coi là 3). Con số này được ánh xạ vào khoảng [0,1)"}">Yếu tố về số lần tinh chỉnh. Ngôn ngữ truy vấn có một tính năng do người dùng tinh chỉnh ('một từ đứng trước dấu phần trăm'). Theo thiết kế, điều này có nghĩa là 'thật tuyệt nếu có một từ trong tài liệu'. Việc sử dụng có giá trị duy nhất được biết đến ((http://staff.yandex-team.ru/gulin Andrey Gulin)) của tính năng này là yêu cầu [%official %site Company Name]. Người dùng không biết tính năng này vì không được mô tả trong bất kỳ tài liệu nào. Theo kế hoạch, nó sẽ biến mất khỏi ngôn ngữ truy vấn, nhưng các từ có mức độ ưu tiên USER_REFINE sẽ vẫn còn trong trình hướng dẫn. Hệ số cho biết có bao nhiêu từ USER_REFINE tối đa được bắt gặp đồng thời trong một lần truy cập duy nhất trong đại biểu. Người ta tin rằng có từ 0 đến 3 (nếu > 3 thì được coi là 3). Con số này được ánh xạ vào khoảng [0,1) |
40 | TRUnmapped | TR chia cho khối lập phương của số lượng từ trong truy vấn và được chuyển đổi bởi ánh xạ lại TR tiêu chuẩn. |
62 | HasNoTR | Tài liệu không có TR. |
186 | TRp1All | Các biến thể của các yếu tố liên quan khi xem xét các từ dừng |
200 | TRWithStops | Trọng số của sự phù hợp tối đa của các biểu mẫu trong văn bản và truy vấn |
392 | TR_W1 | Tương tự của các yếu tố cùng tên, trọng lượng từ = 1 |
16 - Nhóm LinkBM25
STT | Name | Mô tả |
55 | LnkPair | Tương tự như TxtPair, nhưng đối với các liên kết; Trọng số liên kết không được tính đến. |
142 | NumWordsLR | tỷ lệ phần trăm của các từ truy vấn trong các liên kết (tối đa một từ đồng nghĩa) |
143 | HasAllWordsLR | các liên kết chứa tất cả các từ của truy vấn (tối đa một từ đồng nghĩa) |
146 | LnkInvPair | LR trên các cặp từ truy vấn theo thứ tự ngược lại |
148 | LnkSkipPair | LR trên các cặp từ truy vấn thông qua một từ trong văn bản |
303 | LnkBreak | Tương tự của các yếu tố văn bản tương ứng cho các liên kết. BM25 của số liên kết phù hợp. |
305 | LnkPairSy | Sự hiện diện của các cặp từ trong các liên kết, có tính đến các từ đồng nghĩa |
306 | LnkBrkSy | Số lượng liên kết đã vượt qua ngưỡng |
396 | LinkBM25_W1 | Tương tự của các yếu tố cùng tên, trọng lượng từ = 1 |
17 - Nhóm LinkForms
Việc form có từ khóa tối ưu hơn
STT | Name | Mô tả |
389 | LinkMaxForms | Số biểu mẫu tối đa trên tất cả các từ truy vấn |
390 | LinkWeightedForms | Tổng trọng số từ của số lượng các hình thức |
391 | LinkForms | Tổng không trọng số của số lượng hình dạng |
18 - Nhóm PositionLanguageModel
STT | Name | Mô tả |
454 | PositionLanguageModel | Một yếu tố về mức độ tốt của một đoạn trích. |
19 - Nhóm QI
STT | Name | Mô tả |
744 | QiQueryCount | Số lượng yêu cầu trong nhóm các yêu cầu tần suất tương tự như yêu cầu đã cho |
745 | QiUrlFreqWeightedFRC | Các nhóm yêu cầu tần suất FRC tương tự như yêu cầu đã cho, tính trung bình trên tổng số lần nhấp và số lần hiển thị |
746 | QiUrlFreqWeightedFRCReg | Các nhóm FRC của truy vấn tần suất tương tự như truy vấn đã cho, tính trung bình trên tổng số lần nhấp và số lần hiển thị, theo thống kê khu vực |
881 | QiQueryUrlCorrectedCtrXfactor | Phiên bản QI của yếu tố 861. Giá trị tối đa trên tập hợp các truy vấn tương tự phổ biến. |
882 | QiQueryURLISBMCTRReg | Phiên bản QI của yếu tố 798. Giá trị tối đa trên tập hợp các truy vấn tương tự phổ biến. |
890 | QiSamplePeriodDayFrc | Phiên bản QI của yếu tố 879. |
TVQuản trị viênQuản trị viên
Xin chào quý khách. Quý khách hãy để lại bình luận, chúng tôi sẽ phản hồi sớm