Tối ưu Robots.txt chuẩn nhất cho Blogspot (Blogger)
Đây là câu đầu tiên bạn vào phần cài đặt file Robots.txt Blogspot thông báo cho các bạn “Cảnh báo! Hãy sử dụng một cách thận trọng. Việc sử dụng sai các tính năng này có thể khiến blog của bạn bị công cụ tìm kiếm bỏ qua”. Một câu thông báo ngắn ngủi cũng đủ nói lên tầm quan trọng của file Robots.txt.
Robots Exclusion Standard được phát triển từ năm 1994, nhằm giúp các webmaster có thể “tư vấn” cho các công cụ tìm kiếm cách thu thập thông tin từ Blog/Website của họ. Nó hoạt động theo cách tương tự như các “Thẻ tiêu đề robot tùy chỉnh”. Điểm khác biệt chính giữa chúng là các tập tin “Robots.txt tùy chỉnh” sẽ ngăn cản việc công cụ tìm kiếm truy cập vào một trang hoặc thư mục, trong khi các “Thẻ tiêu đề robot tùy chỉnh” chỉ kiểm soát việc lúc nào thì trang hoặc thư mục đó được lập chỉ mục (index).
☼ Hướng dẫn tối hóa cho file Robot.txt
Bạn vào Blog => Cài đặt => Tùy chọn tìm kiếm (“Robots.txt tùy chỉnh” và “Thẻ tiêu đề robot tùy chỉnh”)
1. Code tối ưu “Robots tùy chỉnh” Chọn chỉnh sửa => Yes => Paste đoạn Code dưới đây và Lưu thay đổi.
User-agent: Mediapartners-Google Disallow: User-agent: * Allow: / Disallow: /search Disallow: /*?updated-max=* Disallow: *archive.html Sitemap: https://cuongbokit.blogspot.com/feeds/posts/default?orderby=UPDATED
Tag | Ý nghĩa |
User-agent: * | Xác định các công cụ tìm kiếm mà quy tắc được áp dụng. |
Disallow: / | Báo cho công cụ tìm kiếm biết nó không nên "Lục lọi" ở những file này. |
Allow: / | Cho phép công cụ tìm kiếm index đọc tất cả các nội dung. |
cuongbokit.blogspot.com | Thay thành địa chỉ trang của các Bạn. |
Tag | Ý nghĩa |
all | Cho phép công cụ tìm kiếm lập chỉ mục. |
noindex | Không hiển thị trang này trong kết quả tìm kiếm. |
nofollow | Thông báo cho công cụ tìm kiếm không nên lần theo các liên kết này. |
none | Tương tự như nonidex và nofollow. |
noarchive | Không hiển thị một liên kết "Cached" trong kết quả tìm kiếm. |
nosnippet | Không hiển thị một đoạn mã trong kết quả tìm kiếm cho trang này. |
noodp | Không sử dụng dữ liệu từ các dự án Open Directory (DMOZ) cho tiêu đề hoặc đoạn hiển thị cho trang này. |
notranslate | Không cung cấp bản dịch của trang này với các ngôn ngữ khác trong kết quả tìm kiếm. |
noimageindex | Không lập chỉ mục cho hình ảnh trên trang này. |
unavailable_after | Không hiển thị trang này trong kết quả tìm kiếm sau khi ngày/thời gian quy định. Ngày/thời phải được xác định trong các định dạng RCF 850. |
Kết luận: Quá trình cài đặt file Robot.txt cũng không quá khó. Nhưng chủ yếu là các bạn biết cách dùng sao cho phù hợp với nội dung Blog/Website của Bạn.
Nếu bạn thích bài viết này, hãy subscribe blog của tôi để thường xuyên cập nhật những bài viết hay nhất, mới nhất qua email nhé. Cảm ơn rất nhiều. JJJ
Đăng nhận xét
Lưu ý
Khuyên bạn hạn chế bình luận ẩn danh, hãy đăng nhập bằng tài khoản Google.
Nếu muốn bình luận 1 đoạn code, bạn hãy mã hóa code để code hiển thị chính xác nhé!