Tối ưu hóa XML Sitemap: 13 giải pháp thực tiến tốt nhất

20/11/13
340
122
43
#1
Tạo một sitemap là một phần quan trọng trong việc tối ưu hóa cho bất kỳ trang web nào. Sitemap không chỉ cung cấp cho công cụ tìm kiếm bản thiết kế chi tiết trang web của bạn trông như thế nào mà chúng còn bao gồm cả các meta-data có giá trị như:

- Tần suất mỗi trang được cập nhật.
- Khi chúng được thay đổi lần cuối.
- Các trang quan trọng có liên quan đến nhau như thế nào.

Sitemap đặc biệt quan trọng đối với các trang web:

- Có nhiều nội dung được lưu trữ mà không được liên kết với nhau.
- Thiếu liên kết external.
- Có hàng trăm hoặc thậm chí hàng nghìn trang.
- Như cái tên của nó, các tập tin này cung cấp cho bots với map của trang web giúp chúng khám phá và index các trang quan trọng nhất.

slide.JPG

Trong bài viết này, chúng ta sẽ thảo luận các mẹo quan trọng nhất bạn cần biết để tạo và tối ưu hóa sitemap của bạn cho các công cụ tìm kiếm và khách truy cập.

1. Sử dụng các công cụ & plugin để tạo sitemap tự động

Việc tạo sitemap rất dễ dàng khi bạn có các công cụ phù hợp chẳng hạn như built-in XML Sitemap generator hoặc các plugin phổ biến như Google XML Sitemaps.

Trên thực tế, các trang web WordPress đã sử dụng Yoast SEO có thể cho phép trực tiếp vào plugin.

Ngoài ra, bạn có thể tự tạo ra một sitemap theo cấu trúc XML sitemap code. Về mặt kỹ thuật, sitemap của bạn không cần phải ở định dạng XML - một tập tin văn bản với một dòng mới tách biệt từng URL là đủ.

Tuy nhiên, bạn sẽ cần phải tạo ra một XML sitemap hoàn chỉnh nếu bạn muốn thực hiện thuộc tính hreflang. Truy cập trang chính thức của GoogleBing để biết thêm thông tin về cách thiết lập sitemap theo cách manual.

2. Submit sitemap của bạn tới Google

Bạn có thể submit sitemap đến Google từ Google Search Console của bạn. Từ dashboard, click Crawl > Sitemaps > Add Test Sitemap.

Kiểm tra sitemap của bạn và xem kết quả trước khi bạn click Submit Sitemap để kiểm tra lỗi chặn index các trang đích chính. Lý tưởng nhất là bạn muốn số trang được index cùng với số trang được submit. Lưu ý rằng việc submit sitemap của bạn cho Google biết những trang nào bạn cho là chất lượng cao và xứng đáng được index nhưng nó không đảm bảo rằng chúng sẽ được index. Thay vào đó, lợi ích của việc submit sitemap là:

- Giúp Google hiểu trang web củ bạn được trình bày như thế nào.
- Phát hiện các lỗi bạn có thể sửa để đảm bảo các trang của bạn được index đúng cách.

3. Ưu tiên các trang chất lượng cao trong sitemap của bạn

Khi nói đến xếp hạng, chất lượng trang web tổng thể là một yếu tố quan trọng.

Nếu sitemap của bạn dẫn bots đến hàng nghìn các trang chất lượng thấp, các công cụ tìm kiếm sẽ cho rằng các trang này như là một dấu hiệu cho thấy trang web của bạn không phải là nơi mà khách truy cập muốn ghé thăm - ngay cả khi trang đó là cần thiết cho trang web của bạn chẳng hạn như các trang login. Thay vào đó cố gắng hướng bots đến các trang quan trọng nhất trên trang web của bạn. Lý tưởng nhất là những trang như sau:

- Tối ưu hóa cao
- Chứa hình ảnh và video
- Có nhiều nội dung duy nhất
- Thúc đẩy tương tác người dùng thông qua các comment và đánh giá.

4. Cô lập vấn đề index

Google Search Console có thể khó chịu nếu nó không index tất cả các trang của bạn bởi nó không cho bạn biết trang nào có vấn đề. Ví dụ: nếu bạn submit 20.000 trang và chỉ có 15.000 trang trong số được được index, bạn sẽ không biết về 5.000 trang đang có vấn đề. Điều này đặc biệt đúng với các trang web thương mại điện tử có nhiều trang sản phẩm rất giống nhau.

Michael Cottam đã viết một hướng dẫn hữu ích để cô lập các trang có vấn đề. Ông đề xuất chia các trang sản phẩm thành các XML sitemaps khác nhau và thử nghiệm từng trang. Tạo sitemap sẽ khẳng định các giả thuyết chẳng hạn như "các trang không có hình ảnh sản phẩm không được index". Khi bạn đã tách những vấn đề chính, bạn có thể khắc phục sự cố hoặc đặt các trang đó thành "noindex", do đó chúng không làm giảm chất lượng trang web tổng thể của bạn.

5. Chỉ bao gồm phiên bản Canonical của URL trong Sitemap của bạn

Khi bạn có nhiều trang giống nhau, chẳng hạn như các trang sản phẩm cho các màu sắc khác nhau của cùng một sản phẩm, bạn nên sử dụng thẻ “link rel=canonical” để nói cho Google biết trang nào là trang chính họ nên crawl và index.

Bots sẽ dễ dàng hơn trong việc khám phá các trang chính nếu bạn không bao gồm các trang với canonical URLs trỏ đến các trang khác.

6. Sử dụng Robots Meta Tag trên Robots.txt bất cứ khi nào có thể

Khi bạn không muốn một trang được index, bạn thường muốn sử dụng thẻ meta robot “noindex,follow”. Điều này ngăn Google index nhưng nó vẫn giữ nguyên giá trị liên kết của bạn và đặc biệt hữu ích với các trang tiện ích quan trọng của trang web nhưng không được hiển thị trong kết quả tìm kiếm. Lần duy nhất bạn muốn sử dụng robots.txt để chặn các trang là khi bạn lấy ngân sách thu thập. Nếu bạn nhận thấy rằng Google đang re-crawl và index các trang không quan trọng (ví dụ các trang sản phẩm riêng lẻ), bạn có thể sử dụng robots.txt.

7. Đừng chứa ‘noindex’ URLs trong Sitemap của bạn

Khi bạn submit một sitemap bao gồm các trang bị chặn và noindex, bạn đang nói với Google rằng "đây là những trang thực sự quan trọng mà bạn index trang này" và "bạn không được phép index trang này".

Thiếu tính nhất quán là một sai lầm phổ biến.

8. Tạo XML Sitemap động cho các trang web lớn

Với các trang web khổng lồ thì gần như không thể theo kịp tất cả meta robots của bạn. Thay vào đó, bạn nên thiết lập quy tắc logic để xác định khi một trang được đưa vào trong XML sitemap của bạn và/hoặc đã thay đổi từ noindex thành “index, follow".

Bạn có thể tìm hướng dẫn chi tiết về cách tạo XML sitemap động nhưng bước này thực hiện dễ dàng hơn với sự trợ giúp của một công cụ để tạo sitemap động cho bạn.

9. Sử dụng XML Sitemap & RSS/Atom Feeds

RSS/Atom feeds thông báo cho các công cụ tìm kiếm khi bạn cập nhật một trang hoặc thêm nội dung mới vào trang web của bạn. Google khuyến cáo sử dụng cả sitemap và RSS/Atom feeds để giúp các công cụ tìm kiếm hiểu những trang nào nên được index và cập nhật.

Bằng cách đưa nội dung được cập nhật gần đây vào RSS/Atom feeds của bạn, bạn sẽ tìm thấy nội dung mới dễ dàng hơn cho cả công cụ tìm kiếm và khách truy cập.

10. Chỉ cập nhật lần sửa đổi khi bạn thực hiện những thay đổi đáng kể

Đừng đánh lừa các công cụ tìm kiếm bằng việc re-index các trang bằng cách cập nhật thời gian sửa đổi của bạn mà không thực hiện bất kỳ thay đổi đáng kể nào cho trang của bạn. Năm ngoái tôi đã nói đến những nguy cơ tiềm ẩn về rủi ro SEO. Tôi sẽ không nhắc lại tất cả các điểm của tôi ở đây nhưng đủ để nói rằng Google có thể bắt đầu loại bỏ date stamps của bạn nếu chúng được cập nhật liên tục mà không cung cấp giá trị mới.

11. Đừng lo lắng quá nhiều về thiết lập ưu tiên

Một vài sitemap có cột "Ưu tiên" nói với công cụ tìm kiếm trang nào là quan trọng nhất. Cho dù tính năng này thực sự hoạt động nhưng đầu năm ngoái Gary Illyes đã tweet rằng Googlebot bỏ qua thiết lập ưu tiên khi crawl.

Toi uu hoa xml sitemap 13 giai phap thuc tien tot nhat.png

12. Duy trì kích thước tập tin nhỏ khi có thể

Google và Bing đều tăng kích thước các tập tin sitemap từ 0 MB lên 50 MB vào năm 2016 nhưng vẫn giữ nguyên sitemap tốt nhất của bạn và ưu tiên các trang đích chính của bạn.

13. Tạo nhiều Sitemap nếu trang web của bạn có hơn 50.000 URL

Bạn được giới hạn với 50.000 URL cho mỗi sitemap. Mặc dù điều này là quá đủ cho hầu hết các trang web nhưng một số trang web sẽ cần phải tạo nhiều hơn một sitemap.

Ví dụ: các trang web thương mại điện tử lớn có thể cần phải tạo sitemap để xử lý các trang sản phẩm.

 
Sửa lần cuối bởi điều hành viên:

Bạn có quan tâm?

Donate

Thảo luận nhiều nhất