Bạn có nên giữ lại hay loại bỏ dấu gạch chéo trên URL?

20/11/13
395
177
43
#1
Bạn có nên giữ hay loại bỏ dấu gạch chéo trên URL? Trước tiên, bạn hãy xem 2 URL bên dưới:
Ban co nen giu lai hay loai bo dau gach cheo tren url.png
Chỉ có một sự khác biệt giữa các URL đó và đó là dấu gạch chéo. Dấu gạch chéo "/" ở cuối URL. Câu hỏi đặt ra là bạn có muốn giữ dấu gạch chéo đó hay bạn muốn xóa nó? Bạn muốn URL của bạn giống tùy chọn đầu tiên hay thứ 2? Với tính khả dụng hay độc giả thì cái nào sẽ tốt hơn?

Lịch sử

Trong lịch sử, web là một nơi có cấu trúc và cứng nhắc hơn nhiều so với ngày nay. Trước đây, việc sử dụng URL chính xác là rất quan trọng bởi người ta sợ rằng người dùng cuối sẽ đến một nơi nào đó. Các công cụ "hacker" phổ biến thêm dấu gạch chéo, dấu hỏi và các ký tự khác để kích hoạt hành vi không mong muốn trong các trang web, cấp quyền truy cập vào các tập tin thư mục và các thư mục back-end mà bạn thường không nhìn thấy.

Với sự gia tăng của các nền tảng CMS như WordPress, các trình duyệt linh hoạt hơn và tự động chuyển hướng khỏi các thư mục hệ thống, sẽ khó hơn rất nhiều để tiếp cận back-end của trang web đó.

Ngày nay, một trang web sẽ không phải lo lắng về dấu gạch chéo vì hầu hết các web page là các tập tin. Bạn sẽ có các trang như www.example.com/blog-post.html. Bạn không muốn dấu gạch chéo sau một loại tập tin bởi điều đó không có ý nghĩa.

Dấu gạch chéo được sử dụng cho một thứ cụ thể cho biết đích đến hiện tại của bạn là một thư mục chứ không phải là một tập tin. Đó là một trang thư mục chứ không phải là một trang cụ thể. Các trang thư mục liệt kê các thư mục và các tập tin khác nhau trong thư mục đó, do vậy example.com/blog/ có thể liệt kê thư mục 2018, thư mục 2017... Bên trong thư mục 2018 có thể là một tập tin được gọi là blog-post-1.html, đây sẽ là tài liệu cho bài viết blog được đề cập đến.

Ban co nen giu lai hay loai bo dau gach cheo tren url 2.jpg

Tất nhiên, các hệ thống web hiện đại không sử dụng cấu trúc tập tin cơ bản như trước nữa. Chúng có nội dung được lưu trữ trong các trang, chúng có cấu trúc được lưu trữ trong các template và chúng tự động tạo trang khi người dùng tải nó.

Do vậy, trong lịch sử bạn sẽ không sử dụng dấu gạch chéo đằng sau trừ khi URL trỏ vào một thư mục. Không có dấu gạch chéo, bạn sẽ trỏ vào một trang cụ thể, thường có đuôi mở rộng .html hoặc .aspx.

Ngày nay, bạn không cần phải .html để chỉ ra rằng trang đó là một bài viết blog hoặc những gì bạn có. Bạn có thể giữ nó nếu bạn muốn và nó không tạo ra sự khác biệt khi trình duyệt hiển thị trang và cách công cụ tìm kiếm xem nó. Ví dụ, webmasters.googleblog.com/2010/04/to-slash-or-not-to-slash.html sử dụng loại tập tin .html và hoạt động tốt. Trong khi đó moz.com/community/q/trailing-slash-at-end-of-url không sử dụng loại tập tin mở rộng và nó cũng hoạt động tốt. Đồng thời, www.branded3.com/blog/urls-trailing-slash-seo/ không sử dụng một loại tập tin và không sử dụng một thư mục nhưng sử dụng dấu gạch chéo và nó cũng hoạt động tốt.

Để xem phương pháp nào tốt nhất, hãy xem Google.

Triển vọng của Google

Tất nhiên Google thông minh. Chúng thực sự không quan tâm bạn có sử dụng dấu gạch chéo sau URL của bạn hay không. Trong lịch sử họ nhận ra rằng, một là một thư mục và một là không. Tuy nhiên, họ cũng nhận ra rằng thời gian thay đổi, thực tiễn thay đổi và trên thực tế điều đó không quan trọng.

Tuyên bố chính thức của Google là URL mẫu mà tôi sử dụng. Đó là từ năm 2010 nhưng ngay cả gần một thập kỷ, lời khuyên vẫn giữ nguyên.

Google có một vài điều để nói. Trước hết, dấu gạch chéo không quan trọng. Cũng giống như sự khác biệt giữa HTTP và HTTPS cũng có sự khác biệt giữa dấu gạch chéo và không có dấu gạch chéo. Google sẽ tính một trong số đó là một URL khác.

Về mặt kỹ thuật, điều này có nghĩa là bạn có thể sử dụng chúng như các URL khác nhau. Bạn có thể có các trang khác nhau trên example.com/landing-page và example.com/landing-page/. Nhìn chung, bạn không nên làm điều đó. Vì sao? Nó trở nên khó hiểu với người dùng. Nếu tôi muốn truy cập trang có dấu gạch chéo nhưng tôi nhập URL mà không có dấu gạch chéo, tôi sẽ nhận được nội dung khác. Nếu tôi nhận được nội dung khác, điều cuối cùng tôi nghĩ đến là một dấu gạch chéo nhỏ. Tôi sẽ thấy trang bạn đã thay đổi.

Ngày nay hầu hết mọi người đều sử dụng internet, những thứ như dấu gạch chéo về cơ bản là vô hình. Những thứ như .com thường là vô hình.

Ban co nen giu lai hay loai bo dau gach cheo tren url 3.jpg

Google không quan tâm đến định dạng URL của bạn. Họ có thể đưa bạn một hình phạt nhỏ nếu bạn đang sử dụng định dạng URL kém hoặc hình phạt nhỏ sau khi sử dụng URL giống nhau nhưng thực sự họ không quan tâm. Điều Google quan tâm là tính duy nhất của trang.

Điều này có nghĩa là bạn có thể sử dụng bất kỳ định dạng URL nào và Google sẽ xếp hạng bạn theo cùng một cách. Vấn đề duy nhất là nếu bạn sử dụng cả 2 định dạng cùng một lúc thì Google có thể mang đến cho bạn một hình phạt nhỏ nếu bạn có nội dung khác nhau trên cùng một URL có và không có dấu gạch chéo bởi đó là vấn đề tính khả dụng. Nếu bạn sử dụng cùng nội dung trên cả 2 URL có và không có dấu gạch chéo, bạn cần canonicalization nếu không Google có thể cho bạn hình phạt nội dung trùng lặp.

Điều đáng chú ý là trên bài viết của Google từ năm 2010 nói rằng nội dung trùng lặp là okay. Nó cũng được xuất bản vào năm 2010 - một năm trước Panda, thuật toán chống nội dung trùng lặp của Google. Hãy yên tâm, nội dung trùng lặp sẽ không còn okay như họ nói trong năm 2010 nữa.

Thực tiễn tốt nhất

Bây giờ, tôi không trả lời câu hỏi: Có nên sử dụng dấu gạch chéo hay không? Vâng câu trả lời là nó phụ thuộc. Tôi biết bạn mệt mỏi vì phải nghe điều này từ tôi nhưng đó là sự thật. Nó luôn phụ thuộc vào một số yếu tố.

Trước hết, bạn có sử dụng loại tập tin mở rộng hay không? Nếu bạn sử dụng .html cho bài viết blog của mình, chắc chắn rằng bạn không muốn một dấu gạch chéo sau đó. Tương tự như vậy, chẳng hạn như .aspx hoặc .php hoặc .whatever.

Ban co nen giu lai hay loai bo dau gach cheo tren url 4.jpg

Thứ 2, hãy xem trang web của bạn mặc định là gì. Ví dụ, WordPress thường sử dụng dấu gạch chéo làm mặc định. Bạn có thể ép buộc nó theo cách này hay cách khác.

Ban co nen giu lai hay loai bo dau gach cheo tren url 5.jpg

Thứ 3, hãy cân nhắc xem bạn có quan tâm đến việc cung cấp cho khán giả của bạn. Hầu hết các đối tượng đặc biệt là giới trẻ họ sẽ không quan tâm đến việc bạn có dấu chéo trên các trang hay không. Đối tượng duy nhất quan tâm là những người ở thế hệ trước và những người có thể bị kích thích khi nhìn thấy dấu gạch chéo khi không có thư mục. 99% nó không quan trọng.

Do vậy, đây là thực tiễn tốt nhất của tôi:

Trước hết, hãy nhất quán với những gì bạn chọn. Nếu bạn muốn có dấu gạch chéo, hãy triển khai nó trên mỗi trang của trang web ngoại trừ các trang có đuôi kết thúc. Với Google hay người dùng thì nó không tạo ra sự khác biệt lớn nhưng nó có vẻ gọn gàng hơn và mọi người sẽ không gặp khó khăn khi thêm hoặc xóa nó.

Thứ 2, quyết định xem bạn có muốn sử dụng phương pháp cũ nhất và phục vụ cho đối tượng lớn tuổi hay không. Chắc chắn bạn có thể sử dụng dấu gạch chéo với directories (thư mục) trong khi không bao giờ sử dụng dấu gạch chéo cho non-directories (không thư mục). Điều đó hoàn toàn có thể chấp nhận được và thông báo cho một số người dùng cụ thể về cấu trúc trang web của bạn.

Bạn có thể triển khai điều này tương tự như blog webmasters của Google. Truy cập liên kết này: https://webmasters.googleblog.com/2010/04/to-slash-or-not-to-slash.html. Nếu bạn truy cập liên kết đó, đó là một bài viết blog. Bạn có thể nói rằng đó là một bài viết blog bởi nó kết thúc bằng .html.

Bây giờ nếu bạn loại bỏ tên tập tin cụ thể, bạn kết thúc bằng https://webmasters.googleblog.com/2010/04/. URL này là một thư mục và nó sẽ hiển thị cho bạn tất cả bài viết được xuất bản vào tháng 4 năm 2010 trên blog Google webmasters. Nếu bạn loại bỏ 04 thành https://webmasters.googleblog.com/2010/, bạn sẽ thấy tất cả các bài viết blog được xuất bản vào năm 2010. Bạn có thể thay đổi 2010 thành 2011 và các năm sau đó. Đây là cách cấu trúc thư mục hoạt động trên trang web của bạn nếu bạn đang sử dụng cấu trúc thư mục một cách có logic.

Tuy nhiên, nếu bạn cố gắng làm điều tương tự với trang web của tôi, bạn chỉ cần phá vỡ WordPress. Do vậy, hãy lưu ý rằng hầu hết các trang web sẽ không hoạt động như vậy và Google có nhiều quy tắc ngoại lệ.

Cá nhân tôi không nghĩ rằng nó quan trọng nếu bạn có trang thư mục. WordPress có các trang danh mục cho mục đích đó và sắp xếp một chủ đề sẽ là hữu ích hơn so với vệc sắp xếp một ngày nào đó. Tuy nhiên, điều đó tùy thuộc vào bạn.

Quyết định thứ 3 là liệu bạn có muốn duy trì cả 2 lựa chọn hay chỉ một. Đã có rất nhiều người thảo luận về chủ đề này nói rằng bạn nên đi theo cách này hay cách kia và gắn bó với nó bởi: việc thay đổi sẽ chiếm tài nguyên máy chủ và thời gian của bạn. Cụ thể, nếu bạn muốn dấu gạch chéo và tôi truy cập URL của bạn nhưng không có, bạn sẽ phải chuyển hướng tôi, nếu không tôi sẽ kết thúc với trang bị hỏng. Chuyển hướng đó làm mất rất nhiều thời gian để đến trang của bạn. Một vài mili giây có thể không ảnh hưởng đến thái độ của tôi nhưng nó vẫn là một sự sụt giảm rất nhỏ và nhiều lần như thế nó sẽ ảnh hưởng đến tốc độ tải trang.

Thực ra nó không quan trọng lắm. Tôi có thể đảm bảo với bạn rằng có một loạt những việc khác bạn có thể làm cho trang web của mình để tăng tốc độ hơn là loại bỏ một chuyển hướng. Đề xuất của tôi là sử dụng cả 2 với nội dung trùng lặp và canonicalization phù hợp.

Ban co nen giu lai hay loai bo dau gach cheo tren url 6.jpg

Vâng, nội dung trùng lặp là xấu. Nếu bạn có cùng một lúc www.example.com/blog-post/www.example.com/blog-post, Google sẽ thấy 2 bài viết blog giống hệt nhau với 2 URL khác nhau trên trang web của bạn. Điều này là xấu và nếu nó được thực hiện trên toàn bộ trang web của bạn thì điều đó rất tệ bởi bạn có nhiều nội dung trùng lặp và chắc chắn bạn sẽ nhận được một hình phạt.

Tuy nhiên, nếu bạn thông báo cho Google biết rằng URL có dấu gạch chéo phải được canonicalization thành một URL không có dấu gạch chéo thì họ sẽ hiểu rằng URL không có dấu gạch chéo là phiên bản dự định và phiên bản có dấu gạch chéo tồn tại để cấp quyền truy cập cho bất kỳ ai truy cập trang đó mà không có chuyển hướng.

Nó nhanh hơn và bạn có một chuyển hướng gọi là chuyển hướng "mềm" nếu người dùng tiếp tục duyệt qua trang của bạn. Mỗi liên kết nội bộ phải trỏ đến phiên bản thực của trang, do vậy bất kỳ ai truy cập phiên bản có dấu gạch chéo sẽ không kết thúc trên các trang tiếp theo.

Canonicalization cho phép Google bỏ qua nội dung trùng lặp. Điều này cũng có nghĩa là họ sẽ luôn index phiên bản phù hợp, do vậy những người đến từ Google sẽ không bao giờ đến phiên bản không phù hợp. Cùng một lúc nó giải quyết tất cả các vấn đề của bạn.

Bạn có muốn có dấu gạch chéo hay không chỉ là sở thích cá nhân của bạn. Nếu nó liên quan đến việc thay đổi phần lớn trang web của bạn, hãy gắn bó với một trong 2 tùy chọn đó. Về phương diện khác, nó thực sự không quan trọng với internet hiện đại, công cụ tìm kiếm hiện đại và người dùng hiện đại.

 

Donate

Thống kê diễn đàn

Chủ đề
19,332
Bài viết
21,167
Thành viên
89,402
Thành viên mới
OCM

Thành viên trực tuyến