Phải thừa nhận rằng: Đối với anh em làm SEO, ai cũng đều biết và hiểu URL là gì.
Và nếu URL không được cấu trúc đúng ngay từ ban đầu, sẽ rất khó để bạn có thể mở rộng website với hàng trăm hoặc hàng ngàn content.
Tin vui là:
Tối ưu URL thân thiện SEO không phải là học cách chế tạo tên lửa đầu đạn hạt nhân!
Nếu bạn đang sử dụng một vài từ để mô tả URL của mình và thay thế khoảng cách bằng dấu gạch ngang thì nó cũng đã “đủ tốt” cho SEO rồi.
Nhưng nếu bạn muốn hiểu mọi thứ một cách sâu sắc hơn thì bài viết này sẽ chia sẻ một cách tường tận cho bạn TẤT CẢ vấn đề liên quan đến việc tối ưu URL, bắt đầu như thế nào, lưu ý ra làm sao…
OK, bài dài nên bắt đầu ngay nhé! 🙂
URL là gì và các thành phần của một URL
URL là viết tắt của Uniform Resource Locator (định vị tài nguyên thống nhất). Cụ thể hơn, URL là địa chỉ của một tài nguyên duy nhất trên Web. Mỗi URL hợp lệ sẽ trỏ đến một tài nguyên duy nhất, tài nguyên đó có thể là trang HTML, tài liệu CSS, hình ảnh, video, file PDF…
Một URL thường sẽ có các phần như sau:
Giải thích chi tiết hơn:
- Protocol (bắt buộc): Giao thức mạng. Tập hợp các quy tắc được thiết lập nhằm xác định cách để định dạng, truyền và nhận dữ liệu sao cho các thiết bị mạng máy tính – từ server và router tới endpoint – có thể giao tiếp với nhau, bất kể sự khác biệt về cơ sở hạ tầng, thiết kế hay các tiêu chuẩn cơ bản giữa chúng.
- Subdomain (có hoặc không): là phần mở rộng của một tên miền (domain), còn được gọi là tên miền phụ. Subdomain có thể được tạo hoàn toàn miễn phí và nó có thể hoạt động như một tên miền thực thụ.
- Domain (bắt buộc): tên miền. Tên của một website hoạt động trên internet, đóng vai trò là một địa chỉ tĩnh, cố định. Mỗi tên miền là một địa chỉ duy nhất trên môi trường internet.
- Top-Level domain (TLD) (bắt buộc): đuôi tên miền (vd: .com, .net, .vn…) phần chữ đi sau dấu chấm của tên miền.
- Subfolder (có hoặc không): thư mục con của tên miền. Subfolder lưu trữ riêng biệt cho từng thành phần của website. Được nhận biết với phần theo sau của dấu “/”. Ví dụ: leapcontent.vn/courses
- Slug (có hoặc không): là một phần đặt ngay sau tên miền hoặc sau dấu “/” cuối cùng trong URL, thể hiện tên của trang đó. Vd: https://leapcontent.vn/courses/content-marketing thì “content-marketing” chính là slug và “courses” chính là subfolder.
- Parameters (có hoặc không): Là một phần mở rộng nằm phía sau slug (hay còn gọi là tham số). Các tham số này bắt đầu bằng các ký hiệu đặc biệt như ? = & dùng để tracking, sử dụng bộ lọc và đánh số thứ tự ở các phần backend của CMS… Vd: Đây là kết quả sau khi bạn click vào một link trong Facebook: https://leapcontent.vn/content-marketing-la-gi/?fbclid=IwAR2Cm0xfr9lUnf4UpHKzir-uVCPRclzCUwPJfBA8T9jZDexQzzOxoDnfRAs
- Anchor (có hoặc không): Cũng là một phần mở rộng nằm phía sau slug bắt đầu bằng dấu “#” dùng để làm điểm neo. Vd: Khi bạn bấm vào mục lục nội dung bài viết này bạn sẽ được chuyển xuống phần nội dung mà bạn muốn, và url sẽ thay đổi: https://leapcontent.vn/url-la-gi/#phuong-phap
Tại sao việc tối ưu URL lại quan trọng cho SEO?
URL là một yếu tố xếp hạng khá nhỏ và có một vài tranh luận rằng nó thậm chí không còn quan trọng nữa.
Sự thật là, tầm quan trọng của URL không tác động trực tiếp vào thứ hạng.
Cụ thể hơn, có 3 lý do là:
URL và trải nghiệm người dùng
Một URL được tối ưu hóa tốt có thể có tác động tích cực đến trải nghiệm người dùng tổng thể trên trang web của bạn trong SERPs.
Đi kèm với tiêu đề của trang (hoặc thẻ tiêu đề title tag), chúng giúp giải thích nội dung của mỗi trang trong kết quả tìm kiếm:
Mọi người có nhiều khả năng nhấp vào URL được tối ưu hóa hơn so với URL không được tối ưu hóa.
Ví dụ:
Đây là 2 trang thể hiện cùng một loại thông tin thì bạn sẽ chọn nhấp vào cái nào?
- https://leapcontent.vn/content-marketing/ky-nang-viet/
- https://leapcontent.vn/articles/05/26/21/29dshj2972hns9278
Mình đoán là cái đầu tiên, bởi đơn giản nó dễ đọc dễ hiểu hơn và nó chỉ ra rất rõ ràng nội dung chính cũng như từ khóa chính mà trang đó đề cập đến là gì.
URL cũng là một phần quan trọng trong cách cấu trúc trang web của bạn qua sự phân vùng subfolder -> Điều này tác động rất lớn đến trải nghiệm người dùng trên website của bạn.
URL và thứ hạng tìm kiếm
Như đã nói ở phần trên, URL cũng là một yếu tố nhỏ đánh giá thứ hạng của Google.
Cụ thể hơn, khi bạn đưa từ khóa chính mà một trang tập trung vào trong URL có thể giúp cải thiện thứ hạng của bạn.
Trên thực tế, nghiên cứu từ Backlinko đã chỉ ra rằng URL ngắn có thứ hạng tốt hơn URL dài.
Lý do là vì nó giúp gửi một tín hiệu mạnh mẽ hơn đến các công cụ tìm kiếm về trọng tâm chủ đề của một trang là gì.
Google sẽ xem xét hai ví dụ URL ở trên và cũng giống như con người, nó sẽ nhanh chóng hiểu trang đầu tiên nói về điều gì (so với cấu trúc URL khó hiểu hơn của trang thứ hai).
URL và link building + social sharing
Lý do cuối cùng tại sao URL quan trọng đối với SEO là cách chúng tác động đến việc xây dựng liên kết và chia sẻ trên mạng xã hội.
Khi bạn có một trang có URL thân thiện với người dùng, mọi người có thể thấy nội dung của trang đó là về cái gì.
Khi đó, bạn có nhiều khả năng nhận được các backlink theo ngữ cảnh hoặc được chia sẻ trên social media tốt hơn.
Một điều khác cần nhớ là đôi khi mọi người liên kết đến trang của bạn và sử dụng chính URL đó làm liên kết (link trần). Điều này không thực sự quá tốt cho bạn nhưng nếu bạn đã có một từ khóa chính trong URL rồi thì nó cũng sẽ giúp tăng tín hiệu xếp hạng trang web của bạn cho từ khóa đó.
Dynamic URL và Static URL (URL động và URL tĩnh)
Hầu hết mọi website sẽ có cả 2 loại URL: động và tĩnh. Google đã có một tổng hợp rất chi tiết trên Google Webmaster về chủ đề này.
Giờ hãy xem chúng là gì và ưu nhược điểm của từng loại:
URL động (Dynamic URL)
URL động là URL được tạo bởi máy chủ hoặc hệ thống quản lý nội dung CMS, chúng chứa các ký tự không dễ nhớ. Bạn thường bắt gặp các URL động bằng cách thấy xuất hiện các ký tự như: ? = &. (các ký tự đại diện cho thành phần Parameter của URL)
Thông thường, chúng được tạo ra vì máy chủ hoặc CMS không biết gọi mỗi trang là gì.
Ví dụ:
https://leapcontent.vn/content-marketing-la-gi/?preview_id=40975
Ưu điểm
- Tốt khi bạn sử dụng các công cụ filter hay sắp xếp thứ tự cho phần backend của CMS.
- Gắn các hàm tracking UTM cho các chiến dịch quảng cáo.
Nhược điểm
- Dài hơn… và khó nhớ hơn!!? Không thể đọc thủ công cho bạn bè qua điện thoại hay typing lúc chat được.
- Có thể bị BOT của Google thu thập thông tin và hiển thị trên trang tìm kiếm, tạo ra “content rác” làm giảm vốn index của website bạn
- Tỷ lệ click CTR thấp trên trang kết quả tìm kiếm, email, forum…
- Rất dễ xảy ra tình trạng URL 404 (lỗi không tìm thấy kết quả)
- Giảm mức độ liên quan và nổi bật của từ khóa chính
- Thường không chắc chắn về kết quả hiển thị trùng khớp với ý định tìm kiếm của người dùng
- Không dùng để xây dựng thương hiệu hay bỏ vào các sản phẩm in ấn (vậy mà vẫn có người làm mới khủng khiếp)
Cảnh báo
Đây là ví dụ về việc bỏ dynamic link vào sản phẩm in ấn và…không ai nhớ nổi để mà gõ vào trình duyệt!!!
Đây là một lý do tại sao các dịch vụ rút gọn link ra đời.
URL tĩnh (Static URL)
URL tĩnh là URL không thay đổi và không chứa bất kỳ tham số nào (hay nói cách khác là không có ký tự đặc biệt nào).
Ví dụ:
https://leapcontent.vn/content-marketing-la-gi/
Ưu điểm
- Tỷ lệ nhấp CTR cao hơn trong trang kết quả tìm kiếm, email, website,…
- Mức độ nổi bật và liên quan của từ khóa cao
- Dễ dàng copy paste và chia sẻ online hoặc offline
- Dễ nhớ. Do đó có thể sử dụng trong xây dựng thương hiệu và phương tiện truyền thông offline.
- Tạo ra kỳ vọng chính xác từ người dùng về những gì họ sắp thấy trên trang
- Có thể chứa văn bản liên kết tốt, giúp trang xếp hạng cao hơn khi được liên kết trực tiếp với định dạng URL
- 99% Các công cụ tìm kiếm hiện nay thường xử lý các URL tĩnh dễ hơn so với URL động, đặc biệt khi URL động có quá nhiều tham số.
Nhược điểm
Không thể dùng nó để đặt cho các đường dẫn backend và đánh số thứ tự content hay sử dụng filter trên website. Vì mỗi đường dẫn là duy nhất!
Làm sao sử dụng URL Parameter tốt nhất cho SEO?
Theo Google developers, có 2 loại URL parameters:
- Content-modifying parameters (chủ động): loại thông số này sẽ thay đổi nội dung trên trang. Vd: Đưa người dùng trực tiếp đến một sản phẩm cụ thể gọi là “abc” – https://domain.com?productid=abc
- Tracking parameters (bị động) đối với những theo dõi nâng cao: các thông số này sẽ đi kèm thông tin về cái click – tức là người nhấp chuột đến từ mạng nào, chiến dịch hoặc nhóm quảng cáo nào,… – nhưng sẽ không thay đổi nội dung trên trang. Vd: Để theo dõi người click từ bản tin mà bạn gửi hàng tuần: https://www.domain.com/?utm_source=newsletter&utm_medium=email Hoặc từ một chiến dịch sale mùa hè: https://www.domain.com/?utm_source=twitter&utm_medium=tweet&utm_campaign=summer-sale
Ví dụ về các truy vấn URL parameter thường gặp nhất
Các trường hợp cụ thể thường dùng URL parameter bao gồm:
Khi nào Parameters trở thành vấn đề SEO mà bạn phải giải quyết?
Dưới đây là các vấn đề SEO phổ biến nhất do các URL Parameters gây ra:
- Duplicate content (trùng lặp nội dung): Vì mọi URL được các công cụ tìm kiếm coi là một trang độc lập, nhiều phiên bản của cùng một trang được tạo bởi URL parameters có thể được coi là nội dung trùng lặp. Google đã cảnh báo điều này, có thể một trang được sắp xếp lại theo tham số URL thường rất giống với trang gốc, trong khi một số tham số có thể trả về nội dung giống hệt như trang gốc nhưng lại khác URL.
- Loss in crawl budget (mất ngân sách thu thập thông tin từ Google): Theo Google Developers, con bot thu thập thông tin của họ có thể quyết định bỏ qua việc lập chỉ mục (index) content của bạn để tránh “lãng phí” tài nguyên, tệ hơn nó có thể đánh dấu trang đó là chất lượng thấp và chuyển sang trang tiếp theo.
- Keyword cannibalization (từ khóa ăn thịt nhau): Các phiên bản được tham số hóa của URL gốc đều nhắm vào cùng một nhóm từ khóa. Điều này dẫn đến việc các trang khác nhau cạnh tranh cho cùng một thứ hạng, nó có thể khiến bot thu thập thông tin quyết định rằng các trang được lọc không thêm bất kỳ giá trị thực nào cho người dùng.
- Loãng các tín hiệu xếp hạng: Với nhiều URL trỏ đến cùng một nội dung, các liên kết và share trên social lại trỏ đến bất kỳ phiên bản được tham số hóa nào của cùng một trang. Điều này có thể gây nhầm lẫn thêm cho các con bot thu thập thông tin, nó sẽ không hiểu trang nào trong số các trang này nên được xếp hạng cho từ khóa chính đó.
- Khả năng đọc của URL kém: Khi tối ưu hóa cấu trúc URL, chúng ta muốn URL đơn giản và dễ hiểu. Một URL được tham số hóa hầu như không thể đọc được đối với người dùng. Khi được hiển thị trong SERPs hoặc trong bản tin hoặc trên social media, URL có tham số nhìn giống như link spam và không đáng tin cậy, khiến người dùng ít có khả năng nhấp vào và chia sẻ.
Những cách quản lý URL Parameters hiệu quả nhất
Phần lớn các vấn đề SEO ở trên đều chỉ ra một nguyên nhân chính: Google sẽ thu thập dữ liệu và index tất cả các URL được tham số hóa.
Cốt lõi của việc xử lý thông số URL tốt là tìm cách gắn thẻ thích hợp.
Lưu ý
Các vấn đề về SEO phát sinh khi các URL chứa tham số hiển thị nội dung trùng lặp là những content được tạo bởi các tham số URL BỊ ĐỘNG. Những trang có URL dạng này không nên được index.
Hạn chế tối đa URL Parameters
Có bốn vấn đề phổ biến nhất bạn cần phải giải quyết.
1/ Loại bỏ những tham số không cần thiết
Nếu bạn có developer riêng, hãy hỏi họ danh sách tất cả các parameters có trên website của bạn và công dụng của nó. Có thể bạn sẽ tìm thấy một vài thứ không có nhiều giá trị.
Ví dụ, người dùng xác định bằng cookie thì tốt hơn so với sessionID. Tuy nhiên, thông số sessionID có thể vẫn tồn tại trên trang web của bạn vì nó đã được sử dụng trong quá khứ.
Những thứ không còn nhiều giá trị trong thời điểm hiện tại nên được loại bỏ ngay.
2/ Đừng để các giá trị trống
Các tham số URL chỉ nên được thêm vào một khi chúng có một chức năng. Đừng bao giờ thêm thông số nếu giá trị trống.
Trong ví dụ trên, key2 và key3 không thêm giá trị theo cả nghĩa đen và nghĩa bóng.
3/ Chỉ sử dụng keys một lần
Tránh áp dụng nhiều tham số có cùng tên tham số nhưng giá trị khác nhau.
Đối với các tùy chọn nhiều lựa chọn, tốt hơn là nên kết hợp các giá trị với nhau sau một key duy nhất.
4/ Sắp xếp thứ tự tham số
Nếu cùng một tham số URL được sắp xếp lại, các trang sẽ được công cụ tìm kiếm hiểu là ngang nhau.
Do đó, thứ tự thông số không quan trọng từ góc độ duplicate content. Nhưng mỗi sự kết hợp đó có thể đốt cháy ngân sách thu thập thông tin và làm rối tín hiệu thứ hạng.
Tránh những vấn đề này bằng cách yêu cầu developer của bạn viết một tập lệnh để luôn đặt các thông số theo thứ tự nhất quán, bất kể người dùng đã chọn chúng như thế nào.
Theo ý kiến của mình, bạn nên bắt đầu với loại tham số dịch ngôn ngữ, tiếp theo là loại tham số xác định -> loại điều hướng trang, bộ lọc, sắp xếp, tìm kiếm và cuối cùng là tham số theo dõi (vì cái này thường là chúng ta chủ động làm).
Ưu điểm của cách này
- Sử dụng ngân sách thu thập thông tin hiệu quả hơn.
- Giảm các vấn đề về nội dung trùng lặp.
- Hợp nhất các tín hiệu xếp hạng cho ít trang hơn.
- Thích hợp cho mọi loại tham số.
Nhược điểm của cách này
- Bạn phải biết kỹ thuật (hoặc có người hỗ trợ phần code) và tốn kha khá thời gian
Thiết lập canonical URL Rel=”Canonical”
Thuộc tính rel = ”canonical” sẽ cho biết rằng một trang có nội dung giống hệt hoặc tương tự với một trang khác. Điều này khuyến khích các công cụ tìm kiếm hợp nhất các tín hiệu xếp hạng vào URL được chỉ định là chuẩn.
Thuộc tính rel = ”canonical” sẽ cho biết rằng một trang có nội dung giống hệt hoặc tương tự với một trang khác. Điều này khuyến khích các công cụ tìm kiếm hợp nhất các tín hiệu xếp hạng vào URL được chỉ định là chuẩn.
Bạn có thể rel = canonical các URL dựa trên tham số của mình thành URL thân thiện với SEO để theo dõi, xác định hoặc sắp xếp lại thứ tự các tham số. Nhưng chiến thuật này không phù hợp khi nội dung trang có URL tham số không đủ gần với trang chuẩn, chẳng hạn như điều hướng trang, tìm kiếm, dịch hoặc một số tham số lọc.
Nếu bạn sử dụng WordPress và plugin Rank Math giống mình, bạn có thể xem hướng dẫn chi tiết ở đây.
Nếu bạn sử dụng Yoast bạn có thể xem hướng dẫn ở đây.
Ưu điểm của cách này
- Kỹ thuật thực hiện tương đối dễ dàng.
- Giảm các vấn đề về nội dung trùng lặp.
- Hợp nhất các tín hiệu xếp hạng cho URL chuẩn.
Nhược điểm của cách này
- Vẫn lãng phí ngân sách thu thập thông tin trên các trang có tham số, không triệt để.
- Không phù hợp với tất cả các loại tham số.
Noindex tất cả những trang rác
Đặt lệnh noindex cho bất kỳ trang nào có tham số nhưng không thêm giá trị gì cho SEO. Thẻ noindex này sẽ ngăn các công cụ tìm kiếm lập chỉ mục trang.
Các URL có thẻ “noindex” cũng có khả năng được thu thập thông tin ít thường xuyên hơn và nếu nó tồn tại trong một thời gian dài cuối cùng sẽ dẫn đến việc Google không theo dõi các liên kết của trang.
Ưu điểm của cách này
- Kỹ thuật thực hiện tương đối dễ dàng.
- Giảm các vấn đề về nội dung trùng lặp.
- Thích hợp cho tất cả các loại tham số mà bạn không muốn lập chỉ mục.
- Xóa các URL dựa trên tham số hiện có khỏi chỉ mục.
Nhược điểm của cách này
- Sẽ không ngăn các công cụ tìm kiếm thu thập dữ liệu URL, nhưng sẽ khuyến khích chúng làm như vậy ít thường xuyên hơn.
- Không hợp nhất các tín hiệu xếp hạng.
Chặn bot thu thập dữ liệu bằng file robots.txt disallow
File robots.txt là thứ mà các công cụ tìm kiếm xem xét đầu tiên trước khi thu thập dữ liệu trang web của bạn. Nếu chúng thấy những vùng nào đó không được phép, nó sẽ không mò đến đó ngay và luôn.
Bạn có thể sử dụng file này để chặn trình thu thập thông tin truy cập vào mọi URL dựa trên tham số (với Disallow: / *? *) Hoặc chỉ đối với các chuỗi truy vấn cụ thể mà bạn không muốn được lập chỉ mục.
Ưu điểm của cách này
- Kỹ thuật thực hiện đơn giản.
- Cho phép sử dụng ngân sách thu thập thông tin hiệu quả hơn.
- Tránh các vấn đề trùng lặp về nội dung.
- Thích hợp cho tất cả các loại thông số mà bạn không muốn được thu thập thông tin.
Nhược điểm của cách này
- Không hợp nhất các tín hiệu xếp hạng.
- Không xóa các URL hiện có khỏi chỉ mục.
Sử dụng URL Parameter Tool trong Google Search Console
Thiết lập cấu hình URL Parameter Tool của Google để cho bot thu thập thông tin biết mục đích của các thông số của bạn và cách bạn muốn chúng được xử lý.
Tuy nhiên bạn phải rất cẩn thận với những điều chỉnh trong công cụ này vì sai một li đi một dặm. Bạn có thể đọc bài viết hướng dẫn chi tiết hơn ở đây.
Ưu điểm của cách này
- Không cần developer.
- Sử dụng ngân sách thu thập thông tin hiệu quả hơn.
- Ngăn chặn các vấn đề nội dung trùng lặp.
- Thích hợp cho tất cả các loại thông số.
Nhược điểm của cách này
- Không hợp nhất các tín hiệu xếp hạng.
- Chỉ giải quyết cho Google, không giải quyết cho các công cụ tìm kiếm khác.
Nên dùng Subfolder hay Subdomain thì tốt cho SEO hơn?
Có nhiều tranh luận về vấn đề này trên các diễn đàn SEO. Nhiều người nói rằng các subfolder tốt hơn cho SEO và kiên quyết sử dụng chúng. Đây là một kinh nghiệm tồn tại dựa trên một số nghiên cứu cũ.
Google đã nhiều lần nói rằng chọn một trong hai vẫn ổn.
Matt Cutts nói vào năm 2012:
Chúng gần như tương đương. Về cơ bản, tôi sẽ chọn cái nào dễ dàng hơn cho bạn về mặt cấu hình, CMS, tất cả những thứ đó… Cả hai đều nằm trên cùng một miền về tổng thể và vì vậy câu hỏi thực sự là cái nào dễ hơn cho bạn. Chọn bất kỳ điều gì khiến bạn hài lòng, tôi sẽ tiếp tục và làm theo cách đó.
Matt Cutts, Cựu Giám đốc Webspam Google
John Mueller cho biết vào năm 2017:
Google websearch ổn với việc sử dụng subdomain hoặc subfolder. Việc thực hiện các thay đổi đối với cấu trúc URL của trang web có xu hướng mất một chút thời gian để ổn định trong tìm kiếm, vì vậy tôi khuyên bạn nên chọn một thiết lập mà bạn có thể giữ lâu hơn.
John Mueller, Search Advocate Google
Chính xác ý của Google là: Sao cũng được!
Trong các hệ thống hiện đại ngày nay, chúng ta hoàn toàn có thể thay đổi tên và vị trí của subdomain hay subfolder trong cấu trúc URL chỉ trong vài phút.
Nhiều người làm SEO tin rằng các subdomain được coi như các tên miền riêng biệt, nhưng sự thật thì phức tạp hơn. Bất kỳ ai kết hợp subdomain như một phần chính của trang web sẽ có khả năng được xử lý chúng giống hệt như một subfolder.
Tuy nhiên, nếu bạn không coi các miền phụ là một phần của trang web chính của mình (có nghĩa là bạn không kết nối chúng bằng các liên kết nội bộ với những phần khác trên web) thì chúng có thể được coi là riêng biệt.
Ngay cả các sitelinks cũng là các liên kết đến các subdomain như trong case study của Disney:
Tương tự, có rất nhiều ví dụ trong đó các tên miền phụ khác nhau hiển thị dưới dạng liên kết trang web cho thương hiệu — Github, LinkedIn, Google, Amazon, Microsoft, Yahoo, Netflix, Walmart,…
Khi bạn chuyển đổi qua lại giữa subdomain và subfolder, có thể sẽ có các tác động thay đổi traffic bởi một số lý do:
Thay đổi tín hiệu tạm thời
Khi xuất hiện các trang mới hoặc các trang bị chuyển, Google sẽ gửi một tín hiệu tạm thời là: ”Chờ trang này ổn định rồi mình sẽ bắt đầu cào sau” bởi vì họ không chắc chắn là có nên thu thập thông tin, lập chỉ mục hay xếp thứ hạng cho trang này không. Bởi vậy nó sẽ có sự biến động tạm thời.
Các vấn đề về theo dõi hoặc đo lường
Vấn đề này có thể được thể hiện dưới nhiều hình thức khác nhau. Đó có thể là các vấn đề thiết lập phân tích, chẳng hạn như có thể hệ thống theo dõi subdomain không được thiết lập chính xác.
Cũng có thể là các vấn đề về thời điểm, chẳng hạn như đo lường mức tăng trưởng trong mùa có nhiều biến động, ví dụ như vào dịp lễ sale so với thời gian traffic trung bình hoặc bạn chuyển vào đúng ngay lúc Google cập nhật lõi (core update). .
Các trang bị chặn hoặc không được lập chỉ mục (noindex) trong file robots.txt
Nếu bạn chặn các trang được thu thập thông tin hoặc các trang ngăn lập chỉ mục, các tín hiệu sẽ không hợp nhất chính xác, có nghĩa là bạn có thể thấy sự sụt giảm trong quá trình chuyển đổi.
Về kiến thức chuyên sâu hơn, mình nghĩ bạn nên đọc hướng dẫn robots.txt của Ahrefs.
Thiết kế lại hoặc thay đổi nền tảng
Rất nhiều thứ khác nhau có thể thay đổi khi bạn thiết kế lại một trang web hoặc thay đổi nền tảng. Tất cả đều có thể khác nhau về CMS, tốc độ (pagespeed insights), heading, thay đổi URL không được redirect hoàn toàn hoặc những thứ khác…
Thay đổi liên kết nội bộ
Trong nhiều case study về subdomain và subfolder thì điều này diễn ra thường xuyên: Chuyển từ một subdomain riêng biệt không có internal link với một subfolder được liên kết đến trên mọi trang ở menu website. Tất nhiên là sẽ có một sự thay đổi lớn.
Đã xóa hoặc cập nhật nội dung
Thay đổi nội dung có nghĩa là xếp hạng và lưu lượng truy cập có thể thay đổi. Nếu bạn xóa nội dung có traffic, thì dĩ nhiên traffic sẽ giảm.
Kết luận
Về cơ bản, nếu bạn không dính vào các vấn đề trên, việc chuyển giữa subdomain và subfolder sẽ không có vấn đề gì quá nghiêm trọng xảy ra.
19 Phương pháp tốt nhất để làm SEO cho URL
Chúng ta đã đi qua rất nhiều vấn đề ở các phần trước về URL. Bây giờ là phần tổng hợp lại tất cả những thứ tốt nhất về URL để bạn áp dụng vào website của mình:
1. Viết cấu trúc URL cho người dùng, không phải cho Google Bot
URL phải được viết cho con người, không phải cho bot. Như bạn đã thấy trong các ví dụ ở các phần trước, URL ngắn hơn sẽ dễ nhìn hơn đối với mắt người.
Google đang dần hoàn thiện trí thông minh nhân tạo cho bộ máy của họ. Bởi vậy nó sẽ mô phỏng chính xác cách mà con người nhìn nhận URL như thế nào. Đây là định hướng quan trọng nhất khi bạn tối ưu URL.
2. Chọn tên miền dễ nhớ
Nếu bạn vẫn đang ở giai đoạn đầu của việc tạo website và chưa chọn tên miền, đừng lo lắng về việc tên miền của bạn có từ khóa hay thể hiện chính xác 100% tên doanh nghiệp. Bạn chỉ cần có một tên miền dễ nhớ và dễ làm thương hiệu là được.
Dưới đây là những gì John Mueller của Google đã nói về các tên miền có nhiều từ khóa:
… Chỉ vì có các từ khóa nằm trong một tên miền không có nghĩa là nó sẽ tự động xếp hạng cho các từ khóa đó. Và đó là điều đã xảy ra trong một thời gian rất dài.
3. Chọn đuôi tên miền (TLD) thích hợp
Trên thực tế, TLD không ảnh hưởng trực tiếp đến thứ hạng. Nhưng những gì quen thuộc với người dùng sẽ là tăng niềm tin cho người dùng.
Khi mọi người tin tưởng miền của bạn, nó sẽ tác động tích cực đến SEO tổng thể. Và theo một khảo sát của Growth Badger thì mọi người vẫn có sự tin tưởng tên miền .com cao nhất.
Và mức độ dễ nhớ của đuôi .com cũng cao hơn so với những đuôi khác theo khảo sát:
Có thể tên miền “.com” của bạn đã có người lấy (đã có hơn 124 triệu miền “.com” vào năm 2016). Nhưng dù gì đi nữa, hãy cố gắng chọn được một tên miền .com.
Bạn có thể vào trang Instant Search Domain để tìm thêm các biến thể thích hợp nhé.
Trong trường hợp bạn không chọn được tên miền .com, bạn hoàn toàn có thể sử dụng .vn nếu khách hàng/khán giả mà bạn nhắm đến ở thị trường Việt Nam.
4. Sử dụng https (đăng ký chứng chỉ SSL)
Bảo mật trực tuyến là một vấn đề lớn hiện nay. Với tình trạng tội phạm mạng và trộm cắp danh tính đang gia tăng, người dùng Internet muốn biết rằng họ đang sử dụng kết nối an toàn.
Mức độ thiệt hại về tiền bạc do tội phạm mạng đã tăng từ năm 2001 đến năm 2015.
HTTPS (Hyper Text Transfer Protocol Secure) xuất hiện trong URL khi một trang web được bảo mật bằng chứng chỉ SSL. Bạn có thể xem chi tiết của chứng chỉ, bao gồm cơ quan cấp và tên công ty của chủ sở hữu trang web bằng cách nhấp vào biểu tượng ổ khóa trên thanh trình duyệt.
Nếu website bạn chưa có chứng chỉ SSL (và website của bạn đang là http thay vì https), mình khuyên bạn nên sử dụng ngay và luôn. Bởi nó cũng là một yếu tố xếp hạng của Google.
Hosting Azdigi (hosting mà mình đang sử dụng cho website này) cung cấp MIỄN PHÍ chứng chỉ SSL cho bất kỳ khách hàng nào đăng ký dịch vụ hosting của họ.
Bạn cũng rất dễ để đăng ký các chứng chỉ cao cấp hơn cho doanh nghiệp ngay trên website của họ.
Họ support rất nhanh, bạn chỉ cần gửi yêu cầu họ sẽ back lại trong vòng chưa đến 5p!
5. Luôn sử dụng từ khóa chính trong URL
Về cơ bản, 99% tiêu đề của trang đều có chứa keyword một cách tự nhiên, nên việc của chúng ta là làm sao để có thể rút ngắn nó lại cho phù hợp để nhìn vừa đơn giản lại vừa dễ hiểu.
Tuy nhiên cần tránh nhồi nhét từ khóa vào URL. Như trong ví dụ này:
Thậm chí nếu bạn chỉnh lại thành:
https://leapcontent.vn/content-marketing-la-gi-vi-du-content-marketing/
Thì vẫn là lựa chọn không ổn.
Vậy nên hãy sử dụng duy nhất 1 từ khóa chính thôi nhé!
6. Chỉ dùng subdomain khi bạn thực sự cần
Vâng. Dù cho sự thật là Google nhiều lần nói về việc sử dụng subdomain và subfolder là như nhau (như mình đã trình bày ở phần trước). Nhưng thực tế hiện nay là có nhiều trường hợp chuyển từ subdomain sang subfolder lại tăng traffic:
Hoặc như thế này:
Không ai biết lý do tại sao. Có thể đôi lúc Google vẫn xem các subdomain là website riêng nếu như bạn không làm tốt những phần kỹ thuật về liên kết và những vấn đề mà mình đã đề cập ở phần trước.
Vậy nên cuối cùng, lời khuyên vẫn là chỉ dùng khi bạn thực sự cần. (và bạn cần nắm rất chắc kỹ thuật SEO khi triển khai subdomain)
7. Sử dụng subfolder để thể hiện thứ bậc content
Hãy nhìn đường dẫn thư mục trên window:
Và đường dẫn thư mục trên web:
Bạn có thấy sự tương đồng không? Nếu xóa đi một phần trên đường dẫn của window thì nó sẽ quay về thư mục mẹ:
Và website cũng thế:
Về tổng quan, URL có chức năng là những URL định dạng linh hoạt mà trong đó người dùng có thể chỉ cần xóa một phần của URL thì họ có thể quay lại thư mục mẹ.
Cấu trúc URL cũng sẽ phản ánh cấu trúc website của bạn. Cấu trúc của chúng sẽ giống như sau:
https://webcuaban.com/level1/level2/level3/
Subfolder còn cung cấp nhiều thông tin bổ ích hơn là cảm giác mọi thứ được sắp xếp có thứ bật.
Ví dụ như URL này:
domain.com/airpods.html
Thì cảm quan người đọc nhìn lướt qua sẽ không thể nào biết được đây là trang bán airpods hay review airpods, hay là bài blog về cập nhật tính năng airpods mới…
Tuy nhiên với URL này:
domain.com/shop/earbuds/apple/airpods.html
Thì đây rõ ràng là URL của trang sản phẩm bán AirPods.
Ngoài ra nó còn cho chúng ta biết các thông tin:
- Tai nghe chỉ là một trong những loại sản phẩm được cung cấp từ cửa hàng online này.
- Apple sản xuất sản phẩm này và có nhiều tai nghe khác được bán từ cùng thương hiệu này.
- Có thể có các nhãn hiệu tai nghe earbuds khác được bán trong cửa hàng.
- Việc sử dụng các subfolder cũng giúp kết hợp các từ khóa vào URL dễ dàng hơn mà không làm cho nhìn giống như spam.
Spam URL: domain.com/ban-tai-nghe-chinh-hang-apple-airpods-earbuds.html
Không spam URL: domain.com/shop/earbuds/apple/airpods.html
8. Không cố gắng làm ngắn URL nếu nó không thân thiện với người dùng
Như trong ví dụ ở trên, nếu bạn có một trang web ecommerce bán tạp hóa với rất nhiều mặt hàng khác nhau thì bạn không nhất thiết phải rút ngắn mọi thứ lại để bỏ mất phần subfolder trong URL.
Bởi người dùng hoàn toàn có thể bỏ bớt phần slug để hiển thị trang category mà họ muốn xem, chứ không chỉ là nhấp vào mục lục rồi rà lại category đó nằm ở đâu trong đống menu dài và nhiều của website bạn.
9. Dùng subfolder vừa đủ, không lạm dụng
Nhiều người làm SEO nghĩ rằng, nếu có quá nhiều subfolder sẽ làm cho URL dài ra, mà URL dài thì rank không tốt bằng URL ngắn. Tuy nhiên Google đã có câu trả lời cho việc này là không chính xác.
Do cách thức hoạt động của phần lớn các CMS hiện nay, việc có nhiều subfolder trong một URL thường là dấu hiệu cho thấy một trang bị “chôn sâu đến tận cùng xã hội”. Điều này không ổn lắm nếu bạn muốn người dùng (và các công cụ tìm kiếm) có thể dễ dàng tìm thấy trang.
Bởi vậy, chúng ta có một lời khuyên khác về cấu trúc website mà bạn nên áp dụng là cố gắng tối đa từ trang chủ chỉ cần không quá 3 click để người dùng có thể đến bất kỳ thư mục con/sản phẩm/bài viết nào trên trang web mà họ muốn.
10. Tránh việc lặp từ
Việc lặp lại các từ khóa trong URL sẽ khiến chúng nhìn như spam.
Bạn thường dễ dàng tránh được điều này khi tạo slug URL, nhưng rất dễ mắc phải sai lầm này khi sử dụng subfolder.
Ví dụ hãy xem URL của trang này:
leapcontent.store.us/c/men/mens-shoes/mens-sneakers
Nó lặp lại từ “men” ba lần.
Mặc dù đây không phải là một vấn đề lớn, nhưng việc lặp lại là không cần thiết. Như thế này có lẽ sẽ tốt hơn:
leapcontent.store.us/c/men/shoes/sneakers
11. URL càng ngắn càng tốt
Ở nghiên cứu của Backlinko (ở phần trên mà mình đã đề cập) thì URL ngắn sẽ dễ có thứ hạng cao hơn URL dài. Tuy nhiên nó nên thỏa mãn các điều kiện ở trên trước khi nó được rút ngắn lại trong slug với từ khóa chính.
Google cũng đã nói rằng đây là điều nên làm để các URL càng đơn giản càng tốt và đây là một vài lý do cho điều đó:
Đầu tiên, khách truy cập có thể bị “sốc nhẹ” bởi các URL quá dài.
Thứ hai, các URL dài thường bị cắt bớt trong kết quả tìm kiếm.
Vì vậy, hãy xóa bất kỳ thứ gì chúng ta không cần khỏi URL của mình, nhất là các từ nối như “của”, “ở”, “trong”, “trên”, “và”, “hoặc”,…
Lưu ý
Mục đích không phải là làm cho URL của bạn ngắn đến mức không còn mô tả chính xác nội dung của nó nữa. Mà là loại bỏ các từ và cụm từ không cần thiết.
12. Đừng thêm ngày vào URL
Trước đây các CMS thường mặc định thêm ngày vào URL của bạn.
Điều này không còn tốt cho thời điểm này và tương lai nữa. Nhưng mình vẫn thấy có khá nhiều người vẫn còn sử dụng ngày trong URL. Nó có thể dẫn đến những vấn đề rất tệ.
Lý do đầu tiên, nó làm URL dài hơn. Vd: URL của bài viết này nếu được thêm ngày nó sẽ là:
Lý do thứ hai, nó sẽ làm cho bạn rất khó cập nhật content.
Vd bạn đăng một bài viết vào năm 2020, thì sẽ rất khó nếu bạn muốn cập nhật nó trong năm 2021 hay các năm sau đó. Đổi URL thì Google sẽ nghĩ là content khác, nhưng nội dung không quá khác biệt nhiều thì sẽ bị lỗi trùng lặp nội dung.
(Dĩ nhiên, bạn hoàn toàn có thể redirect 301 về URL mới. Tuy nhiên nếu bạn có hơn 100 bài cần cập nhật thì đó là câu chuyện hoàn toàn khác…)
Bởi vậy tốt nhất: đừng để ngày trong URL.
Nếu bạn sử dụng WordPress, bạn có thể điều chỉnh nó trong phần Settings > Permalinks.
13. Không sử dụng ký tự đặc biệt trong slug
Bạn đã bao giờ thấy một URL có dấu ngoặc đơn ( ) hoặc dấu ngoặc vuông [ ] chưa?
Có thể là chưa, vì đây là những ký tự không an toàn không nằm trong thành phần thuộc URL bình thường.
Bạn nên xóa những ký tự này, nhưng cũng đừng quên xóa các ký tự đặc biệt khác như dấu phẩy, dấu hai chấm, dấu chấm phẩy,…
Dưới đây là những gì John Mueller của Google nói về những điều này:
Nói chung, tôi khuyên bạn nên tránh các ký tự đặc biệt như dấu phẩy, dấu chấm phẩy, dấu hai chấm, dấu cách, dấu ngoặc kép,… trong URL, để giúp mọi thứ trở nên đơn giản. Các URL như vậy thường khó liên kết tự động hơn (khi ai đó đăng bài trong diễn đàn hoặc nơi khác) và chúng tôi rất khó nhận ra chính xác khi chúng tôi phân tích cú pháp nội dung văn bản để cố gắng tìm các URL mới.”
Bên dưới là bảng các từ an toàn và không an toàn:
14. Đừng thêm số vào slug
Tương tự như việc thêm ngày vào URL, chúng ta đâu chắc chắn được là sau này số lượng mà chúng ta đề cập trong bài viết sẽ không thay đổi sau vài lần cập nhật nội dung.
Sự khác biệt về con số trong kết quả tìm kiếm cũng có thể làm người đọc bối rối.
Bởi vậy tốt nhất là đừng để con số vào URL.
15. Thêm vào từ mô tả (nếu cần)
Việc sử dụng chính xác các từ khóa cho slug URL thường có ý nghĩa, nhưng không phải lúc nào cũng vậy. Đôi khi bạn sẽ thấy nó thiếu tính mô tả.
Cách đơn giản để giải quyết vấn đề này là thêm từ mô tả chi tiết hơn.
Vd với từ khóa “tôn” thì trong sản phẩm tôn sẽ có rất nhiều loại tôn khác nhau như “tôn lạnh”, “tôn mát”, “tôn cất nóc”, “tôn sáng”,…
Trừ khi bạn viết một bài về tổng hợp các loại tôn, nếu không hãy thêm các từ bổ trợ mô tả để người đọc biết chính xác đó là bài viết về loại tôn gì.
16. Chỉ viết thường, không viết hoa
Hầu hết các web server xử lý URL viết thường và viết hoa giống nhau, nhưng điều này không phải lúc nào cũng đúng. Về mặt kỹ thuật, mọi thứ sau tên máy chủ (tên miền) trong URL đều phân biệt chữ hoa chữ thường và một số máy chủ sẽ xử lý chúng theo cách khác.
Để an toàn và tránh các vấn đề tiềm ẩn về trùng lặp nội dung, hãy LUÔN LUÔN sử dụng URL viết thường.
Nếu bạn đang sử dụng WordPress, bạn có thể bỏ qua phần này vì nó diễn ra tự động. Bên dưới là mình đang sử dụng Rank Math để điều chỉnh permalink:
17. Thay dấu cách (khoảng trống) bằng dấu gạch ngang
URL không được nhập khoảng trắng. Trình duyệt sẽ tự động viết lại thành “%20”.
Vì vậy, hãy thay thế tất cả các khoảng trắng bằng dấu gạch ngang ( – ).
Bạn có thể sử dụng dấu gạch dưới ( _ ) để thay thế không?
Vào năm 2016, Google nói rằng họ không quan tâm liệu URL của bạn có chứa dấu gạch ngang hoặc dấu gạch dưới hay không. Điều này vẫn đúng dưới góc độ ranking, nhưng vì mọi người thường quen thuộc hơn với dấu gạch ngang hơn, nên ưu tiên sử dụng chúng có thể là điều hợp lý.
Đây cũng là khuyến nghị chính thức của Google:
Chúng tôi khuyên bạn nên sử dụng dấu gạch ngang (-) thay vì dấu gạch dưới ( _ ) trong URL của mình.
18. Tránh URL Parameter nếu có thể
Nếu website bạn không phải là website Ecommerce. Hãy cố gắng loại bỏ URL Parameters không cần thiết.
Ngay cả bạn là website ecommerce thì cũng khó tránh khỏi việc trùng lặp content khi dùng URL parameters.
Hãy xem sự thay đổi trong URL khi lựa chọn phong cách quần legging trong ví dụ ở dưới:
Những cách giải quyết cụ thể hơn thì mình đã đề cập ở phần trước, cả ưu và nhược của từng cách nhé.
19. Tránh việc chuyển hướng (redirect) nhiều lần một URL
Vấn đề này rất dễ xảy ra khi chúng ta cập nhật content.
Nếu người dùng hoặc trình thu thập thông tin yêu cầu URL A, nhưng khi click vào thì URL này chuyển hướng đến URL B -> OK nhé.
Thậm chí vẫn còn ổn nếu URL B sau đó chuyển hướng đến URL C (sẽ tốt hơn nếu trỏ URL A trực tiếp đến URL C, nhưng vẫn chấp nhận được). Tuy nhiên, nếu chuỗi chuyển hướng URL tiếp tục sau hai bước, bạn có thể gặp rắc rối ở 2 khía cạnh:
- Về các công cụ tìm kiếm: Nói chung, các công cụ tìm kiếm vẫn sẽ lần mò theo các bước chuyển hướng dài hơn 2 bước như ví dụ trên, nhưng Google cũng đã khuyến nghị rằng điều này sẽ làm URL trở nên ít “quan trọng” hơn (trong mắt họ), và có thể họ sẽ không theo dõi hoặc đếm các tín hiệu xếp hạng của các URL chuyển hướng quá dài.
- Về trình duyệt và người dùng: Đây là rắc rối lớn hơn nhiều, cả hai đều bị chậm lại, và trên mobile có khi còn siêu chậm hơn nữa do các chuỗi chuyển hướng dài gây ra. Sau 3s người dùng không vào được đúng trang họ cần, họ sẽ thoát! Bởi vậy, giữ chuyển hướng ở mức tối thiểu nhé (khuyến nghị là chỉ nên dùng 1 lần).
Tổng kết
Giờ bạn đã hiểu rõ tường tận URL là gì và những vấn đề xoay quanh nó.
Dù thực tế là bạn sẽ không mất quá nhiều thời gian cho việc thiết lập URL thân thiện với SEO nhưng việc hiểu một cách tường tận cách tiếp cận nào là hợp lý nhất sẽ đem lại kết quả SEO lâu dài cho website của bạn.
Khi bạn làm vài lần, bạn chỉ tốn vài phút để thực hiện hết tất cả những bước tối ưu đề cập trong bài.
Mình có đang bỏ sót vấn đề nào quan trọng về URL không?
Comment bên dưới cho mình biết suy nghĩ của bạn nhé!
Mình từ agency SEO nhưng cũng học hỏi rất nhiều từ bài post của bạn, chúc bạn luôn tràn đầy năng lượng và viết nhiều hơn về chủ đề SEO bạn nhé.
Trân trọng
Cảm ơn bạn. Rất vui vì bài viết giúp ích được cho bạn 😀