Đôi khi bạn thực hiện tìm kiếm trên Google, thay vì trả về kết quả là các liên kết, Google sẽ đưa về nhiều thông tin hữu ích hơn như: đánh giá bài viết, thông tin thêm về bộ phim, logo và lịch sử các công ty, địa điểm,… Những thông tin này gọi là kết quả chi tiết (rich resutls), có được là nhờ thông tin thu thập từ dữ liệu có cấu trúc (structured data). Bài viết này mình sẽ giới thiệu về dữ liệu có cấu trúc, cách kiểm tra và sử dụng.
Dữ liệu có cấu trúc không giúp tăng hạng trong kết quả tìm kiếm trả về, nhưng rõ ràng là kết quả tìm kiếm với kết quả chi tiết (rich results) sẽ giúp tăng tỷ lệ click cho bạn. Bên dưới là một ví dụ về kết quả chi tiết (rich resutls) trong một bài viết trên Vietrick. Các thông tin chi tiết gồm: đánh giá bài viết (rating), các câu hỏi thường gặp (FAQ).
Giới thiệu
Dữ liệu có cấu trúc là gì? Dữ liệu có cấu trúc (structured data) là dữ liệu được tổ chức và phân loại trong các trường theo một cấu trúc được quy định sẵn. Google sử dụng các dữ liệu có cấu trúc thu thập được từ trang web của bạn để phục vụ các đặc trưng như kết quả chi tiết (rich results).
Hướng dẫn thiết lập
Định dạng (Format)
Có nhiều loại định dạng dữ liệu, tuy nhiên để tương thích với đặc trưng kết quả chi tiết (rich resutls) từ Google, nội dung website của bạn cần được định dạng theo 3 loại sau:
- JSON-LD
- Microdata
- RDFa
Sau khi đã chọn lựa chọn được định dạng phù hợp với cấu hình trang website bạn, chúng ta cần sử dụng định dạng này theo thư viện markup. Có 2 loại cấu trúc thư viện phổ biến hiện nay là schema.org và data-vocabulary.org markup. Hầu hết các công cụ tìm kiếm đều hỗ trợ tốt 2 loại markup này. Theo thông tin từ developers.google.com, Google cũng đang sử dụng schema.org cho rich results của họ. Vậy nên các bạn hãy cấu hình dữ liệu theo cấu trúc của Schema.org nhé.
Nếu trang blog của bạn có sử dụng data-vocabulary markup, hãy xem hướng dẫn sữa lỗi Breadcrumb: data-vocabulary.org schema deprecated.
Bên dưới là một ví dụ về sử dụng định dạng JSON-LD của Vietrick theo cấu trúc AggregateRating được chèn trong thẻ <head>
:
<script type="application/ld+json">{
"@context": "https://schema.org/",
"@type": "CreativeWorkSeries",
"name": "Các yếu tố ảnh hưởng đến SEO offpage [2020]",
"aggregateRating": {
"@type": "AggregateRating",
"ratingValue": "4.9",
"bestRating": "5",
"ratingCount": "41"
}
}</script>
Sau khi thiết lập xong, các bạn có thể sử dụng công cụ kiểm tra dữ liệu có cấu trúc của Google để kiểm tra trang web của mình có phù hợp với tiêu chuẩn của Google hay không.
Access
Đảm bảo không chặn Google bot truy cập trang chứa dữ liệu của bạn bằng tệp robots.txt, noindex meta hoặc các phương thức khác. Các bạn có thể sử dụng Google Search Console để kiểm tra.
Sau khi thực hiện cấu hình hoàn tất với dữ liệu, các bạn có thể kiểm tra xem trang web của mình có hỗ trợ kết quả chi tiết không nhờ vào công cụ kiểm tra kết quả chi tiết (rich results).
Nội dung
Những phần đánh giá nội dung sau đây không dễ dàng đo lường bằng cách sử dụng các công cụ kiểm tra. Tuy nhiên bạn nên tuân thủ theo các yêu cầu về nội dung bên dưới để tránh bị Google đánh dấu là spam.
Chất lượng nội dung
Nội dung bài viết trên trang web của bạn cần đảm bảo tuân thủ các điều kiện sau:
- Tuân thủ theo hướng dẫn về nội dung của Google.
- Cập nhật nội dung mới nhất, những bài viết có nội dung lỗi thời sẽ không Google sử dụng.
- Cung cấp nội dung gốc, tránh sao chép bài viết.
- Đảm bảo dữ liệu có cấu trúc hiển thị đến người đọc. Ví dụ bạn dùng JSON-LD cho việc đánh giá một bộ phim, hãy đảm bảo các thông tin như điểm đánh giá hiển thị với người đọc trong nội dung HTML.
- Không đưa các dữ liệu không liên quan đến nội dung. Ví dụ đưa dữ liệu cấu trúc đánh giá về một cuốn sách trong bài viết đánh giá một bộ phim khác.
- Không chứa các nội dung thúc đẩy, liên quan đến bạo lực, ấu dâm, kích động bạo lực và thù hận.
- Không dùng dữ liệu có cấu trúc cho các nội dung bất hợp pháp.
Tính liên quan
Các dữ liệu cung cấp nên có liên quan chặt chẽ đến nội dung trang web/ bài viết của bạn. Ví dụ:
- Nếu bạn có chương trình livestream, nên sử dụng nhãn broadcasts cho nội dung này.
- Một bài viết hướng dẫn nấu nướng nên dùng nhãn recipes.
Cung cấp đầy đủ thông tin
Các dữ liệu mà bạn cung cấp phải đảm bảo đầy đủ các thông tin thiết yếu. Các bạn nên cung cấp càng chi tiết và đầy đủ các trường dữ liệu càng tốt.
- Việc bạn cung cấp đầy đủ và chi tiết càng giúp công cụ tìm kiếm hiểu rõ hơn về nội dung bài viết của bạn.
- Nội dung bạn cung cấp đầy đủ và chi tiết giúp nâng cao chất lượng kết quả tìm kiếm trả về cho người đọc.
Vị trí
Dữ liệu có cấu trúc cần được đặt ở trong trang chứa nội dung mà nó hiển thị trừ trường hợp đặc biệt cần được lưu trữ ở tài liệu khác.
Nếu trang web của bạn bị trùng lặp nội dung, bạn cũng nên đặt cùng 1 nội dung dữ liệu có cấu trúc y như vậy, chứ không nên chứ dùng ở mỗi trang chính(caninocal page).
Sử dụng cấu trúc chính xác
Hãy cố gắng sử dụng đúng loại nhãn dữ liệu với loại dữ liệu mà bạn cung cấp dựa trên danh sách các nhãn ở trên schema.org.
Hãy tuân thủ theo hướng dẫn về các loại nhãn được Google hỗ trợ.
Hình ảnh
Khi bạn cung cấp hình ảnh cho dữ liệu có cấu trúc, hãy đảm bảo cung cung cấp hình ảnh chính xác cho đối tượng.
Tất cả các hình ảnh mà bạn dùng đều phải được phép thu thập bởi bot của Google. Nếu bạn không chắc, hãy dùng Google Search Console để kiểm tra lại nhé.
Sử dụng nhiều loại cấu trúc khác nhau
Các bạn hoàn toàn có thể sử dụng nhiều loại cấu trúc khác nhau trên trang web, miễn là bạn đảm bảo nội dung đó hiện hữu đối với người dùng.
Nếu mình kết hợp sử dụng json-ld song song với microdata thì có ảnh hưởng gì ko bạn?
Bác cứ sử dụng bình thường, miễn là không chồng chéo dữ liệu với nhau là được 😀