Cơ sở máy học cho nội dung và kết quả SEO tốt hơn

bigseo

Lớp 1
19/11/13
116
7
18
#1
Chắc hẳn tất cả chúng ta đều đã nghe đến thuật ngữ Machine Learning hay “máy học” và “thuật toán học” nhưng liệu có bao nhiêu người thực sự hiểu về chúng? Bạn có hiểu chúng có khả năng học những gì và cách chúng học ra sao? Nếu không, đây sẽ là một thông tin rất hữu ích cho bất kỳ SEO hoặc người viết nội dung…vì họ là những người sẽ làm nhiều công việc giảng dạy.


Trước tiên, điều quan trọng cần phải nhớ rằng một thuật toán chỉ đơn giản là một quá trình toán học. Đừng mong đợi để xem trí tuệ nhân tạo thực sự xuất hiện bất cứ lúc nào. Tuy nhiên, một thuật toán học có thể phát hiện các mô hình và những mô hình có thể được phân tích xác suất. Điều này bạn đã nhìn thấy trực tuyến trong một thời gian và hãy suy nghĩ nó dưới dạng mô hình.

Loại máy học quy trình

Tùy thuộc vào những gì người lập trình đang tập trung vào phương pháp tiếp cận khác nhau để có thể được thực hiện. Ngay cả trong tìm kiếm, có thể có trọng tâm khác nhau.

Các phương pháp phổ biến nhất là lập luận thống kê và lập luận quy nạp (trước bất kỳ goes ballistic (tên lửa điều khiển), tôi nhận ra rằng “lập luận” được coi là không chính xác cho máy nhưng trong bối cảnh này thì đó là một thuật ngữ chung).

Lập luận thống kê

Lập luận thống kê đơn giản là tập hợp dữ liệu và phân tích xác suất của sự xuất hiện trong tương lai sau kết quả quan sát.
Ví dụ, nếu một thuật toán quan sát 80% các trường hợp quan sát thấy con quạ là màu đen thì nó sẽ suy ra rằng xác suất 80% con quạ quan sát trong tương lai cũng có màu đen.

Lập luận quy nạp

Lập luận quy nạp là hơi tương tự, trong đó nó cũng liên quan đến xác suất ngoại suy nhưng nó hướng tới chứng minh hoặc bác bỏ một lý thuyết cụ thể. Ví dụ, nếu lý thuyết là một con chó giật mình sẽ mang đến một mối đe dọa thì nó sẽ thu thập kết quả từ kiểm tra và chứng thực hoặc làm mất uy tín lý thuyết dựa vào ưu thế của kết quả quan sát được.

Cả mô hình lý luận thống kê cũng như quy nạp đều cho phép đưa vào các kết quả ngẫu nhiên cho đến khi chúng đại diện cho một tỷ lệ phần trăm đáng kể của kết quả quan sát. Đến lúc đó, các mô hình xác định chúng có thể trở thành một yếu tố trong mô hình thống kê, trong khi ở mô hình quy nạp thì chúng sẽ chỉ ảnh hưởng đến kết quả gián tiếp.

Làm thế nào để chúng được áp dụng trong các thuật toán tìm kiếm?

Giả sử rằng một thuật toán cho trước được thiết kế để xác định giá trị SERPs là một truy vấn. Nó có thể nhìn vào một yếu tố như tỷ lệ trả lại là một chỉ số có giá trị. Nếu người dùng không phá vỡ ngưỡng trả lại đó thì kết quả có thể được coi là có liên quan đến truy vấn và chỉ ra rằng các thuật toán xếp hạng là chính xác mà có thể được sử dụng lập luận thống kê.

Mặt khác, một thuật toán được thiết kế để phát hiện các liên kết được mua có thể nhìn vào những thứ như các trang khác được liên kết đến từ một trang nguồn nơi các trang đích đã được tìm thấy để được mua các liên kết, nó có thể thiết lập một số mức độ xác suất trang của bạn cũng đã mua một liên kết từ trang web đó. Sau đó nó sẽ kiểm tra các tín hiệu khác để khẳng định khả năng có thể xảy ra.

Liệu chúng ta có biết các công cụ tìm kiếm thực sự sử dụng các mô hình này trong các kịch bản nào? Không, tất nhiên là không rồi. Nó chỉ là một trong nhiều khả năng. Vậy một thuật toán máy học có thể tìm hiểu những gì?

Các mô hình thống kê là khá rõ ràng. Một khi các thuật toán quyết định rằng 80 phần trăm con quạ có thể sẽ là màu đen, nó chỉ đơn giản là có thể trọng số dự đoán của nó phù hợp; một trọng số xác suất hoàn toàn dựa trên số liệu thống kê.
Trong các mô hình quy nạp thì quá trình này tinh tế hơn một chút. Thông thường, sẽ có một số tín hiệu khác, mỗi trọng số có thể khác nhau phụ thuộc vào tỷ lệ của chúng. Điều này có nghĩa là xác suất có một đường cong phi tuyến tính mà có thể phức tạp hơn nhiều.

Trong ví dụ trên, những thứ như có bao nhiêu trang web mục tiêu khác liên kết đến từ trang nguồn bị nghi là mua các liên kết, các trọng số xác suất của những nghi ngờ, lịch sử của tất cả các trang web liên quan đến việc phân tích và một loạt các tín hiệu khác. Kết hợp với một số công thức toán học, một yếu tố xác suất có thể xảy ra mà có thể đặt các trang web trên một ngưỡng định sẵn gây ra sự suy giảm hoặc một hình phạt.

Ứng dụng máy học trong truy vấn tìm kiếm và xếp hạng

Vậy những điều mà thuật toán có thể học và không thể học là những gì? Như tôi đã nói, trí tuệ nhân tạo vẫn là một giấc mơ xa vời. Tuy nhiên, theo cá nhân tôi thì nó có thể làm được hầu như tất cả mọi thứ. Ví dụ, một quyết định đơn giản đó là nó có thể xem một truy vấn hoặc một cụm từ trên trang là tiêu cực hay tích cực. Đặc tính phức tạp hơn như châm biếm, chế nhạo hay tính hài hước. Tuy nhiên, phần lớn vẫn còn vượt quá sự hiểu biết của máy. Nhưng lục soát một truy vấn tìm kiếm để tìm một tấm gương xấu [ví dụ về trung tâm dịch vụ khách hàng] sẽ biểu hiện trên trang kết quả đầu tiên với các thuật ngữ "xấu", "nghèo" và "tồi tệ nhất" về nội dung, tiêu đề hoặc URL.


Đây có vẻ như là một ví dụ đơn giản nhận biết từ đồng nghĩa cho các truy vấn tìm kiếm nhưng hãy nhớ rằng nhận dạng từ đồng nghĩa chỉ là một trong những bước nhỏ trong tìm kiếm. Nhìn vào một truy vấn tìm kiếm một cách tinh tế [ví dụ không tốt về dịch vụ khách hàng] cho ra những trang như:


Vì vậy, đối với các thuật toán thì “không tốt” đồng nghĩa với “xấu”. Hãy yên tâm rằng Google đã không tự nhập tất cả các mối quan hệ có thể đó bởi nó có quá nhiều. Điều này tốt hơn hết là phát triển một thuật toán liên tục điều chỉnh từ vựng khi nó phát hiện ra mô hình.

Máy học và nội dung của bạn

Các thuật toán học từ các mô hình chúng phát hiện cả trong các truy vấn và các văn bản cũng như các mối quan hệ mà chúng phát hiện ra giữa chúng. Đó là lý do tại sao khi viết nội dung sử dụng các thuật ngữ bao quát hơn (không chỉ có danh từ và động từ mà còn bao gồm cả tính từ và trạng từ) có tác dụng kép:

- Nó cung cấp cú pháp mới trong bối cảnh cụ thể có thể hỗ trợ quá trình học của các thuật toán.
- Nó cũng cho phép bạn viết nội dung khái niệm hơn – hướng dẫn cho độc giả chứ không phải là cho công cụ tìm kiếm.

Kết quả cuối cùng là phát triển nhanh chóng sự hiểu biết phức tạp bằng máy – trái tim của ngữ nghĩa. Nó cũng giúp bạn cung cấp nội dung nhiều thông tin hơn, giải trí và hấp dẫn độc giả của bạn. Tôi gọi đó là hai bên cùng có lợi.

- Bài viết của tác giả Doc Sheldon (SearchEngineLand).
- Ghi rõ nguồn www.thegioiseo.com khi đăng lại bài viết này.
 
Sửa lần cuối bởi điều hành viên:

Bạn có quan tâm?

Donate

Thảo luận nhiều nhất