Search Engines là gì? Cơ chế hoạt động của các Search Engines
Tóm tắt
Search Engines là gì?
Search Engines (Web Search Engine) có thể hiểu là các công cụ tìm kiếm, bộ máy tìm kiếm hay các hệ thống tìm kiếm và xử lý thông tin trên mạng Internet. Nhiệm vụ của các bộ máy này là nhận thông tin về một từ khóa cụ thể của người dùng, sau đó trả về danh sách là các văn bản, các thiết kế website hay nội dung, hình ảnh có liên quan đến từ khóa đó.
Để làm được điều này, các bộ máy tìm kiếm sẽ gửi những “con nhện” (spider, robot) đi khắp các website có liên quan đến từ khóa người dùng tìm kiếm trên mạng Internet để thu thập càng nhiều dữ liệu càng tốt, sau đó, một chương trình khác bên trong (có tên gọi là anindexer) sẽ tiến hành chắt lọc và lựa chọn ra các địa chỉ phù hợp và có tiềm năng mang lại thông tin hữu ích cho người sử dụng.
Mỗi một bộ máy tìm kiếm sẽ sử dụng các thuật toán phân tích khác nhau để cho ra các kết quả có liên quan đến câu truy vấn / lệnh tìm kiếm.
Một bộ máy tìm kiếm cơ bản hiện nay bao gồm các lớp các phần mềm, chương trình, tuy nhiên, theo thói quen, người dùng mạng vẫn thường hay mô tả search engines nhu là các website tìm kiếm phổ biến như Google, Bing, Yahoo…
Cơ chế hoạt động của các Search Enginees
Mỗi search engine sẽ dùng một thuật toán phức tạp khác nhau để tổng hợp và phân tích kết quả, sau đó hiển thị các kết quả này trên SERP (Search Engine Result Page) – trang hiển thị kết quả tìm kiếm. Thuật toán tìm kiếm của các công cụ tìm kiếm này tiến hành quét và phân tích các thành phần cơ bản của một trang web như tiêu đề trang, nội dung và số lượng keyword, rồi sau đó xếp hạng (ranking) để phân định thứ tự hiển thị của website đó trên SERP.
Thông thường, các search engine khác nhau sẽ sử dụng các thuật toán khác nhau để đánh giá và phân tích các trang web nên đôi khi bạn sẽ thấy một trang đứng vị trí top 1 của Yahoo sẽ lại nằm ở các vị trí khác bên công cụ tìm kiếm Google và ngược lại.
Các thuật toán này vô cùng bảo mật và liên tục được cập nhật, thay đổi (tùy theo thời điểm, sự kiện và nhu cầu cuar người dùng) để đảm bảo mang lại những trải nghiệm tìm kiếm tốt hơn cho người dùng mạng Internet.
Dù khác nhau về thuật toán sắp xếp nhưng hầu hết các Search Engines đều có một phương thức hoạt động giống nhau. Cơ chế làm việc của một Search Engine gồm có ba bước cơ bản là:
1. Crawling (thu thập dữ liệu)
Ở bước này, các công cụ tìm kiếm sẽ truy cập vào một trang web bất kỳ để quét và lấy dữ liệu của trang đó. Sau đó, nó sẽ men theo các link (đường dẫn) trong trang để tiếp cận các trang liên quan khác. Nhờ vậy, toàn bộ các trang web trên internet sẽ được ghi nhận vào hệ thống của Search Engines.
2. Indexing (sắp xếp dữ liệu vào “kho”)
Quá trình indexing diễn ra ngay lập tức và song song với bước 1. Khi index, các Search Engine sẽ sắp xếp lại dữ liệu đã có được vào trong kho phần cứng lưu trữ của mình. Mọi thông tin mà các con bot tổng hợp được sẽ lưu trữ ở đây để sẵn sàng được trích xuất.
3. Retrieval (truy xuất dữ liệu
Khi nhận yêu cầu tìm kiếm thông của người dùng, các Search Engine sẽ thực hiện truy xuất thông tin đã lưu trong cơ sở dữ liệu, thực hiện sắp xếp các kết quả tìm được và hiển thị danh sách câu trả lời. Các Search Engine dựa trên 2 tiêu chí để đánh giá thứ tự của các kết quả tìm kiếm: sự liên quan và độ phổ biến. Các kết quả tra cứu liên quan đến yêu cầu của bạn được ưu tiên trước, sau đó mới xét đến độ phổ biến của từng kết quả.
Các loại Search Engines phổ biến hiện nay
Bên cạnh Web Search Engines như chúng tôi đã đề cập, hiện cũng còn có một số loại Search Engines khá phổ biến hiện nay là:
Local Search Engine (offline): Được thiết kế để hoạt động offline trên máy tính, PC, CDROM hay trong mạng LAN
Meta Search Engine: Hay còn gọi tổ hợp Search engines, chúng hoạt động bằng cách truy vấn tổng hợp trên các Search engines khác và sau đó tổng hợp để cho ra kết quả tương đối nhất.
Blog Search Engine: Là một loại Search Engine dành cho nội dung blog, chỉ crawl và index cùng cung cấp thông tin thuộc lĩnh vực Web blog.
—
WEBSOLUTIONS – THIẾT KẾ WEB CHUYÊN NGHIỆP
Địa chỉ: 225 Broadway Suite 680 New York, NY 10007, United States.
Việt Nam: 0886.02.02.02
New York: +1 (347) 983-2947
- Internet Marketing là gì? Lợi ích của Internet Marketing đối với doanh nghiệp
- Hướng dẫn tạo Google Site chuyên nghiệp free
- 9 điều cần nhớ chạy quảng cáo Google Adwords
Recommended Posts
Các dịch vụ cung cấp chứng chỉ SSL giá rẻ hàng đầu thế giới
15 Tháng Sáu, 2019
Các dịch vụ cung cấp chứng chỉ SSL giá rẻ hàng đầu thế giới
8 Tháng Sáu, 2019