Kiến Thức

Máy tìm kiếm là gì?

4/5 - (1 bình chọn)

Thông tin luôn đa dạng và phong phú. Do đó, máy tìm kiếm ngày càng được nhiều người sử dụng để tra cứu một thông tin nào đó. Tuy nhiên không phải ai cũng thực sự hiểu rõ về máy tìm kiếm là gì và trên thế giới đang có những công cụ tìm kiếm nào. Bài viết dưới đây của ACC về Máy tìm kiếm là gì? hi vọng đem lại nhiều thông tin chi tiết và cụ thể đến Quý bạn đọc.

Công Cụ Tìm Kiếm Là Gì - Các Công Cụ Tìm Kiếm Phổ Biến Hiện Nay

Máy tìm kiếm là gì?

1. Máy tìm kiếm là gì?

Máy tìm kiếm là tập hợp hệ thống phầm mềm và công cụ được sử dụng trên internet, có chức năng trả lời truy vấn người dùng bằng cách tìm kiếm cơ sở dữ liệu thông tin. Máy tìm kiếm sẽ trả về một danh sách kết quả phù hợp nhất có thể cho người dùng. Khi người dùng nhập từ khoá, chức năng chính của máy tìm kiếm là trả về những kết quả liên quan khác có thể được người sử dụng quan tâm với một xếp hạng nhất định. Với những công cụ tìm kiếm khác nhau thì các xếp hạng này cũng khác nhau.

2. Lịch sử phát triển của máy tìm kiếm

Giai đoạn 1: Quá trình hình thành từ 1990

Bắt đầu với sự ra đời của công cụ tìm kiếm đầu tiên là Archie trên Internet vào tháng 12 năm 1990, Archie được tạo ra bởi một sinh viên có tên là Alan Emtage tại Đại học McGill ở Montreal. Cách hoạt động cơ bản của Archie có thể được hiểu như sau: Khi người dùng tìm kiếm thông tin, thì Archie có thể đưa họ tới đường dẫn trên một hệ thống nào đó chứa thông tin họ muốn.

Archie đã tải xuống các danh sách thư mục của tất cả các tệp thuộc trang web FTP để tạo thành một cơ sở dữ liệu tìm kiếm. Công cụ này cũng không thiết lập chỉ mục nội dung của trang web trên, do đó người dùng có thể dễ dàng tìm kiếm thủ công.

Tham khảo thêm  AHA là gì? Công dụng và cách dùng AHA làm đẹp da hiệu quả

Tiếp tục trong giai đoạn này, vào tháng 6/1993, robot web đầu tiên có tên là World Wide Web Wanderer ra đời được sản xuất bởi Mathew Gray. Wanderer dựa vào Perl và sử dụng Perl để tạo ra chỉ mục “Wandex”. Chỉ mục Wandex có tính năng đo kích thước của World Wide Web từ khi ra đời đến cuối 1995. Vào tháng 12 cùng năm Wanderer ra đời, Jonathon Fletcher đã tìm được các trang web và xây dựng các chỉ mục của trang web này dựa vào robot web.

Chính nhờ vậy, đây cũng là công cụ để khám phá WWW đầu tiên được kết hợp giữa 3 tính năng thiết yếu và quan trọng của máy tính kiếm web, bao gồm thu thập dữ liệu, thiết lập chỉ mục và tìm kiếm.

Giai đoạn 2: Sự phát triển trước năm 2000

Vào năm 1994, Jerry Yang và David Filo thành lập Yahoo! – một Search Engine phổ biến đầu tiên vào năm 1994. Máy tìm kiếm Yahoo! ở Việt Nam hiện tại: https://vn.search.yahoo.com/ Tiếp theo đó vào năm 1996, Robin Li đã tạo được thuật toán và phát triển nó trên trang RankDex với mục đích xếp hạng choc các kết quả tìm kiếm của người dùng. Cuối cùng, vào 1998, bước ngoặt cho hệ thống máy tính được xác lập khi Larry Page đã tham khảo Robin Li và sử dụng chúng trong việc phát triển PageRank.

Giai đoạn 3: Sau năm 2000

Vào khoảng những năm 2000, công cụ tìm kiếm Google đã bắt đầu trở nên nổi tiếng. Công ty đã đạt được kết quả tốt hơn nhiều so với các công ty trước đây với thuật toán là PageRank, được viết bởi Sergey Brin và Larry Page. Đến nay, một số công cụ tìm kiếm đang hoạt động tốt trên toàn thế giới có thể nhắc tới Google, Sogou, Petal,…

3. Cách hoạt động của máy tìm kiếm

Mặc dù tồn tại nhiều loại máy tìm kiếm cũng như có sự khác nhau về thuật toán, nhưng về cơ bản bạn đọc có thể hiểu rằng chúng đều hoạt động dựa trên một nguyên lý giống nhau bao gồm 3 bước chính:

  • Crawling (Thu thập dữ liệu).
  • Indexing (Phân loại, sắp xếp dữ liệu).
  • Retrieval (Truy xuất dữ liệu).

Bước 1: Crawling (thu thập dữ liệu)

Ở bước đầu tiên, máy tìm kiếm được lập trình để tạo ra các loại con bot (robot, crawler hay spider) để có thể truy cập vào những trang web trên Internet. Các con bot này hoạt động theo hướng truy xuất dữ liệu trên trang và đi theo các đường link để tới những trang khác liên quan để truy xuất thêm thông tin. Nhờ đó mà máy tìm kiếm có thể thu thập được nhiều dữ liệu trên Internet nhất có thể.

Tham khảo thêm  CIA là gì? Cum In Alo là gì? CIA có lợi ích và tác hại gì?

Bước 2: Indexing (Phân loại, sắp xếp dữ liệu)

Sau khi thu thập, dữ liệu được phân loại và sắp xếp ngay lập tức vào kho lưu trữ. Quá trình này được thực hiện với tốc độ rất nhanh, có thể nói là song song với quá trình thu thập dữ liệu của bot.

Bước 3: Retrieval (Truy xuất dữ liệu)

Việc truy xuất dữ liệu diễn ra khi có yêu cầu tra cứu của người dùng. Trước khi hiển thị kết quả, dữ liệu sẽ được sắp xếp lại và hiển thị sao cho gần với mong muốn của người dùng nhất. Danh sách hiển thị này được đánh giá qua sự liên quan và độ phổ biến của nội dung người dùng tra cứu. Tuy nhiên, với một số máy tìm kiếm khác nhau lại có những thuật toán và cách thức vận hành khác nhau. Chính vì vậy, danh sách xuất hiện khi người dùng tìm kiếm thông tin trên các loại máy khác nhau có thể sẽ không giống nhau.

4. Các câu hỏi thường gặp

4.1 Điều kiện để máy tìm kiếm phát hiện ra thông tin?

  • Thông tin đã được lưu trữ trên website nào đó trên mạng;
  • Máy tìm kiếm có quyền truy cập và có khả năng truy cập tới các website đó;
  • Yêu cầu của người dùng đủ chính xác để tìm kiếm thông tin.

4.2 Phân loại công cụ tìm kiếm theo chức năng như thế nào?

Tuỳ thuộc vào nhu cầu của người dùng và mỗi chức năng của công cụ tìm kiếm, ta có thể phân loại các công cụ tìm kiếm (Search Engine) thành:

  • Chức năng tìm bản đồ.
  • Chức năng tìm kiếm việc làm.
  • Chức năng tìm địa chỉ các trang Web.
  • Chức năng tìm địa chỉ của thư điện tử (Email).
  • Chức năng tìm thông tin về tổ chức qua Internet.

4.3 Phân loại các công cụ tìm kiếm theo phương pháp hoạt động chính như thế nào?

  • Phương pháp Crawl (thu thập thông tin) hoạt động theo hướng dò tìm, tạo các chỉ mục website trên Internet và lưu vào trong hệ thống lưu trữ.
  • Phương pháp Directionary còn được biết tới là phương pháp tìm theo phân lớp.
  • Phương pháp Meta – phương pháp lấy dữ liệu từ máy tìm kiếm khác Nguyên tắc chính của phương pháp Meta là truy tìm dữ liệu, gửi từ khóa đến tất cả các máy truy tìm khác hàng loạt, cùng lúc và thu về tất cả dữ liệu có được nhờ vào một loại máy truy tìm ảo không chứa dữ liệu.
  • Phương pháp dùng cơ sở dữ liệu đặc biệt là dữ liệu kiếm ra và thu được không thực sự tồn tại trên một địa chỉ trang web nào mà nó tồn tại trong các cơ sở dữ liệu của một máy tính hoặc mạng nào đó được sử dụng trên internet mà các trang web được cấp phép sử dụng.
Tham khảo thêm  6/4 là ngày gì? Nên tặng quà gì cho con trai vào ngày 6/4?

4.4 Ba công cụ tìm kiếm ở Việt Nam là gì?

Trong top những công cụ phổ biến nhất, Google – Cốc Cốc – Bing là ba công cụ phổ biến hơn cả ở thị trường Việt. Ngoài Google và Bing, Cốc Cốc là một công cụ được thành lập và phát triển đầu tiên dành cho ngôn ngữ Việt.

Trên đây là bài viết mà chúng tôi cung cấp đến Quý bạn đọc về Máy tìm kiếm là gì? Trong quá trình tìm hiểu và nghiên cứu, nếu như quý bạn đọc còn thắc mắc hay quan tâm đến Máy tìm kiếm là gì?, quý bạn đọc vui lòng liên hệ với chúng tôi để được hướng dẫn và hỗ trợ pháp lý hoặc sử dụng các dịch vụ pháp lý khác từ ACC. ACC cam kết sẽ giúp bạn có trải nghiệm tốt nhất về các dịch vụ mà mình cung cấp đến khách hàng. Chúng tôi luôn đồng hành pháp lý cùng bạn.

✅ Dịch vụ thành lập công ty ⭕ ACC cung cấp dịch vụ thành lập công ty/ thành lập doanh nghiệp trọn vẹn chuyên nghiệp đến quý khách hàng toàn quốc ✅ Đăng ký giấy phép kinh doanh ⭐ Thủ tục bắt buộc phải thực hiện để cá nhân, tổ chức được phép tiến hành hoạt động kinh doanh của mình ✅ Dịch vụ ly hôn ⭕ Với nhiều năm kinh nghiệm trong lĩnh vực tư vấn ly hôn, chúng tôi tin tưởng rằng có thể hỗ trợ và giúp đỡ bạn ✅ Dịch vụ kế toán ⭐ Với trình độ chuyên môn rất cao về kế toán và thuế sẽ đảm bảo thực hiện báo cáo đúng quy định pháp luật ✅ Dịch vụ kiểm toán ⭕ Đảm bảo cung cấp chất lượng dịch vụ tốt và đưa ra những giải pháp cho doanh nghiệp để tối ưu hoạt động sản xuất kinh doanh hay các hoạt động khác ✅ Dịch vụ làm hộ chiếu ⭕ Giúp bạn rút ngắn thời gian nhận hộ chiếu, hỗ trợ khách hàng các dịch vụ liên quan và cam kết bảo mật thông tin

Related Articles

Back to top button