NẮM RÕ BỐN LOẠI THUẬT TOÁN MÁY HỌC TRONG VÒNG 3 PHÚT

Việc ứng dụng dữ liệu lớn chắc chắn là một phần quan trọng của sự phát triển công nghệ trong tương lai.Tuy nhiên, máy học và trí tuệ nhân tạo đều đóng một vai trò quan trọng trong việc giải phóng giá trị của dữ liệu.
Mối quan hệ giữa ba yếu tố này được giải thích ngắn gọn: dữ liệu lớn là vật liệu, máy học là phương pháp và trí tuệ nhân tạo là kết quả. Máy học có nghĩa là cỗ máy (máy tính) có khả năng học tập giống như con người.Thông qua dữ liệu, máy học ngày nay đã được ứng dụng rộng rãi trong cuộc sống, chẳng hạn như ô tô tự lái và giao thông vận tải tự động, phân phối và hậu cần có hệ thống, cải thiện việc chăm sóc người cao tuổi, v.v. để cuộc sống của chúng ta thuận tiện hơn.

Cách thức hoạt động của máy học tương tự như cách con người học.Để một cỗ máy (máy tính) có khả năng học tập giống như con người, trước tiên nó phải “phân loại” rồi phân tích, phán đoán và cuối cùng là hành động.Thuật toán máy học chủ yếu được chia thành bốn loại: học có giám sát, học không giám sát, học bán giám sát và học củng cố.

  1. Học có giám sát: Tất cả các vật liệu đều được “gắn nhãn” để cho máy biết giá trị tương ứng để dự đoán giá trị chính xác.Phương pháp này chủ yếu là phân loại thủ công, dễ với máy tính và khó với con người.Phương pháp này giống như nói với máy (máy tính) câu trả lời tiêu chuẩn.Khi máy được kiểm tra chính thức, máy sẽ trả lời theo đáp án tiêu chuẩn và độ tin cậy sẽ càng cao.Ví dụ: nếu muốn huấn luyện cho máy phân biệt voi và hươu cao cổ, bạn có thể cung cấp 100 bức ảnh về voi và hươu cao cổ.Máy phát hiện các đặc điểm của voi và hươu cao cổ theo các bức ảnh được “gắn nhãn” và nhận diện voi và hươu cao cổ theo đặc điểm của chúng.Cuối cùng, nó sẽ dự đoán chính xác chúng.​
  2. Học không giám sát: Không có vật liệu nào được gắn nhãn và máy tự phân loại vật liệu bằng cách phát hiện các đặc điểm của dữ liệu.Phân loại thủ công không liên quan đến phương pháp này, đây là phương pháp đơn giản với con người nhưng khó nhất với máy tính và gây ra nhiều lỗi hơn.Nếu phương pháp học không giám sát được sử dụng để nhận diện voi và hươu cao cổ, máy phải quyết định xem bức ảnh nào trong số 100 bức ảnh được cung cấp là voi và bức ảnh nào là hươu cao cổ và thực hiện phân loại cùng một lúc.Trong dự đoán tương lai, máy sẽ xác định đó là loài động vật nào theo các đặc điểm và phân loại mà nó phát hiện được.Tuy nhiên, kết quả nhận định của máy chưa chắc đã chính xác.​
  3. Học bán giám sát: Một lượng nhỏ dữ liệu được gắn nhãn.Máy tính chỉ cần tìm các tính năng thông qua dữ liệu được gắn nhãn và sau đó phân loại các dữ liệu khác cho phù hợp.Phương pháp này có thể làm cho các dự đoán chính xác hơn và là phương pháp được sử dụng phổ biến nhất.Nếu có 100 bức ảnh, 10 bức ảnh voi và hươu cao cổ sẽ được gắn nhãn.Thông qua đặc điểm của 10 bức ảnh này, máy xác định và phân loại các bức ảnh còn lại.Vì đã có cơ sở để nhận biết nên kết quả dự đoán thường chính xác hơn so với việc học không giám sát.​
  4. Học củng cố: Máy sử dụng các quan sát thu thập được từ sự tương tác với môi trường để thực hiện các hành động có thể tối đa hóa phần thưởng hoặc giảm thiểu rủi ro.Với học củng cố, vật liệu không được gắn nhãn, nhưng hãy cho nó biết bước nào đúng bước nào sai.Theo chất lượng của phản hồi, máy dần dần sửa đổi phân loại và cuối cùng nhận được kết quả chính xác.Để đạt được một mức độ chính xác nhất định trong học không giám sát, cần thiết phải tích hợp học củng cố.Nếu máy tự xác định các đặc điểm và phân loại và dự đoán hình ảnh con voi là hươu cao cổ, con người sẽ phản hồi là sai.Máy sẽ nhận diện đặc điểm và phân loại một lần nữa.Thông qua việc học đúng và sai cùng lúc, dự đoán cuối cùng sẽ ngày càng chính xác hơn..

Trong bốn loại nêu trên, học có giám sát là phương pháp chính xác nhất nhưng cũng tốn kém nhất.Nhưng nếu bạn muốn làm chủ độ chính xác cao trong điều kiện lao động và chi phí hạn chế thì sao?Amazon cung cấp các dịch vụ Amazon SageMaker Ground Truth để giảm chi phí lao động bằng cách đẩy nhanh việc xây dựng các tập dữ liệu có độ chính xác cao.Bạn có thể tham khảo bài đăng trên blog sau để hiểu tính năng của SageMaker thông qua phòng thí nghiệm thực hành: SageMaker Ground Truth xây dựng một bộ dữ liệu có độ chính xác cao

machine-learning

Reference: 

2021-09-06T17:01:29+00:00 2019/03/29 |大數據|