Bài toán HỒI QUY và PHÂN LOẠI trong Machine Learning

 

Hồi quy (Regression) và Phân loại (Classification) là những thuật toán dùng để dự đoán trong Machine Learning (ML). Trong khi hồi quy dùng để dự đoán các giá trị liên tục như giá cả, thu nhập, tuổi... thì phân loại được dùng để dự đoán/phân loại các giá trị rời rạc như Nam/nữ, đúng/sai, nắng/mưa...

Bài viết này được sơ dịch từ bài gốc: Regression vs. Classification in ML, theo đường link: https://www.javatpoint.com/regression-vs-classification-in-machine-learning#:~:text=In%20Regression%2C%20the%20output%20variable,continuous%20output%20variable(y).


Phân loại
Phân loại là quá trình tìm kiếm một chức năng giúp phân chia tập dữ liệu thành các lớp dựa vào các tham số khác nhau. Trong Phân loại, một chương trình máy tính được huấn luyện trên một dữ liệu đào tạo (training dataset), và dựa vào huấn luyện đó, nó phân loại dữ liệu thành các lớp khác nhau.
Nhiệm vụ của thuật toán phân loại là tìm hàm ánh xạ để ánh xạ đầu vào (x) thành đầu ra rời rạc (y).

Ví dụ: Phân loại email là Spam hay email thường. Mô hình sẽ dựa vào hàng triệu email để huấn luyện, sau đó, khi có email mới, nó sẽ xác định liệu email này có phải là spam hay không. Nếu là Spam, nó sẽ chuyển vào thư mục Spam.

Một số thuật toán phân loại phổ biến:

  • Logistic Regression
  • K-Nearest Neighbours
  • Support Vector Machines
  • Kernel SVM
  • Naïve Bayes
  • Decision Tree Classification
  • Random Forest Classification

Hồi quy

Hồi quy là quá trình tìm kiếm mối tương quan giữa các biến phụ thuộc và độc lập. Nó giúp dự đoán các biến số liên tục như dự đoán xu hướng thị trường, dự đoán giá nhà...

Nhiệm vụ của thuật toán hồi quy là tìm ánh xạ để biến đầu vào (x) thành biến đầu ra liên tục (y).

Ví dụ: Giả sử chúng ta muốn dự báo thời tiết, mô hình hồi quy sẽ được huấn luyện dựa vào dữ liệu trong quá khứ, để dự đoán thời tiết hôm nay hoặc ngày mai là bao nhiêu độ C, mưa bao nhiêu mm.

Một số thuật toán hồi quy phổ biến:

  • Simple Linear Regression
  • Multiple Linear Regression
  • Polynomial Regression
  • Support Vector Regression
  • Decision Tree Regression
  • Random Forest Regression

(Xem thêm ở bài "Top 10 thuật toán hồi quy phổ dụng trong Machine Learning")

Khác biệt cơ bản giữa Hồi quyPhân loại

Bài toán HỒI QUY và PHÂN LOẠI trong Machine Learning Bài toán HỒI QUY và PHÂN LOẠI trong Machine Learning Reviewed by VinhHD on 16:30 Rating: 5

Không có nhận xét nào:

ads 728x90 B
Được tạo bởi Blogger.