Vận hành hóa quá trình huấn luyện (Training Operationalization) là quy trình xây dựng và kiểm thử một pipeline huấn luyện ML có thể lặp lại, sau đó triển khai nó vào môi trường thực thi đích. Trong MLOps, các kỹ sư ML cần có khả năng sử dụng các cấu hình để triển khai pipeline ML. Những cấu hình này xác định các biến như:
- Môi trường triển khai đích (development, test, staging, v.v.)
- Nguồn dữ liệu được truy cập trong quá trình thực thi ở từng môi trường
- Tài khoản dịch vụ dùng để chạy các tác vụ tính toán
Hình trên minh họa các giai đoạn triển khai một pipeline huấn luyện.
Quy trình triển khai Pipeline
Một pipeline thường trải qua nhiều môi trường kiểm thử và staging trước khi được đưa vào production. Số lượng môi trường kiểm thử tùy thuộc vào quy chuẩn của từng tổ chức. Hầu hết tổ chức có ít nhất một môi trường kiểm thử trước production, một số có nhiều hơn.
Chi tiết quy trình triển khai phụ thuộc vào công nghệ sử dụng:
- Với giải pháp no-code, các nhà khoa học dữ liệu và kỹ sư ML không cần xử lý (hoặc thậm chí không thấy) chi tiết triển khai.
- Với công nghệ code-first (linh hoạt và kiểm soát cao hơn), kỹ sư ML có thể triển khai pipeline bằng các quy trình và công cụ CI/CD tiêu chuẩn.
Workflow CI/CD tiêu chuẩn
Lược đồ mô tả một quy trình CI/CD gồm các giai đoạn sau:
1. Giai đoạn CI (Continuous Integration):
- Mã nguồn được kiểm thử đơn vị (unit test).
- Pipeline huấn luyện được build và kiểm thử tích hợp (integration test).
- Các artifacts tạo ra trong quá trình build được lưu trữ trong artifact repository.
Các tài sản chính được tạo ra:
- Thành phần thực thi của pipeline huấn luyện (ví dụ: container images lưu trong container registry).
- Biểu diễn runtime của pipeline, tham chiếu đến các thành phần trong artifact repository.
2. Giai đoạn CD (Continuous Deployment):
- Pipeline đã kiểm thử được triển khai vào môi trường đích.
- Pipeline trải qua kiểm thử end-to-end trước khi lên production.
- Thông thường, pipeline được kiểm thử trên tập con dữ liệu production, trong khi huấn luyện toàn bộ chỉ diễn ra ở môi trường production.
3. Kiểm thử nhanh (Smoke Test):
- Nếu pipeline mới không tạo ra được mô hình có thể triển khai, hệ thống serving sẽ quay lại sử dụng mô hình từ pipeline hiện tại.
Giải thích thuật ngữ:
- Smoke testing: Kiểm thử nhanh để xác nhận pipeline hoạt động cơ bản.
- Fallback mechanism: Cơ chế dự phòng khi triển khai thất bại.
- Artifact repository: Kho lưu trữ các thành phần phần mềm (model, container, v.v.).
- CI/CD: Tích hợp/Triển khai liên tục, giúp tự động hóa quy trình phát triển.