Stochastic Control 1
Tổng quan về Neuro-Dynamic Programming (NDP)
Neuro-dynamic programming (NDP) là một lớp phương pháp quy hoạch động (dynamic programming - dp) mới dùng cho việc kiểm soát và đưa ra chuỗi các quyết định dưới điều kiện không chắc chắn, mà được nhận định rằng có tiềm năng trong việc giải quyết với các bài toán khó do không gian trạng thái (state space) khổng lồ hay tính chính xác kém của mô hình. Đây là một lĩnh vực nghiên cứu giao thoa giữa nhiều lĩnh vực khác như mạng nơ-ron (neural networks), khoa học thần kinh (cognitive science), mô phỏng (simulation), và lý thuyết xấp xỉ (approximation theory).