Hiện nay “Deep Learning” đang là một từ khoá rất nóng đối với ngành thiết bị an ninh – giám sát. Chúng ta hãy cùng tìm hiểu Deep Learning là gì, tìm hiểu cụ thể hơn khái niệm này trong ngành CCTV.
Xem thêm : HIKVISION ra mắt camera nhiệt Deep Learning
Tổng quan
Deep Learning có thể được coi là một bước tiến mới nhất của trí tuệ nhân tạo, hoặc các phương pháp máy học (machine learning), được ứng dụng trong nhiều ngành nhằm giúp máy tính nhận định và đánh giá các tiêu chí và tình huống đa dạng trong thế giới thực.
Phương pháp phân tích hình ảnh truyền thống
Trước khi công nghệ deep learning được ứng dụng vào phân tích hình ảnh, các hệ thống phân tích thường dự trên những giả định rất cơ bản trong việc định nghĩa một vật thể và khả năng quan sát của mỗi camera.
Từ đó, bước khái quát hình ảnh có thể giúp định nghĩa vật thể mà bỏ qua khung nền, bối cảnh xung quanh. Sau khi lọc bỏ các yếu tố gây nhiễu, những hình ảnh còn lại có thể được phân tích để nhận định đó có phải vật thể cần xác định hay không. Ở bước này, các yếu tố như tỉ lệ, màu sắc… được sử dụng để định nghĩa xem đó là một người hay một phương tiện.
Xem thêm : Hình ảnh nhiệt – Quan sát thể giới theo cách mới
Tuy nhiên, hệ thống truyền thống không thể chỉ ra giới tính, loại phương tiện (xe máy hay xe đạp), do không thể phân tích được nhiều chi tiết của vật thể.
Những hệ thống phân tích hình ảnh truyền thống sẽ không thể phân loại nếu vật thể không có những đặc điểm trùng với những đặc điểm đã được cài đặt ban đầu. Ví dụ, một người bò trên sàn có thể sẽ bị hệ thống nhận lầm là một chiếc xe, dù đã tính đến các yếu tố tỉ lệ, kích thước, màu sắc trang phục…
Sự khác biệt giữa machine learning và deep learning
Machine learning sử dụng những hướng dẫn đã được lập trình trước để cho phép máy tính nhận ra hình ảnh của vật thể, trong khi đó deep learning nhận dạng vật thể một-cách-tự-động.
Machine learning có thể nhận biết một người đang đi bộ thông qua các thông số được lập trình như: thông số về chiều cao lớn hơn chiều rộng của hình ảnh, chuyển động của cánh tay và chân có thể được dự đoán theo một hướng cố định, một số tuỳ biến về màu sắc và hoạ tiết (trên trang phục)… Khi thuật toán tiếp nhận hình ảnh, hệ thống sẽ tìm kiếm các thông số này. Khi có đủ dữ kiện, máy sẽ kết luận hình ảnh có chứa người đang đi bộ.
Với deep learning, phần mềm khi phân tích hình ảnh sẽ chỉ ra hình ảnh đó dự kiến là một vật thể cụ thể, ví dụ như là một người. Sau đó, dữ liệu về hình ảnh được chia nhỏ, hệ thống tìm kiếm những điểm tương đồng để xây dựng một hình tượng khái quát – sản phẩm này có thể được sử dụng trong tương lai để nhận biết những vật thể tương tự.
Thuật toán deep learning có thể tự đưa ra những tiêu chí tương đồng với thuật toán machine learning. Trong hầu hết các trường hợp, deep learning vượt trội hơn hẳn, thu thập và khái quát được những hình ảnh mà con người không trực tiếp tự định nghĩa được, hoặc rất mất thời gian để định nghĩa, ví dụ kích cỡ và vị trí giữa các nét trên khuôn mặt người.
Deep Learning đã làm được những gì tới thời điểm này?
HIKVISION đã khai thác công nghệ này như thế nào vào sản phẩm và dịch vụ của hãng?
Hãy cùng đón chờ nội dung chi tiết hơn trong phần tiếp theo của bài viết.
Bài viết liên quan: