Avigilon, một công ty thuộc Motorola Solutions, đã ra mắt công nghệ Visual Alerts vào năm ngoái và giới thiệu nổi bật tại Intersec vào đầu năm nay. Tận dụng trí tuệ nhân tạo sinh tạo (GenAI) và khả năng ngôn ngữ tự nhiên, công nghệ này hướng đến việc làm cho an ninh video trở nên thông minh và hiệu quả hơn. Trong bài viết này, chúng tôi đã trò chuyện với ông Jehan Wickramasuriya, Phó Chủ tịch cấp cao về Phần mềm An ninh và Khả năng Phục hồi tại Motorola Solutions, để tìm hiểu sâu hơn về Avigilon Visual Alerts.
Visual Alerts là công nghệ dựa trên GenAI của Avigilon, hoạt động cục bộ trên nền tảng Avigilon Unity Video 8.7. Giải pháp này mở rộng phạm vi phát hiện sự kiện hình ảnh và đối tượng, giúp các tổ chức xác định các vấn đề về an toàn, tuân thủ và hậu cần khác nhau trước khi chúng trở thành các sự kiện cực kỳ nghiêm trọng. So với các phiên bản phần mềm quản lý video và phân tích trước đây, Visual Alerts bao gồm một số tính năng mới:
- Tập trung sự chú ý (Focus of Attention): Kích hoạt giao diện “Focus of Attention” của Avigilon, chuyển đổi hàng nghìn điểm dữ liệu để hiển thị dưới dạng bản đồ trực quan, được mã hóa màu sắc, cảnh báo đội ngũ an ninh khi cần ưu tiên và phản ứng.
- Quy trình hành động tự động hóa: Các phát hiện được tích hợp vào một công cụ quy tắc mạnh mẽ, cho phép người dùng cấu hình các phản hồi tự động phù hợp với nhu cầu riêng biệt của họ.
- Xử lý 100% tại chỗ: Không giống như nhiều công cụ dựa trên đám mây, phân tích AI diễn ra hoàn toàn tại chỗ trong cơ sở hạ tầng của tổ chức để đảm bảo quyền riêng tư dữ liệu và tuân thủ.
‘Biến an ninh video thành chủ động thay vì thụ động’: Ứng dụng Gen AI
Theo ông Wickramasuriya, Visual Alerts thể hiện sự chuyển đổi từ phân tích tĩnh, dựa trên quy tắc sang trí tuệ thích ứng, mô tả. Một yếu tố chính cho phép điều này là trí tuệ nhân tạo sinh tạo, hiện đang có xu hướng phát triển mạnh trong lĩnh vực an ninh video.
“Mục tiêu chính của Visual Alerts là biến an ninh video thành chủ động thay vì thụ động. Phân tích truyền thống thường giới hạn ở các đối tượng được định nghĩa trước như người hoặc phương tiện, nhưng Visual Alerts sử dụng trí tuệ nhân tạo sinh tạo để mở rộng ‘từ vựng’ của hệ thống, cho phép nó phát hiện các cảnh phức tạp và các hoạt động cụ thể mà trước đây không thể phát hiện được,” ông Wickramasuriya chia sẻ. “Trí tuệ nhân tạo sinh tạo được coi là phân khúc phát triển nhanh nhất trong an ninh video. Nó biến camera video từ công cụ chỉ để quan sát thành trí tuệ vận hành theo thời gian thực, chuyển gánh nặng nhận thức từ người vận hành sang AI.”
Giao diện ngôn ngữ tự nhiên
Một tính năng khác làm cho Visual Alerts nổi bật là việc sử dụng giao diện ngôn ngữ tự nhiên, nơi người vận hành có thể đơn giản sử dụng các câu lệnh trò chuyện để thiết lập quy tắc. Khi một sự kiện được phát hiện, hệ thống có thể phản ứng theo quy tắc đã định trước, ví dụ như kích hoạt còi báo động, gửi ảnh chụp nhanh qua email hoặc khởi tạo lệnh gọi API đến các hệ thống an ninh bên ngoài. Tất cả điều này hỗ trợ một phản ứng nhanh hơn, có tổ chức hơn.
“Không giống như các phiên bản cũ hơn, nơi người dùng phải điều hướng các menu phức tạp để thiết lập quy tắc, Visual Alerts cho phép người dùng chỉ cần mô tả những gì cần phát hiện trong một cảnh bằng ngôn ngữ tự nhiên,” ông Wickramasuriya nói. “Nó loại bỏ nhu cầu về kiến thức kỹ thuật chuyên môn để tạo ra các quy tắc phức tạp. Người vận hành có thể nhập các lệnh như ‘Cảnh báo tôi khi có khói,’ ‘Cảnh báo tôi khi có cửa sổ bị vỡ,’ hoặc ‘Cảnh báo tôi khi có người nằm trên sàn nhà.’”
Ngôn ngữ tự nhiên cũng có thể đóng vai trò quan trọng trong tìm kiếm thông minh, nơi người dùng nhập một truy vấn như “tìm những người mặc áo sơ mi đỏ,” và hệ thống sẽ truy xuất tất cả các đoạn phim liên quan. “Mặc dù hiện tại chúng tôi chưa hỗ trợ tìm kiếm bằng ngôn ngữ tự nhiên, nhưng đây là một trường hợp sử dụng mà chúng tôi đang tích cực khám phá và mong đợi sẽ chia sẻ thêm trong tương lai,” ông Wickramasuriya cho biết.
Các ngành có thể hưởng lợi
Visual Alerts mạnh về tối ưu hóa quy trình làm việc và ngăn chặn sự cố chủ động. Với điều đó, công nghệ này rất phù hợp với nhu cầu của nhiều ngành công nghiệp và thị trường dọc phức tạp, bao gồm:
Chăm sóc sức khỏe và bệnh viện: Đối với các cơ sở y tế lớn, Visual Alerts giúp đội ngũ an ninh đối chiếu dữ liệu từ mạng lưới camera rộng lớn để quản lý một lượng lớn người, hiểu các sự kiện khác nhau đồng thời và thực hiện hành động ngay lập tức, đã được xác minh trong các sự cố.
Dầu khí: Tại các khu công nghiệp phức tạp, Visual Alerts có thể đóng vai trò quan trọng trong việc duy trì an toàn, tuân thủ và phát hiện nguy hiểm. Người vận hành có thể tạo các cảnh báo rất cụ thể, ví dụ như ngay lập tức gắn cờ một “phương tiện trái phép gần van ngắt”.
Hậu cần và kho bãi: Visual Alerts cung cấp tính năng phát hiện nguy hiểm sớm và quản lý quy trình làm việc quan trọng. Điều này có thể tiết kiệm thời gian đáng kể khi phát hiện dấu hiệu sớm của khói hoặc lửa trong kho, giúp đội ngũ an ninh thực hiện sơ tán an toàn.
Bán lẻ và địa điểm công cộng: Các địa điểm công cộng lớn có thể tận dụng trí tuệ nhân tạo sinh tạo của hệ thống để quản lý đám đông tiên tiến, xác định “mật độ đám đông cao”, giúp người vận hành chủ động quản lý dòng người đi bộ và xác định các điểm tắc nghẽn an toàn tiềm ẩn.
Ưu tiên quyền riêng tư hàng đầu
Visual Alerts hoàn toàn tập trung vào quyền riêng tư dữ liệu. Như đã đề cập trước đó, công nghệ này được thiết kế với kiến trúc ưu tiên quyền riêng tư, đảm bảo phân tích video AI sinh tạo được thực hiện hoàn toàn tại chỗ.
“Bằng cách sử dụng AI Appliance 2X với Hệ điều hành cứng hóa Avigilon (Avigilon Hardened OS), dữ liệu video nhạy cảm được xử lý bằng các mô hình cục bộ mà không cần gửi dữ liệu lên đám mây. Phương pháp phía máy chủ này cho phép các tổ chức trong các lĩnh vực được quản lý chặt chẽ, như chăm sóc sức khỏe và cơ sở hạ tầng quan trọng, triển khai các khả năng AI tiên tiến trong khi vẫn duy trì chủ quyền dữ liệu và tuân thủ nghiêm ngặt,” ông Wickramasuriya giải thích.
Hơn nữa, Visual Alerts cung cấp phân tích AI có ý thức về quyền riêng tư, tập trung vào các sự kiện chứ không phải danh tính, cho phép quản trị viên làm mờ các cá nhân hoặc các khu vực nhạy cảm cụ thể trong tầm nhìn của camera theo thời gian thực.

