Site icon CCTV Wiki

Phỏng Vấn Độc Quyền ISC West: Ambarella Ra Mắt Chip AI Thế Hệ Mới Cho Công Việc Xử Lý Thông Minh Hóa Tác Nhân (Agentic AI)

Công ty bán dẫn Ambarella của Mỹ là một trong những “nhà vô địch thầm lặng” của ngành an ninh. Mặc dù tên của họ không xuất hiện trên vỏ bất kỳ camera an ninh nào, nhưng các chip của họ—với tổng cộng 400 triệu đơn vị đã được xuất xưởng, trong đó có 42 triệu chip SoC AI—đang cung cấp năng lượng cho các thiết bị biên của các nhà sản xuất camera an ninh lớn từ i-PRO, Axis đến Bosch (IQSIGHT), cũng như các thương hiệu toàn cầu ngoài lĩnh vực an ninh như Insta360 và GoPro.

Tại ISC West, nhà thiết kế bán dẫn không có nhà máy này đã trình diễn thế hệ hệ thống trên chip (SoC) mới nhất của mình dành cho các tác vụ dựa trên bộ biến đổi (transformer-based workloads): dòng SoC CV7 AI Vision và dòng SoC N1 Edge GenAI.

Ambarella đã thực hiện hơn 20 bản demo tại một phòng riêng dành cho khách mời, tách biệt khỏi khu vực triển lãm chính, với ba điểm nhấn nổi bật dành cho những người quan tâm đến việc tích hợp hệ thống an ninh:
* Xử lý tín hiệu hình ảnh (ISP) hỗ trợ AI, còn gọi là AISP, để tăng cường chất lượng hình ảnh theo thời gian thực.
* Thiết lập hệ thống không cần lập trình, được hỗ trợ bởi AI hóa tác nhân.
* Các tác vụ AI đồng thời, bao gồm ISP, các tác nhân AI và tạo/phân tích siêu dữ liệu.

Trong khi CV7 và N1 thúc đẩy tiến bộ trong cả ba lĩnh vực này, AI hóa tác nhân (agentic AI) có lẽ là cải tiến dễ thấy nhất, tạo nên sự khác biệt giữa các hệ thống trước đây và những hệ thống chạy trên chip AI mới nhất.

AI Hóa Tác Nhân và Khả Năng Mở Rộng

“Khoảnh khắc mà người dùng nhận ra khả năng của AI đã tiến xa đến mức nào là khi họ thấy AI hóa tác nhân hoạt động,” ông Jérôme Gigot, Phó Chủ tịch Tiếp thị Sản phẩm AI Biên (Edge AI Products) của Ambarella, cho biết. “Chúng tôi trình diễn điều này trong một trong các bản demo của mình, nơi chúng tôi chỉ ra cách thiết lập một hệ thống giám sát nhà kho. Toàn bộ quy trình dựa trên các lệnh nhắc—không cần lập trình—để thiết lập một hệ thống bao gồm camera AI biên chạy trên CV7 và các hộp AI tại chỗ chạy trên N1, cùng với các phân tích trên đám mây.”

“Kết quả là một hệ thống nhận thức ngữ cảnh, giám sát cơ sở, cung cấp cho người dùng tóm tắt về những gì đang diễn ra và các phản ứng tự động, được hỗ trợ bởi AI,” ông giải thích. “Không cần lập trình để thiết lập một hệ thống như vậy; người vận hành chỉ cần đưa ra các lệnh nhắc, và tác nhân AI sẽ thiết kế toàn bộ kiến trúc.”

Với các bản demo, Ambarella cũng tìm cách mang đến cho khán giả chuyên gia của mình một ấn tượng về hiệu suất AI toàn diện của các chip của mình.

“Thử nghiệm thực sự là khi bạn chạy toàn bộ hệ thống với nhiều hoạt động AI cùng lúc,” Gigot nói. “Điều này có nghĩa là nhiều luồng video 4K, bao gồm xử lý và mã hóa dữ liệu hình ảnh, và chạy nhiều tác nhân AI và mô hình dựa trên siêu dữ liệu được tạo ra tại biên. Một trong những bản trình diễn chính của chúng tôi cho thấy tốc độ suy luận AI vẫn ổn định ở mức 80 đến 82 khung hình/giây, ngay cả khi tăng thêm tải cho hệ thống với xử lý ISP 4K, mã hóa 4K và tải CPU tối đa.”

Hiệu Suất Vượt Trội

Các bản demo đã làm nổi bật một trong những thế mạnh cốt lõi của Ambarella: các chip hiệu suất cao với hiệu quả năng lượng tiên tiến.

Ông Gigot cho biết hiệu quả là chìa khóa để vận hành các hệ thống an ninh hiện đại, chẳng hạn như hệ thống nhà kho trong bản demo. Với các chip Ambarella mới nhất, các lệnh nhắc bằng ngôn ngữ tự nhiên, cho phép phân tích các sự kiện trong quá khứ và thiết lập cảnh báo cho các sự kiện tương lai, không còn yêu cầu phân tích nặng về điện toán đối với cảnh quay cũ, nhờ vào các mô hình dựa trên bộ biến đổi (transformers).

“Với các bộ biến đổi, đây đang trở thành một hoạt động khớp vectơ hiệu quả, chỉ dựa trên siêu dữ liệu AI được ghi lại khi cảnh quay được chụp,” Gigot nói thêm. “Các bộ biến đổi tăng hiệu suất AI lên 10 đến 20 lần. Với các chip thế hệ mới nhất của chúng tôi, được xây dựng trên các nút 4 nanomet, giảm từ 5nm, nhu cầu điện năng giảm khoảng 15 phần trăm.”

Các hệ thống chạy trên chip hiệu suất cao của Ambarella cho phép sự phức tạp đáng kể, nhưng công ty vẫn muốn đảm bảo điều này không làm mất đi sự linh hoạt.

“Một lĩnh vực khác mà chúng tôi đang trình diễn là điều phối đám mây,” ông Amit Badlani, Giám đốc Tiếp thị Sản phẩm cho AI/ML của Ambarella, cho biết. “Trọng tâm là chỉ ra việc phân phối các tác vụ AI trên một hệ thống dễ dàng đến mức nào. Chỉ bằng cách kéo và thả, người dùng có thể quyết định mỗi tác vụ AI nên chạy ở đâu—trên thiết bị biên, trên hộp AI tại chỗ hay trên đám mây.”

“Người dùng cũng có thể tổng quan các tác vụ và phân phối chúng bằng hộp AI của mình, nhờ vào sức mạnh tính toán của N1,” ông nói, thêm rằng phần cứng bổ sung từng cần thiết cho các hoạt động như vậy trên thế hệ hệ thống trước. “Quy trình làm việc dựa trên tác nhân AI của chúng tôi cũng hỗ trợ tích hợp với nhiều công cụ AI mã nguồn mở, chẳng hạn như Openclaw hoặc Diffy, giúp việc thiết lập hệ thống càng dễ dàng hơn cho những người đã quen làm việc với các công cụ đó.”

Tuy nhiên, Ambarella cũng xem xét rằng nhiều triển khai thực tế chạy trên các thiết bị cũ không có khả năng AI biên.

“Đối với các hệ thống như vậy, tính linh hoạt là chìa khóa,” Badlani nói. “Người vận hành có toàn quyền kiểm soát cách họ điều phối các tác vụ AI. Họ có tiềm năng hưởng lợi từ AI mới nhất mà không cần ‘tháo dỡ và thay thế’. Họ chỉ cần di chuyển các tác vụ đến nơi hệ thống của họ có khả năng AI.”

“Nhìn chung, mục tiêu là cho phép ngày càng nhiều hoạt động chạy trên biên,” Badlani kết luận. “Lý do chính là để giảm độ trễ xuống gần bằng 0, từ 20 đến 30 mili giây khi các hoạt động chạy trên đám mây.”

“Tuy nhiên, một thách thức là đạt được độ chính xác cao nhất trong các mô hình AI biên tinh gọn hơn. Bộ nhớ cũng bị giới hạn trên biên,” Badlani nói. “Các chip của chúng tôi không chỉ cực kỳ hiệu quả về năng lượng mà còn hiệu quả về bộ nhớ. Điều này giúp chạy nhiều mô hình hơn, và các mô hình có số lượng tham số cao hơn, trong mỗi camera.”

Triết Lý Phát Triển

Với việc phát triển các chip CV7 và N1, Ambarella đang thực hiện một bước đi quyết định hướng tới các mô hình AI chuyên biệt cao khi họ tìm cách đi trước các nhà thiết kế chip khác. Điều này bao gồm việc chạy các mô hình ngôn ngữ-hình ảnh trực tiếp tại biên, điều lần đầu tiên có thể thực hiện trên chip Ambarella. Mặc dù điều này mở ra những cơ hội mới cho các nhà sản xuất camera, nhưng nó đòi hỏi sự tập trung cao độ vào hiệu quả.

“Hầu hết các mô hình AI được sử dụng trong camera an ninh ngày nay là các mô hình xử lý video tổng quát,” Badlani giải thích. “Chúng tôi mong đợi sẽ thấy nhiều mô hình chuyên biệt hơn trong tương lai. Một lĩnh vực trọng tâm gần như chắc chắn sẽ là nội suy khung hình video chính xác và hiệu quả hơn. Điều này quan trọng vì không có AI biên nào, dù tiên tiến đến đâu, có thể phân tích toàn bộ dữ liệu phong phú nếu camera chạy ở tốc độ ghi 30 khung hình/giây ở 4K. Do đó, hầu hết các thiết bị biên ngoại suy dựa trên 10 đến 20 khung hình được chọn ngẫu nhiên, mà chúng đưa vào một mô hình ngôn ngữ lớn.”

“Thách thức đối với Ambarella là đảm bảo chất lượng của các khung hình chính đó,” Badlani tuyên bố. “Với AISP của chúng tôi, chúng tôi đang tìm cách nâng cao hiệu suất của các mô hình đó bằng cách cung cấp cho chúng một đầu vào sạch hơn và liên quan hơn, giúp chúng chính xác hơn nhiều lần.”

Một trong những bản demo trong phòng Ambarella đã trình diễn điều này một cách ấn tượng. Hình ảnh được hỗ trợ bởi AISP có ít hiện tượng mờ chuyển động rõ rệt hơn, trong khi các hiện vật xuất hiện trong các luồng sử dụng xử lý truyền thống đã biến mất.

“Bằng cách nâng cao chất lượng dữ liệu hình ảnh bằng AISP của chúng tôi, chúng tôi thực sự nâng cao chất lượng của tất cả các tác vụ AI ở giai đoạn sau,” Badlani giải thích. “Và khi được sử dụng cùng với các kỹ thuật như MoE (Mixture of Experts), các mô hình AI ở giai đoạn sau có thể phân tích những gì có trong khung hình hiệu quả hơn, sử dụng số lượng tham số thấp hơn để đạt được cùng độ chính xác. Một mô hình với 8 tỷ tham số chạy trên chip N1 655 nhỏ hơn bên trong một hộp AI có khả năng đạt được độ chính xác tương tự như một mô hình 20 tỷ tham số. Điều này có tiềm năng giảm nhu cầu năng lượng và bộ nhớ của toàn bộ hệ thống.”

Nền Tảng Cooper Cho Các Nhà Phát Triển AI Qua Các Thế Hệ Chip

Mạng lưới đối tác của Ambarella bao gồm các nhà cung cấp phần cứng cũng như VMS và VSaaS với hơn 20 mô hình AI của bên thứ ba trong “thư viện” của họ, Badlani cho biết. Đối với các đối tác, Nền tảng Phát triển Cooper của Ambarella đóng vai trò là giải pháp phần cứng và phần mềm toàn diện cho các hệ thống AI biên của họ, cung cấp khả năng tính toán và phần mềm mạnh mẽ, an toàn và bảo mật. Nó cho phép phát triển liên tục qua các thế hệ chip.

“Các nhà phát triển đã tạo một ứng dụng cho thế hệ chip trước đó, chẳng hạn như CV5, có thể điều chỉnh chúng để sử dụng trên CV7 hoặc N1,” Gigot nói. “Tất cả những gì họ cần làm là chọn hiệu suất AI và video cho ứng dụng. Họ thậm chí không cần viết lại trình điều khiển cho các cảm biến của thiết bị biên.”

Nhờ những tiến bộ công nghệ không ngừng, triển vọng thị trường của Ambarella trong năm tới là rất lạc quan.

“Chúng tôi đang bước vào một chu kỳ nâng cấp cho chip camera AI, từ dòng CV5 tập trung vào Computer Vision và CNN truyền thống (Mạng nơ-ron tích chập), đến dòng CV7 bổ sung hỗ trợ các tác vụ AI tiên tiến, bao gồm các bộ biến đổi (transformers), VLM (Mô hình ngôn ngữ-hình ảnh) và LLM (Mô hình ngôn ngữ lớn), đồng thời cho phép khả năng suy luận cục bộ trên thiết bị. Điều này có tiềm năng thúc đẩy sự tiến bộ trong toàn ngành,” Gigot nói. “Ngoài ra, chúng tôi nhận thấy ngành đang ngày càng tập trung theo chiều dọc. Hầu hết các nhà sản xuất theo truyền thống định hướng sản xuất camera an ninh đa năng. Trong tương lai, chúng tôi kỳ vọng rằng trọng tâm sẽ là các ngành dọc và nhu cầu cụ thể của họ, ví dụ như bán lẻ. Các nhà sản xuất đang tự hỏi, ‘những loại dữ liệu và thông tin tình báo nào mà các nhà bán lẻ cần ngoài an ninh?’ Thế hệ thiết bị tiếp theo của họ có khả năng sẽ tìm cách đưa ra câu trả lời cho các bên liên quan theo chiều dọc.”

Exit mobile version