Chip thần kinh mới hiệu quả cao cho AI

Thứ Năm, 08/09/2022, 20:51

NeuRRAM là chip máy tính đầu tiên cho một loạt ứng dụng trí tuệ nhân tạo (AI) trong khi chỉ sử dụng một tỷ lệ nhỏ năng lượng các nền tảng khác tiêu thụ mà vẫn duy trì độ chính xác tương đương - nhóm nghiên cứu Đại học California San Diego (UCSD), báo cáo.

Con chip siêu tiết kiệm năng lượng

NeuRRAM, con chip mới chạy tính toán trực tiếp trong bộ nhớ và có thể chạy nhiều ứng dụng AI được thiết kế và xây dựng bởi một nhóm nhà nghiên cứu quốc tế. Điều khiến chip mới trở nên khác biệt là nó thực hiện tất cả công việc chỉ với một phần nhỏ năng lượng được tiêu thụ bởi các nền tảng dành cho mục đích chung của máy tính AI.

Chip thần kinh mới hiệu quả cao cho AI -0
Một nhóm nhà nghiên cứu thiết kế, sản xuất và thử nghiệm chip mới, gọi là NeuRRAM.

Chip “thần kinh” NeuRRAM mang đến cho AI một bước tiến gần hơn đến việc chạy trên một loạt thiết bị cạnh, không kết nối với đám mây. Điều này có nghĩa con chip có thể thực hiện mọi nhiệm vụ nhận thức phức tạp ở bất cứ đâu và bất cứ lúc nào mà không cần dựa vào kết nối mạng với một máy chủ tập trung. Những ứng dụng cho thiết bị này có rất nhiều ở mọi nơi trên thế giới và mọi khía cạnh trong cuộc sống chúng ta. Chúng bao gồm từ đồng hồ thông minh đến tai nghe thực tế ảo, tai nghe nhét tai thông minh, cảm biến thông minh trong nhà máy và thiết bị khám phá không gian.

Chip NeuRRAM không chỉ tiết kiệm năng lượng gấp đôi so với các chip “máy tính trong bộ nhớ” hiện đại - một loại chip lai tiên tiến chạy tính toán trong bộ nhớ - mà nó còn mang lại kết quả chính xác như chip kỹ thuật số thông thường. Các nền tảng AI thông thường cồng kềnh hơn nhiều và thường bị hạn chế sử dụng những máy chủ dữ liệu lớn hoạt động trên đám mây. Ngoài ra, chip NeuRRAM rất linh hoạt và hỗ trợ nhiều mô hình cũng như kiến trúc mạng nơ-ron khác nhau. Do đó, con chip này có thể được sử dụng cho nhiều ứng dụng khác nhau - bao gồm nhận dạng và tái tạo hình ảnh cũng như nhận dạng giọng nói.

Hiện tại, điện toán AI vừa tiêu tốn điện năng vừa tốn kém về mặt tính toán. Hầu hết ứng dụng AI trên các thiết bị cạnh liên quan đến việc di chuyển dữ liệu từ thiết bị lên đám mây - nơi AI xử lý và phân tích nó. Sau đó, kết quả được chuyển trở lại thiết bị.

Điều này là cần thiết vì hầu hết thiết bị cạnh đều sử dụng pin và kết quả là chỉ có một lượng điện năng hạn chế có thể dành riêng cho máy tính. Bằng cách giảm mức tiêu thụ điện năng cần thiết cho suy luận AI ở rìa, chip NeuRRAM này có thể giúp dẫn đến các thiết bị cạnh mạnh mẽ hơn, thông minh hơn và dễ tiếp cận hơn. Chip mới cũng có thể giúp bảo mật dữ liệu tốt hơn do việc chuyển dữ liệu từ thiết bị lên đám mây đi kèm với rủi ro bảo mật tăng lên.

Điểm mới với NeuRRAM là hiệu suất cực cao hiện đi cùng với tính linh hoạt cao cho mọi ứng dụng AI đa dạng mà độ chính xác hầu như không bị giảm so với những nền tảng máy tính đa năng kỹ thuật số tiêu chuẩn. Ngoài ra, nhóm nghiên cứu cũng đảm bảo tính đến nhiều ràng buộc khác nhau trải dài từ vật lý thiết bị nhớ đến mạch và kiến trúc mạng.

Chip thần kinh mới hiệu quả cao cho AI -0
Cận cảnh con chip NeuRRAM.

Hiệu suất chip

Nhóm nhà nghiên cứu đo hiệu quả năng lượng của chip bằng một biện pháp được gọi là sản phẩm làm chậm năng lượng (EDP). EDP kết hợp cả lượng năng lượng tiêu thụ cho mọi hoạt động và lượng thời gian cần thiết để hoàn thành hoạt động. Bằng cách đo này, chip NeuRRAM đạt EDP thấp hơn từ 1,6 đến 2,3 lần (càng thấp càng tốt) và mật độ tính toán cao hơn từ 7 đến 13 lần so với các chip hiện đại. Ngoài ra, con chip này cũng giảm được 70% lỗi tái tạo hình ảnh trong tác vụ khôi phục hình ảnh. Những kết quả này có thể so sánh với các chip kỹ thuật số hiện có thực hiện tính toán với cùng độ chính xác bit, nhưng tiết kiệm đáng kể năng lượng.

Chìa khóa cho hiệu quả năng lượng của NeuRRAM là phương pháp sáng tạo để cảm nhận kết quả đầu ra trong bộ nhớ. Đối với NeuRRAM, nhóm nghiên cứu thiết kế một mạch nơ-ron cảm nhận điện áp và thực hiện chuyển đổi tương tự sang kỹ thuật số theo cách tiết kiệm năng lượng. Cảm biến chế độ điện áp này có thể kích hoạt tất cả các hàng và tất cả cột của mảng RRAM trong một chu kỳ tính toán duy nhất, cho phép độ song song cao hơn.

Để đảm bảo rằng độ chính xác của mọi tính toán AI có thể được duy trì trên các kiến trúc mạng nơ-ron khác nhau, nhóm kỹ sư thiết kế phát triển một tập hợp những kỹ thuật đồng tối ưu hóa thuật toán phần cứng. Kỹ thuật đã được xác minh trên các mạng nơ-ron khác nhau bao gồm mạng nơ-ron tích tụ…

Là một con chip AI thần kinh định hình, NeuroRRAM thực hiện xử lý phân tán song song trên 48 lõi tế bào thần kinh. Để đồng thời đạt được tính linh hoạt cao và hiệu quả cao, NeuRRAM hỗ trợ song song dữ liệu bằng cách ánh xạ một lớp trong mô hình mạng nơ-ron lên nhiều lõi để suy luận song song trên nhiều dữ liệu. Ngoài ra, NeuRRAM cung cấp mô hình song song bằng cách ánh xạ các lớp khác nhau của mô hình lên các lõi khác nhau và thực hiện suy luận.

Trang Thuần  (Tổng hợp)
.
.