Nhịp sống số

Agora Và Seeed Studio Hợp Tác Phát Triển AI Hiện Thân Tương Tác Bằng Giọng Nói Tại NVIDIA GTC 2026

agora-1-1773805244.jpeg
 

Trí tuệ nhân tạo (AI) đang bước sang một giai đoạn phát triển mới khi không còn chỉ tồn tại đơn thuần trong phạm vi nền tảng đám mây mà dần hiện diện trong thế giới vật lý, từ robot, thiết bị biên (edge devices) đến các hệ thống thông minh hoạt động trong môi trường thực.

Theo dự báo, thị trường AI hiện thân (embodied AI) toàn cầu sẽ tăng trưởng từ 4,44 tỷ USD vào năm 2025 lên 23,06 tỷ USD vào năm 2030, cho thấy sự bùng nổ của thế hệ máy móc thông minh có khả năng cảm nhận, suy luận và hành động như một phần của đời sống thực. Trong làn sóng công nghệ mới này, giọng nói đang dần trở thành giao diện tự nhiên nhất giữa con người và máy móc.

Tại NVIDIA GTC 2026, Agora – nhà cung cấp hạ tầng tương tác thời gian thực và AI hội thoại hàng đầu thế giới – đã công bố hợp tác với Seeed Studio, nền tảng đổi mới phần cứng mã nguồn mở chuyên cung cấp công cụ phát triển, mô-đun phần cứng và dịch vụ sản xuất cho các ứng dụng IoT, robot và AI biên (edge AI). Sự hợp tác này nhằm thúc đẩy việc xây dựng các hệ thống embodied AI được thiết kế xoay quanh giao tiếp bằng giọng nói, cho phép con người giao tiếp với các thiết bị thông minh một cách tự nhiên như đang trò chuyện với người thật.

Động thái này diễn ra trong bối cảnh Việt Nam đang mở rộng hợp tác với NVIDIA để xây dựng các trung tâm dữ liệu và nghiên cứu AI trong nước. Sự kiện được xem là cơ hội để các nhà phát triển nội địa tận dụng các bộ công cụ và nền tảng công nghệ quốc tế thúc đẩy quá trình tạo ra những thiết bị thông minh do Việt Nam phát triển và sản xuất.

Với sự phối hợp của các đối tác trong hệ sinh thái như NVIDIA, Hugging Face và Pollen Robotics, sáng kiến này mang đến cho cộng đồng nhà phát triển một nền tảng công nghệ hoàn chỉnh để xây dựng robot AI thời gian thực và các thiết bị thông minh tương tác bằng giọng nói. Hệ thống tích hợp nhiều thành phần quan trọng, bao gồm:

  • Robot hình người Reachy Mini
  • Nền tảng tính toán AI biên Jetson Orin Nano của NVIDIA
  • Các mô hình AI đa phương thức mã nguồn mở từ Hugging Face
  • Bộ giải pháp AI hội thoại của Agora (ConvoAI)

Sự kết hợp giữa phần cứng robot và điện toán AI biên này được kỳ vọng sẽ trở thành một khuôn mẫu phát triển cho cộng đồng kỹ sư toàn cầu, trong đó có Việt Nam – nơi Luật Trí tuệ Nhân tạo 2026 vừa được ban hành – giúp xây dựng các tác nhân AI hiện diện trong thế giới vật lý một cách tiên tiến và tuân thủ quy định.

Sự hợp tác này sẽ được giới thiệu tại Seeed Studio Embodied AI Hackathon, diễn ra tại Santa Clara trong hai ngày 21–22/3, ngay sau sự kiện GTC.

Hiện Thực Hóa AI Trong Thế Giới Vật Lý Với Reachy Mini

Trọng tâm của sáng kiến là Reachy Mini, robot hình người mã nguồn mở được phát triển bởi Hugging Face và Pollen Robotics, đồng thời được hỗ trợ bởi hệ sinh thái phần cứng của Seeed Studio.

agora-2-1773805276.jpeg
 

“Trí tuệ nhân tạo AI đang có bước chuyển dịch cấp tốc từ các ứng dụng trên nền tảng đám mây sang robot và các thiết bị thông minh,” ông Tony Wang, Đồng sáng lập kiêm Giám đốc Doanh thu của Agora, chia sẻ. “Trong môi trường thực, AI cần khả năng tương tác tự nhiên và theo thời gian thực. Thông qua hợp tác với Seeed Studio cùng các đối tác như NVIDIA, các nhà phát triển có thể kết hợp hạ tầng AI hội thoại của Agora với các nền tảng robot và công nghệ AI biên để tạo ra những tác nhân thông minh có thể giao tiếp bằng giọng nói trong đời sống hàng ngày.”

Trong khuôn khổ sự kiện tại hackathon, các nhóm phát triển sẽ xây dựng các hệ thống AI hiện thân bằng cách tích hợp robot Reachy Mini, nền tảng AI biên NVIDIA Jetson, công nghệ nhận dạng giọng nói từ ElevenLabs, các mô hình đa phương thức của Hugging Face và giải pháp AI hội thoại của Agora.

Kiến trúc này cho phép các mô hình AI đa phương thức tiên tiến vận hành mượt mà trên phần cứng biên, đồng thời mở ra khả năng tương tác giữa con người và robot một cách tự nhiên thông qua giọng nói. Kết quả là sự ra đời của thế hệ robot AI mới có khả năng cảm nhận, suy luận và trò chuyện theo thời gian thực, mở ra nhiều ứng dụng trong robot cá nhân, trợ lý thông minh và các hệ thống đồng hành AI.

Phát Triển Thiết Bị AI Giọng Nói Với reSpeaker

Ngoài robot, Agora và Seeed Studio còn mở rộng hợp tác sang các thiết bị AI biên tương tác bằng giọng nói thông qua nền tảng reSpeaker.

Được trang bị bộ xử lý giọng nói AI XMOS XVF3800, hệ thống reSpeaker với cụm 4 micro mang đến khả năng thu âm từ xa với độ chính xác cao, bao gồm:

  • Cụm 4 micro dạng vòng, thu âm 360° trong phạm vi lên đến 5 mét
  • Các thuật toán xử lý âm thanh AI tích hợp sẵn như Beamforming, AGC, AEC, DoA và Noise Suppression
  • Khả năng tích hợp linh hoạt để triển khai nhanh chóng
  • Thiết kế plug-and-play nhỏ gọn, dễ dàng tích hợp vào các thiết bị thông minh

Nhờ các tích hợp trên, hệ thống AI giọng nói giờ đây có thể hoạt động ổn định trong môi trường nhiều tiếng ồn, phù hợp với các kịch bản như nhà thông minh, hội nghị trực tuyến, trợ lý ảo và robot.

Khi kết hợp với nền tảng AI hội thoại của Agora, reSpeaker trở thành một hệ thống AI hội thoại hoàn chỉnh trên thiết bị biên. Kiến trúc này cho phép tạo ra một vòng lặp hội thoại theo thời gian thực, trong đó:

1. Hệ thống micro của reSpeaker thu nhận giọng nói từ người dùng

2. Âm thanh được truyền qua mạng thời gian thực do Agora phát triển

3. Hệ thống AI hội thoại của Agora thực hiện nhận diện giọng nói, xử lý ngôn ngữ và tổng hợp phản hồi

3. Phản hồi được truyền trở lại thiết bị và phát ra qua loa

Chuỗi xử lý từ đầu đến cuối này cho phép các nhà phát triển xây dựng nhiều thiết bị AI giọng nói sẵn sàng triển khai như trợ lý thông minh, giao diện robot, AI companion và các thiết bị IoT thông minh.

Ông Leslie Liao, Phó Chủ tịch Sản phẩm tại Seeed Studio, cho biết: “Sự tích hợp liền mạch giữa nền tảng AI hội thoại của Agora và reSpeaker đóng vai trò như một chiếc tai nghe thông minh cho các hệ thống AI hiện thân, giúp robot và thiết bị thông minh có thể giao tiếp với con người thông qua hội thoại tự nhiên theo thời gian thực. Cùng với hệ sinh thái phần cứng mở và các đối tác như NVIDIA và Hugging Face, chúng tôi đang trao quyền cho cộng đồng nhà phát triển xây dựng thế hệ ứng dụng AI hiện thân tiếp theo.”

agora-3-1773805275.png
 

Thúc Đẩy Thế Hệ AI Vật Lý Đa Phương Thức

Để đánh dấu bước chuyển từ AI trên phần mềm sang AI hoạt động trong môi trường thực, tại sự kiện hackathon năm nay, Agora sẽ trao giải thưởng Convo AI Embodied Intelligence để tôn vinh các dự án có khả năng phát triển này.

Các dự án được vinh danh sẽ đáp ứng các tiêu chí:

  • Giọng nói đóng vai trò lớp tương tác chính giữa con người và robot
  • Khả năng cảm nhận và hành động theo thời gian thực nhờ AI đa phương thức
  • Kiến trúc phần cứng linh hoạt cho phép mở rộng trên nhiều nền tảng chip
  • Thiết kế hướng đến khả năng triển khai ở quy mô thực tế

Không dừng lại ở những phiên bản thử nghiệm, giải thưởng hướng đến các giải pháp có thể phát triển thành nền tảng hoàn chỉnh, đặt nền móng cho thế hệ AI vật lý có khả năng mở rộng và ứng dụng rộng rãi trong tương lai.

Thúc Đẩy Cộng Đồng Nhà Phát Triển Embodied AI

Embodied AI Hackathon hướng tới cộng đồng lập trình viên, kỹ sư và  cộng đồng yêu thích robot, mang đến cơ hội khám phá thế hệ robot AI và thiết bị thông minh điều khiển bằng giọng nói.

Người tham gia sẽ được trải nghiệm thực tế với:

  • Robot hình người Reachy Mini bản Lite
  • Bộ công cụ phát triển AI hội thoại từ Agora
  • Các mô hình và nền tảng AI mã nguồn mở
  • Sự hỗ trợ kỹ thuật từ các đối tác công nghệ trong hệ sinh thái

Các dự án sẽ được đánh giá dựa trên mức độ triển khai kỹ thuật, tính sáng tạo và độ hoàn thiện của sản phẩm, với tổng giá trị giải thưởng hơn 6.000 USD, bao gồm các coupon giá trị cao, robot Reachy Mini Lite và thiết bị Amazing Hand.