Một công ty Ấn Độ vừa công bố mô hình trí tuệ nhân tạo (AI) mới, được thiết kế để chạy trên các điện thoại cơ bản và không cần kết nối internet – một bước đi có thể mở rộng tiếp cận AI tới những khu vực hẻo lánh trên thế giới.
Sarvam AI, công ty có trụ sở tại Bengaluru, đã giới thiệu loạt mô hình mới của mình tại hội nghị AI Impact Summit của Ấn Độ ở Delhi. Sự kiện kết thúc vào thứ Bảy và thu hút nhiều tên tuổi lớn trong ngành công nghệ làm diễn giả chính.
Đây là lần đầu tiên hội nghị AI cấp toàn cầu được tổ chức tại miền Nam toàn cầu, và Ấn Độ đã tận dụng sự kiện này để khẳng định vị thế của mình trong một lĩnh vực vốn do Mỹ và Trung Quốc thống trị. Hội nghị đã trình chiếu nhiều hệ thống AI được đào tạo trong nước, trải rộng các lĩnh vực như giáo dục, công nghệ giọng nói, y tế và quản trị.
Nhưng điểm thu hút chính là việc Sarvam ra mắt hai mô hình ngôn ngữ lớn (large‑language AI models), cùng các hệ thống cập nhật về giọng nói và thị giác, và một trợ lý AI được trình diễn chạy trực tiếp trên điện thoại kiểu “Nokia brick” mà không cần internet.
Hệ thống này là một phần của Sarvam Edge – nền tảng được thiết kế để hoạt động ngay trên điện thoại thông minh và máy tính xách tay, thay vì dựa vào các trung tâm dữ liệu từ xa. Sarvam cho biết điều này cho phép nhận dạng giọng nói, dịch thuật và chuyển văn bản thành giọng nói ngay cả ở những khu vực có tín hiệu yếu hoặc không có kết nối, một yếu tố quan trọng tại Ấn Độ và các khu vực đang phát triển khác, nơi internet di động vẫn còn không ổn định.
Theo dữ liệu của Ngân hàng Thế giới đến năm 2024, chỉ khoảng 71 % dân số trên thế giới có kết nối internet, và ngay cả những khu vực được xem là “có kết nối” cũng thường xuyên gặp phải các vấn đề mạng.
“Chúng tôi muốn phục vụ một tỷ người Ấn Độ, và các mô hình nhỏ, hiệu quả là điều quan trọng,” Aditya Dhawala, quản lý sản phẩm tại Sarvam, nói tại buổi ra mắt.
Tại hội nghị, Sarvam đã trình diễn trợ lý AI chạy trên điện thoại cơ bản thông qua một cuộc gọi, cho phép người dùng tương tác bằng các ngôn ngữ Ấn Độ mà không cần kết nối internet. Công ty cho biết đang hợp tác với HMD, công ty sở hữu thương hiệu Nokia, và nhà sản xuất chip Qualcomm để tối ưu hiệu năng trên các bộ xử lý di động hiện có.
Trong một bài đăng trên blog công ty, Sarvam nhấn mạnh việc tập trung vào điện thoại cơ bản như một cách suy nghĩ lại về cách AI được cung cấp và thanh toán. “Trí tuệ nên hoạt động ở mọi nơi. Không phải được gọi từ những máy chủ xa xôi, không bị chặn bởi kết nối, không tính phí theo truy vấn. Chỉ cần có, ngay lập tức và cục bộ,” blog viết.
Công ty khẳng định việc chạy AI trên thiết bị loại bỏ chi phí đám mây định kỳ và nâng cao tính riêng tư. “Không có phí mỗi truy vấn, không có giá dựa trên mức độ sử dụng, không lo lắng về việc mở rộng khi lượng người dùng tăng. Chi phí suy luận đã được trả trước và được nhúng trong thiết bị,” blog nói thêm.
“Dữ liệu của bạn không bao giờ rời khỏi thiết bị… Không có máy chủ nào ghi lại các truy vấn của bạn, không có cơ sở dữ liệu nào lưu trữ các cuộc trò chuyện của bạn.”
Các chuyên gia độc lập nhận xét rằng ý tưởng này không mới – các ông lớn công nghệ từ lâu đã cung cấp các phiên bản nhỏ hơn, nhanh hơn của các mô hình cờ hiệu của mình, và Apple đã đẩy mạnh AI trên thiết bị một phần vì lý do bảo mật. Tuy nhiên, thách thức lớn vẫn là làm sao để các hệ thống này thực sự hữu dụng trên các thiết bị kém mạnh, giá rẻ và trong môi trường có kết nối không ổn định.
“Một mô hình Edge có thể chạy trên iPhone hiện đại là chuyện này, còn mô hình có thể chạy trên điện thoại kém mạnh hơn thì lại là chuyện khác,” Karan Girotra, giáo sư về hoạt động, công nghệ và đổi mới tại Cornell Tech, nhận xét.
Nếu công ty có thể duy trì khả năng này trên các thiết bị giá rẻ ngoài môi trường demo có kiểm soát, Girotra cho rằng tiềm năng có thể mở rộng ra xa hơn những khoảng trống kết nối của Ấn Độ.
“Có khả năng vị trí độc đáo này sẽ tìm được thị trường rộng lớn hơn rất nhiều so với Ấn Độ,” ông nói.
Phía sau trợ lý chạy trên thiết bị là nền tảng rộng hơn của các mô hình được công bố tại hội nghị: một mô hình ngôn ngữ 30 tỷ tham số và một hệ thống 105 tỷ tham số lớn hơn. Để so sánh, các hệ thống tiên tiến như GPT‑4 của OpenAI ước tính có hàng trăm tỷ, thậm chí hàng nghìn tỷ tham số, khiến các mô hình của Sarvam nằm dưới những hệ thống toàn cầu lớn nhất.
Cả hai mô hình đều sử dụng kiến trúc mixture‑of‑experts (hỗn hợp chuyên gia), chỉ kích hoạt một phần nhỏ các tham số tổng thể tại một thời điểm, giúp giảm chi phí tính toán. Mô hình 30B hỗ trợ cửa sổ ngữ cảnh 32.000 đơn vị từ cho các cuộc hội thoại, trong khi mô hình 105B cung cấp cửa sổ 128.000 đơn vị từ cho những nhiệm vụ suy luận phức tạp hơn.
Các nhà phân tích cho rằng câu hỏi không phải là liệu Sarvam có thể “đánh bại” Thung lũng Silicon hay Bắc Kinh về kích thước mô hình, mà là liệu họ cần phải làm như vậy không.
“Bạn không cần phải tranh tài trực tiếp để có mô hình thông minh nhất,” Girotra nói. “Chiến lược thông minh ở đây là tập trung vào những thế mạnh của mình, như mọi quốc gia đều làm.”
Ông thêm rằng công ty dường như đã chọn lựa một số khía cạnh mà họ có thể có lợi thế chiến lược… và họ đang tập trung vào đó, điều này là chiến lược đúng đắn.
Điều này đưa Sarvam vào phân khúc khác của thị trường AI.
“Họ có đang cạnh tranh với ChatGPT không? Không phải với mọi khách hàng của ChatGPT,” Girotra nhận xét. “Đối với những khách hàng doanh nghiệp cao cấp, có thể không. Nhưng đối với những người có nguồn lực hạn chế và cần các ngôn ngữ địa phương, chắc chắn có.”
Hội nghị AI Ấn Độ tập trung mạnh vào vấn đề “sở hữu chủ quyền” – cách các quốc gia đang phát triển có thể giữ vai trò trong việc phát triển AI trên toàn cầu.
Ngoài Sarvam AI, tuần này còn có nhiều mô hình mới được công bố. Tech Mahindra, một trong những công ty công nghệ thông tin lớn nhất Ấn Độ, đã giới thiệu mô hình ngôn ngữ Hindi‑first dành cho giáo dục và dịch vụ công dân. Các startup như Gnani.ai ra mắt hệ thống AI giọng nói đa ngôn ngữ, trong khi BharatGen và Fractal Analytics trình bày các mô hình tập trung vào các ứng dụng theo ngành.
Sarvam cho biết các mô hình mới này được đào tạo trong nước sau khi tiếp cận nguồn lực tính toán do chính phủ hỗ trợ, thay vì tinh chỉnh các hệ thống độc quyền của nước ngoài.
Vivek Raghavan, đồng sáng lập Sarvam, đã nhấn mạnh việc thúc đẩy chủ quyền AI của Ấn Độ là “một nhu cầu thiết yếu, không phải lựa chọn, để duy trì độc lập kỹ thuật số.”
“Nếu không, chúng ta sẽ trở thành một thuộc địa kỹ thuật số, phụ thuộc vào các quốc gia khác cho công nghệ cốt lõi này,” ông nói.
Tags: AI on Edge, Offline AI, Indian AI







