Fully offline suitcase robot built around Jetson Orin

**Fully offline suitcase robot built around Jetson Orin**

Nếu bạn đang tìm một robot nhanh, có khả năng mạnh mẽ và có “ý kiến” riêng, có thể trò chuyện ở bất cứ đâu ngay cả khi không có kết nối di động hay Wi‑FI, Redditor CreativelyBankrupt đã có một sản phẩm muốn giới thiệu. Người đam mê LLM này đã thiết kế “một robot vali hoàn toàn offline … quanh một Jetson Orin NX SUPER 16 GB” và đặt tên là Sparky. Nó chạy Gemma 4 E4B cục bộ, tích hợp hơn 30 cảm biến để nhận thức ngữ cảnh, và “có quan điểm riêng.” Bạn có thể xem video nhúng bên dưới để hiểu ý nghĩa của điều này và chứng kiến đôi mắt “googly” của Sparky trong và ngoài vali.

Built a fully offline suitcase robot around a Jetson Orin NX SUPER 16GB. Gemma 4 E4B, ~200ms cached TTFT, 30+ sensors, no WiFi/BT/cellular. He has opinions.
from r/LocalLLaMA

Vì vậy, Sparky không chỉ di động; sức mạnh xử lý và dải cảm biến dày đặc khiến nó trở thành một lực lượng đáng gờm khi ra ngoài – ngay cả khi không có lưới điện. Tuy nhiên, sau khi nghe các cuộc trò chuyện trong video, tôi có phần muốn để Sparky ở nhà và thay vào đó mang theo Marvin the Paranoid Android.

Trong subreddit r/LocalLLaMA, CreativelyBankrupt đã trình bày “công thức” cho người bạn kỹ thuật số đầy cá tính này. “Sparky chạy hoàn toàn trên Jetson, sử dụng Gemma 4 E4B ở chế độ Q4_K_M qua llama.cpp, kèm bộ nhớ cache KV q8_0 và flash attention. 12K context [conversation memory], vai trò hệ thống gốc,” CreativelyBankrupt giải thích. Thêm vào đó, hơn 30 cảm biến đa dạng cho Sparky một “cửa sổ” nhìn vào thế giới thực bất kể bạn đưa nó đến đâu.

Bí mật:  4 Sự Thật Không Dễ Chấp Nhận Về Home Assistant

Robot dạng vali này cũng có hiệu năng khá ấn tượng. Thời gian Time‑to‑First‑Token (TTFT) khoảng 200 ms cho phép Sparky nhanh chóng bắt đầu tạo ra phản hồi, và sau đó xử lý khoảng 14–15 token mỗi giây, theo lời người đam mê LLM. Phản hồi nghe tự nhiên (đối với robot), nhờ SenseVoiceSmall thực hiện chuyển giọng nói thành văn bản và Piper thực hiện chuyển văn bản thành giọng nói. Piper được đồng bộ với khuôn mặt PixiJS, và hoạt ảnh miệng cập nhật ở tần suất 43 Hz. CreativelyBankrupt lưu ý rằng “Vision và OCR hiện đã được tích hợp sẵn trong Gemma 4.” Bạn cũng có thể cấu hình và tương tác với Sparky qua một dãy nút bấm, một joystick và một nút mã hoá (encoder) analog.

CreativelyBankrupt đã chia sẻ nguồn gốc của Sparky trên Reddit, một phần để tìm kiếm gợi ý và mẹo tối ưu Gemma 4 E4B trên Orin‑class hardware. Các phản hồi chủ yếu ngưỡng mộ dự án “cool… adorable… cute… kitschy…” này.

offline robot, Jetson Orin, LLM

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top