OpenAI ra mắt GPT‑Rosalind, mô hình LLM chuyên sâu về sinh học

Việc lọc qua các bộ dữ liệu genôm dường như giống như uống nước từ vòi phun lửa trong khi bịt mắt, nhưng GPT‑Rosalind mới của OpenAI hứa hẹn sẽ biến hỗn loạn thành sáng suốt. Được công bố vào thứ Năm, AI được “tinh chỉnh” cho sinh học này đánh dấu một bước ngoặt mạnh mẽ từ các mô hình đa năng sang chuyên môn hóa sâu và hẹp. Bạn đang chứng kiến “cuộc đua chuyên môn hóa” trong trí tuệ nhân tạo—các nền tảng rộng lớn nhường chỗ cho các dịch vụ chuyên biệt thực sự hiểu lĩnh vực của bạn.

Được huấn luyện trên 50 quy trình, hoài nghi theo thiết kế

_Mô hình giải quyết phân tích protein và khám phá thuốc với sự hoài nghi tích hợp sẵn đối với các mục tiêu kém tiềm năng._
Khác với cách tiếp cận “công cụ đa năng” của ChatGPT, GPT‑Rosalind đã thành thạo 50 quy trình sinh học cụ thể trong quá trình huấn luyện. Phân tích trình tự, lập hồ sơ biểu hiện và hoá sinh protein đều được chú trọng riêng biệt. Hệ thống kết nối với các cơ sở dữ liệu công cộng lớn để đề xuất các đường dẫn sinh học, ưu tiên khám phá thuốc và liên kết kiểu gen với kiểu hình—những nhiệm vụ thường đòi hỏi phải tham khảo hàng chục nguồn khác nhau.

“Chúng tôi đang giải quyết hai vấn đề cốt lõi: khối lượng dữ liệu miền quá khổng lồ và độ chuyên môn cực cao,” Yunyun Wang, Trưởng sản phẩm Life Sciences của OpenAI, cho biết. Một nhà di truyền học khi đọc tài liệu về thần kinh học sẽ gặp phải sự bối rối tương tự như cố gắng giải mã lời bài hát K‑pop mà không có ngữ cảnh.

Việc huấn luyện của mô hình nhấn mạnh tính hoài nghi hơn là sự xu nịnh. Thay vì nhiệt tình đồng ý với mọi giả thuyết, GPT‑Rosalind được cho là sẽ từ chối những mục tiêu thuốc kém tiềm năng và đặt câu hỏi trước những mối liên kết yếu. OpenAI khẳng định mô hình có khả năng suy luận “cấp độ chuyên gia” trong các quy trình đa bước, dù các tiêu chuẩn đo lường chi tiết vẫn chưa được công bố.

Bí mật: 20 Gợi ý Google Gemini AI Biến Ảnh Chân Dung Của Bạn Thành Tranh Điện Ảnh Ngay Lập Tức

Cạnh tranh trong “cuộc đua trang thiết bị phòng thí nghiệm”

_Anthropic và các gã khổng lồ công nghệ cung cấp công cụ rộng hơn, trong khi OpenAI đi sâu vào sinh học._
Lần ra mắt này đặt OpenAI đối đầu với Claude của Anthropic, một mô hình vẫn duy trì khả năng đa năng nhưng có thể kết nối tới các cơ sở dữ liệu nghiên cứu như bioRxiv và ChEMBL. Việc truy cập hiện vẫn giới hạn cho các thực thể có trụ sở ở Mỹ thông qua “triển khai đáng tin cậy” vì lo ngại lạm dụng—bởi không ai muốn AI bị sử dụng để tối ưu hóa virus. Một Plugin Nghiên cứu Khoa học Đời sống nhẹ hơn sẽ sớm có sẵn cho công chúng, tuy nhiên chi tiết về khả năng so với mô hình đầy đủ vẫn chưa rõ ràng.
Sự tập trung vào sinh học dựa trên các nỗ lực khoa học hiện có của OpenAI, bao gồm GPT‑4B Micro dành cho kỹ thuật protein và các tối ưu hóa thí nghiệm thực tế của GPT‑5 đã đạt tăng hiệu suất 79×. Các công cụ AI chuyên ngành dường như sẽ trở thành “trang thiết bị phòng thí nghiệm” thiết yếu như máy ly tâm—miễn là chúng chứng minh được độ tin cậy vượt qua những ồn ào ban đầu.
Tags: OpenAI, GPT-Rosalind, Biology AI