Truy cập Mô hình
Định tuyến
Section titled “Định tuyến”Khi một tác vụ chạy, bộ điều khiển tác nhân gọi một LLM. Cách cuộc gọi đó được định tuyến phụ thuộc vào trình thực thi và chế độ xác thực:
Agent harness ↓┌─────────────────────────────────────────┐│ Credits mode │ BYOK mode ││ │ ││ Rebyte Model Proxy │ Direct to ││ (routes to any │ provider API ││ provider) │ (org's own key) │└─────────────────────────────────────────┘ ↓ ↓Anthropic / OpenAI / Google / OpenRouterChế độ Tín dụng — các yêu cầu được định tuyến qua proxy mô hình Rebyte, nơi xử lý xác thực với các nhà cung cấp thượng nguồn. Trình thực thi claude có thể truy cập các mô hình từ bất kỳ nhà cung cấp nào (Anthropic, OpenAI, Google, OpenRouter) thông qua proxy này.
Chế độ BYOK — các yêu cầu đi trực tiếp đến nhà cung cấp bằng khóa API riêng của tổ chức. Mỗi trình thực thi chỉ bị giới hạn ở các mô hình của nhà cung cấp gốc của nó (ví dụ: claude với BYOK chỉ có thể sử dụng các mô hình của Anthropic).
Các mô hình khả dụng
Section titled “Các mô hình khả dụng”| Mô hình | Nhà cung cấp | Trình thực thi |
|---|---|---|
minimax-m2.7 | Open Source | claude, opencode |
kimi-k2.5 | Open Source | claude, opencode |
glm-5 | Open Source | claude, opencode |
gemini-3-flash | claude, opencode | |
auto-gemini-3 | gemini | |
gemini-3.1-pro | claude, opencode | |
claude-sonnet-4.6 | Anthropic | claude, opencode |
gpt-5.3-codex | OpenAI | claude, codex, opencode |
gpt-5.4 | OpenAI | claude, codex, opencode |
claude-opus-4.6 | Anthropic | claude, opencode |
Các mô hình mã nguồn mở được định tuyến qua OpenRouter. Tất cả các mô hình khác được định tuyến trực tiếp đến API của nhà cung cấp của chúng.
Mặc định
Section titled “Mặc định”| Trình thực thi | Mô hình mặc định |
|---|---|
claude | claude-sonnet-4.6 |
codex | gpt-5.4 |
opencode | gemini-3.1-pro |
gemini | auto-gemini-3 |
Người dùng có thể ghi đè mô hình cho mỗi tác vụ.
Kiểm soát của quản trị viên
Section titled “Kiểm soát của quản trị viên”Quản trị viên tổ chức quản lý quyền truy cập mô hình thông qua Cài đặt > Tích hợp > Tác nhân mã.
Quản trị viên có thể:
- Đặt khóa BYOK cho mỗi trình thực thi (
claude,codex,gemini) — chỉ dành cho quản trị viên - Xóa khóa BYOK — ngay lập tức đưa tổ chức trở lại chế độ tín dụng cho trình thực thi đó — chỉ dành cho quản trị viên
Tất cả thành viên tổ chức có thể:
- Kiểm tra khóa — xác minh khóa API đã lưu trữ là hợp lệ
- Xem trạng thái khóa — kiểm tra xem trình thực thi nào có khóa BYOK đang hoạt động
BYOK (Bring Your Own Key)
Section titled “BYOK (Bring Your Own Key)”BYOK cho phép một tổ chức định tuyến các yêu cầu LLM trực tiếp đến nhà cung cấp bằng cách sử dụng khóa API riêng của họ.
Cách hoạt động
Section titled “Cách hoạt động”- Quản trị viên lưu trữ khóa API cho một trình thực thi (
claude,codex, hoặcgemini) trong Cài đặt > Tích hợp > Tác nhân mã - Khi một thành viên nhóm chạy một tác vụ, tác nhân xác thực trực tiếp với nhà cung cấp bằng khóa của tổ chức
- Không có tín dụng Rebyte nào được tiêu thụ — tổ chức thanh toán trực tiếp cho nhà cung cấp
- Nếu không có khóa BYOK nào được cấu hình, tác vụ sẽ được định tuyến qua proxy mô hình Rebyte và tiêu thụ tín dụng
Hạn chế mô hình BYOK
Section titled “Hạn chế mô hình BYOK”Với BYOK, mỗi trình thực thi bị giới hạn ở các mô hình của nhà cung cấp gốc của nó:
| Trình thực thi | Nhà cung cấp | Mô hình BYOK |
|---|---|---|
claude | Anthropic | claude-sonnet-4.6, claude-opus-4.6 |
codex | OpenAI | gpt-5.4, gpt-5.3-codex |
gemini | auto-gemini-3 |
opencode không hỗ trợ BYOK — nó chỉ định tuyến qua proxy mô hình.
Nếu không có BYOK, trình thực thi claude có thể truy cập các mô hình từ bất kỳ nhà cung cấp nào thông qua proxy mô hình. Với BYOK, nó chỉ bị giới hạn ở các mô hình của Anthropic, vì khóa Anthropic của tổ chức không thể xác thực với các nhà cung cấp khác.