DEV Community

Cover image for Cách Sử Dụng Grok 4.3 Miễn Phí: 4 Cách Hoạt Động 2026
Sebastian Petrus
Sebastian Petrus

Posted on • Originally published at apidog.com

Cách Sử Dụng Grok 4.3 Miễn Phí: 4 Cách Hoạt Động 2026

Grok 4.3 là mô hình chủ lực của xAI tính đến tháng 5 năm 2026, với cửa sổ ngữ cảnh 1M token, hỗ trợ đầu vào video gốc và mức giá 1,25 đô la / 2,50 đô la cho mỗi triệu token. Nếu bạn đang thử nghiệm, học API hoặc xây dựng dự án phụ, có ba cách đáng tin cậy để dùng Grok 4.3 mà chưa cần trả tiền: tín dụng khuyến mãi từ xAI Console, Puter.js theo mô hình người dùng trả phí, và giao diện chat miễn phí trên grok.com hoặc X.

Thử Apidog ngay hôm nay

Bài viết này tập trung vào cách triển khai thực tế: tạo tài khoản, gọi API, chạy thử bằng JavaScript/cURL, và chọn hướng phù hợp cho từng loại ứng dụng. Nếu bạn cần hướng dẫn API trả phí đầy đủ, xem Cách sử dụng API Grok 4.3. Nếu bạn quan tâm phiên bản giọng nói, xem Cách sử dụng Grok Voice miễn phí.

Tóm tắt nhanh

  • Ba cách miễn phí để tiếp cận Grok 4.3:
    • xAI Console: dùng tín dụng khuyến mãi.
    • Puter.js: nhà phát triển không trả phí, người dùng cuối chi trả chi phí sử dụng.
    • grok.com / X: dùng qua giao diện chat, không có API.
  • Tốt nhất cho nhà phát triển web công khai: Puter.js.
  • Tốt nhất để thử API thật: xAI Console với tín dụng khuyến mãi.
  • Tốt nhất cho người không viết mã: grok.com hoặc ứng dụng X.
  • ID mô hình trên Puter: x-ai/grok-4.3.
  • ID mô hình khi gọi xAI trực tiếp: grok-4.3.
  • Có thể dùng Apidog để lưu request, đổi BASE_URL, so sánh phản hồi và độ trễ giữa các nhà cung cấp.

Cách 1: Dùng tín dụng khuyến mãi từ xAI Console

Đây là cách phù hợp nhất nếu bạn muốn kiểm thử API Grok 4.3 thật, có khóa API, endpoint sản xuất và định dạng request tương thích OpenAI.

Bước 1: Tạo tài khoản xAI Console

Truy cập:

console.x.ai
Enter fullscreen mode Exit fullscreen mode

Sau đó:

  1. Đăng nhập bằng tài khoản X.
  2. Mở dashboard xAI Console.
  3. Kiểm tra phần Billing để xem tài khoản có tín dụng khuyến mãi hay không.
  4. Tạo API key mới.

Tín dụng khuyến mãi có thể thay đổi theo thời gian. Thông thường, tài khoản mới nhận một lượng tín dụng không tự động gia hạn, đủ để chạy thử tích hợp từ đầu đến cuối.

Bước 2: Lưu API key vào biến môi trường

export XAI_API_KEY="xai-..."
Enter fullscreen mode Exit fullscreen mode

Không hard-code API key vào source code, đặc biệt nếu bạn đẩy mã lên GitHub.

Bước 3: Gọi Grok 4.3 bằng cURL

Endpoint tương thích với OpenAI Chat Completions:

curl https://api.x.ai/v1/chat/completions \
  -H "Authorization: Bearer $XAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-4.3",
    "messages": [
      {
        "role": "user",
        "content": "Giải thích việc lưu bộ nhớ đệm lời nhắc trong ba câu."
      }
    ],
    "reasoning_effort": "low"
  }'
Enter fullscreen mode Exit fullscreen mode

Trong giai đoạn thử nghiệm, nên bắt đầu với:

"reasoning_effort": "low"
Enter fullscreen mode Exit fullscreen mode

mediumhigh có thể tiêu tốn tín dụng nhanh hơn.

Bước 4: Gọi bằng Node.js

Ví dụ tối giản:

const response = await fetch("https://api.x.ai/v1/chat/completions", {
  method: "POST",
  headers: {
    "Authorization": `Bearer ${process.env.XAI_API_KEY}`,
    "Content-Type": "application/json",
  },
  body: JSON.stringify({
    model: "grok-4.3",
    messages: [
      {
        role: "user",
        content: "Viết checklist migrate REST API sang GraphQL.",
      },
    ],
    reasoning_effort: "low",
  }),
});

const data = await response.json();
console.log(data.choices?.[0]?.message?.content);
Enter fullscreen mode Exit fullscreen mode

Ưu và nhược điểm

Ưu điểm Nhược điểm
Dùng API sản xuất thật Tín dụng có giới hạn
Có đầy đủ tính năng Grok 4.3 như ngữ cảnh 1M, video, gọi hàm Điều khoản khuyến mãi có thể thay đổi
Dễ chuyển sang trả phí vì không cần đổi kiến trúc Bị giới hạn bởi hạn mức và số dư tín dụng

Khuyến nghị: dùng xAI Console nếu mục tiêu của bạn là hiểu chính xác API sản xuất hoạt động ra sao. Để xem schema request chi tiết hơn, đọc Cách sử dụng API Grok 4.3.

Cách 2: Dùng Puter.js

Puter.js là lựa chọn đáng chú ý nhất nếu bạn đang xây dựng ứng dụng web công khai và không muốn tự quản lý chi phí API.

Puter.js

Cách Puter.js hoạt động

Puter.js cung cấp một client JavaScript để gọi nhiều LLM lớn như Grok, GPT, Claude, Gemini và DeepSeek.

Điểm khác biệt là mô hình thanh toán:

Người dùng cuối trả phí từ tài khoản Puter của họ. Nhà phát triển không cần cung cấp API key hoặc gắn thẻ thanh toán.

Điều này phù hợp với:

  • Công cụ web miễn phí.
  • Demo công khai.
  • Dự án phụ.
  • Ứng dụng client-side nơi người dùng tự chạy truy vấn.

Không phù hợp nếu bạn cần backend tự động gọi model mà không có tương tác người dùng.

Bước 1: Thêm Puter.js vào HTML

<script src="https://js.puter.com/v2/"></script>
Enter fullscreen mode Exit fullscreen mode

Bạn không cần tạo API key phía server.

Bước 2: Gọi Grok 4.3

<!doctype html>
<html>
  <body>
    <button id="run">Gọi Grok</button>
    <pre id="output"></pre>

    <script src="https://js.puter.com/v2/"></script>
    <script>
      document.getElementById("run").onclick = async () => {
        const response = await puter.ai.chat(
          "Tóm tắt những đánh đổi giữa SQLite và Postgres trong ba gạch đầu dòng.",
          {
            model: "x-ai/grok-4.3",
          }
        );

        document.getElementById("output").innerText =
          response.message.content;
      };
    </script>
  </body>
</html>
Enter fullscreen mode Exit fullscreen mode

Lần đầu chạy, Puter sẽ yêu cầu người dùng đăng nhập hoặc tạo tài khoản Puter. Sau đó, chi phí sử dụng sẽ được tính vào tài khoản của người dùng.

Bước 3: Bật streaming

Nếu muốn hiển thị phản hồi từng phần:

const stream = await puter.ai.chat(
  "Hướng dẫn tôi cách di chuyển ứng dụng React sang Next.js.",
  {
    model: "x-ai/grok-4.3",
    stream: true,
    reasoning_effort: "medium",
  }
);

for await (const chunk of stream) {
  console.log(chunk?.text || "");
}
Enter fullscreen mode Exit fullscreen mode

Trong UI trình duyệt, bạn có thể append từng chunk vào một phần tử <pre>:

const output = document.getElementById("output");

for await (const chunk of stream) {
  output.textContent += chunk?.text || "";
}
Enter fullscreen mode Exit fullscreen mode

Ưu và nhược điểm

Ưu điểm Nhược điểm
Nhà phát triển không trả phí Người dùng phải đăng nhập Puter
Không có API key trong repository Không phù hợp cho hệ thống backend-only
Dễ nhúng vào app web Có thêm bước xác thực người dùng
Có thể dùng cùng kiểu model ID cho nhiều LLM Phụ thuộc vào ngữ cảnh trình duyệt

Khuyến nghị: chọn Puter.js nếu bạn đang làm ứng dụng web công khai, demo hoặc công cụ miễn phí. Nếu truy vấn được chạy bởi backend, bot hoặc cron job, hãy dùng xAI Console trong thời gian còn tín dụng.

Để xem mô hình truy cập miễn phí tương tự với các LLM khác, đọc Cách sử dụng API DeepSeek V4 miễn phíCách sử dụng API GPT-5.5 miễn phí.

Cách 3: Dùng grok.com hoặc ứng dụng X

Nếu bạn chỉ cần hỏi đáp với Grok và không cần gọi từ code, dùng giao diện chat là cách đơn giản nhất.

  • grok.com: đăng nhập bằng tài khoản X và chat trực tiếp trên web.
  • Ứng dụng X: Grok nằm trong ứng dụng web/mobile của X dưới tab Grok.

Cách này phù hợp cho:

  • Câu hỏi nghiên cứu một lần.
  • Kiểm tra prompt trước khi đưa vào API.
  • Đánh giá nhanh phong cách phản hồi của model.
  • Người dùng không cần viết mã.

Hạn chế chính:

  • Không có API.
  • Không tự động hóa được.
  • Có hạn mức tin nhắn hàng ngày.
  • Gói miễn phí trên grok.com mặc định dùng biến thể Grok nhỏ hơn, hiện tại là Grok 4.1. Các gói Premium trên X mở khóa Grok 4.3 trong giao diện chat với hạn mức cao hơn.

Cách 4: OpenRouter

OpenRouter không phải cách dùng Grok 4.3 miễn phí, nhưng đáng nhắc đến nếu bạn muốn một API gateway chung cho nhiều model.

Grok 4.3 trên OpenRouter có giá tương tự xAI trực tiếp: 1,25 đô la / 2,50 đô la cho mỗi 1M token. Tuy nhiên, OpenRouter có một số biến thể Grok miễn phí, ví dụ:

grok-4-fast:free
Enter fullscreen mode Exit fullscreen mode

Nếu bạn cần đúng Grok 4.3, hãy dùng một trong ba cách ở trên. Nếu bạn chỉ cần đầu ra “cùng lớp Grok” và chấp nhận model nhỏ hơn/nhanh hơn, có thể thử biến thể miễn phí trên OpenRouter.

Ví dụ cURL:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "x-ai/grok-4-fast:free",
    "messages": [
      {
        "role": "user",
        "content": "Xin chào!"
      }
    ]
  }'
Enter fullscreen mode Exit fullscreen mode

So sánh bốn cách

Cách Chi phí cho nhà phát triển Chi phí cho người dùng cuối Tốt nhất cho
xAI Console 0 đô la trong giới hạn tín dụng Không áp dụng Thử nghiệm API sản xuất
Puter.js 0 đô la Vài xu mỗi phiên App web công khai, demo, dự án phụ
grok.com / X 0 đô la 0 đô la trong hạn mức Hỏi đáp thủ công, không cần code
OpenRouter model miễn phí 0 đô la Không áp dụng Dùng biến thể Grok miễn phí, không phải Grok 4.3 cụ thể

Kiểm thử request bằng Apidog

Khi bạn có nhiều nhà cung cấp dùng schema gần giống nhau, cách nhanh nhất là lưu request một lần rồi đổi biến môi trường.

Thiết lập đề xuất trong Apidog:

  1. Tạo environment cho xAI:

    • BASE_URL=https://api.x.ai/v1
    • XAI_API_KEY=xai-...
  2. Tạo environment cho OpenRouter:

    • BASE_URL=https://openrouter.ai/api/v1
    • OPENROUTER_API_KEY=...
  3. Tạo request:

POST {{BASE_URL}}/chat/completions
Authorization: Bearer {{XAI_API_KEY}}
Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode

Body cho xAI:

{
  "model": "grok-4.3",
  "messages": [
    {
      "role": "user",
      "content": "So sánh Redis và Memcached trong ba gạch đầu dòng."
    }
  ],
  "reasoning_effort": "low"
}
Enter fullscreen mode Exit fullscreen mode

Body cho OpenRouter chỉ cần đổi model:

{
  "model": "x-ai/grok-4-fast:free",
  "messages": [
    {
      "role": "user",
      "content": "So sánh Redis và Memcached trong ba gạch đầu dòng."
    }
  ]
}
Enter fullscreen mode Exit fullscreen mode

Puter.js chạy trong trình duyệt, nên không nằm cùng luồng test API server-side này. Tuy vậy, bạn vẫn có thể dùng cùng prompt để so sánh chất lượng phản hồi thủ công.

Tải xuống Apidog và tạo collection mới để lưu các biến thể request. Cả xAI và OpenRouter đều dùng schema tương tự OpenAI Chat Completions, nên phần thân request gần như giống nhau ngoại trừ model và header xác thực.

Để tìm hiểu thêm về kiểm thử API đa nhà cung cấp, xem Công cụ kiểm thử API cho kỹ sư QA.

Những đánh đổi khi dùng miễn phí

Các hướng miễn phí đủ tốt để thử nghiệm, nhưng bạn cần tính trước ba giới hạn.

1. Giới hạn tốc độ chặt hơn

Tín dụng miễn phí không đồng nghĩa với throughput cao. Khi test tải hoặc chạy nhiều request song song, bạn có thể gặp lỗi 429 trước khi dùng hết tín dụng.

Nên thêm retry/backoff:

async function sleep(ms) {
  return new Promise((resolve) => setTimeout(resolve, ms));
}

async function callWithRetry(fn, retries = 3) {
  for (let i = 0; i < retries; i++) {
    const res = await fn();

    if (res.status !== 429) {
      return res;
    }

    await sleep(1000 * Math.pow(2, i));
  }

  throw new Error("Rate limit exceeded after retries");
}
Enter fullscreen mode Exit fullscreen mode

2. Lưu bộ nhớ đệm prompt ít tạo khác biệt trong test nhỏ

Prompt caching với giá 0,20 đô la cho mỗi 1M token được lưu là điểm mạnh khi bạn có prompt hệ thống dài và lưu lượng ổn định. Với vài chục request thử nghiệm, mức tiết kiệm thường không đáng kể.

3. Hỗ trợ hạn chế

Tài khoản miễn phí thường dựa vào tài liệu và cộng đồng. Nếu bạn đang debug sự cố sản xuất, cần cân nhắc gói trả phí.

Khi nào nên chuyển sang trả phí?

Bạn nên rời mô hình miễn phí khi gặp một trong các dấu hiệu sau:

  1. Lưu lượng ổn định: bạn chạm rate limit nhiều lần mỗi tuần.
  2. Prompt hệ thống dài: bạn có prompt ổn định từ 50k token trở lên và có thể hưởng lợi từ prompt caching.
  3. Yêu cầu tuân thủ: bạn cần audit log, SOC 2, BAA hoặc lưu trữ dữ liệu theo khu vực.
  4. Backend cần tự gọi model: không thể phụ thuộc vào phiên trình duyệt hoặc đăng nhập người dùng.

Việc di chuyển thường không phức tạp nếu bạn đã tách BASE_URL, API key và model thành biến cấu hình.

Câu hỏi thường gặp

Grok 4.3 có thực sự miễn phí không?

Tùy cách dùng:

  • Trên xAI Console, đó là tín dụng khuyến mãi không tự động gia hạn.
  • Trên Puter.js, miễn phí cho nhà phát triển; người dùng cuối chi trả.
  • Trên grok.com, đó là hạn mức chat miễn phí hàng ngày.

Tôi có thể dùng Grok 4.3 từ backend mà không trả phí không?

Có, trong thời gian tín dụng xAI Console còn hiệu lực. Sau đó, bạn cần chuyển sang trả phí hoặc dùng mô hình mà người dùng tự chi trả, như Puter.js ở phía trình duyệt.

Puter.js có chạy trong Node.js không?

Puter.js ưu tiên trình duyệt. Mô hình người dùng trả phí được thiết kế quanh phiên đăng nhập trên trình duyệt. Nếu workload của bạn là backend-only, xAI Console là hướng miễn phí phù hợp hơn.

ID mô hình Grok 4.3 trên Puter là gì?

Dùng:

x-ai/grok-4.3
Enter fullscreen mode Exit fullscreen mode

ID mô hình Grok 4.3 trên xAI trực tiếp là gì?

Dùng:

grok-4.3
Enter fullscreen mode Exit fullscreen mode

Tín dụng miễn phí có dùng được cho gọi hàm và đầu vào video không?

Có. Tín dụng Console áp dụng cho các tính năng Grok 4.3 như ngữ cảnh 1M, gọi hàm, đầu vào video và mức độ suy luận. Tuy nhiên, đầu vào video có thể tiêu tốn ngữ cảnh nhanh, nên cần theo dõi token.

Grok Voice miễn phí khác gì Grok 4.3 text?

Grok Voice có cấu trúc miễn phí riêng trên Console, không tính theo phút trong ngữ cảnh được đề cập. Grok 4.3 text dùng tín dụng. Xem thêm Cách sử dụng Grok Voice miễn phí.

Có phiên bản Grok 4.3 mini miễn phí không?

Chưa có. xAI chưa phát hành SKU mini riêng cho dòng 4.3. Lựa chọn gần nhất là grok-4-fast:free trên OpenRouter, nhưng đó không phải Grok 4.3 đầy đủ.

Kết luận

Nếu bạn muốn dùng Grok 4.3 miễn phí, hãy chọn theo loại dự án:

  • Dùng xAI Console nếu bạn muốn thử API sản xuất thật bằng tín dụng khuyến mãi.
  • Dùng Puter.js nếu bạn xây dựng ứng dụng web công khai và muốn người dùng tự chi trả chi phí sử dụng.
  • Dùng grok.com / X nếu bạn chỉ cần chat thủ công, không cần code.
  • Dùng OpenRouter free model nếu bạn chấp nhận biến thể Grok miễn phí thay vì Grok 4.3 cụ thể.

Nếu dự án không phù hợp với các hướng trên, mức giá 1,25 đô la / 2,50 đô la cho mỗi 1M token vẫn đủ thấp cho nhiều dự án phụ. Để triển khai API trả phí, đọc Cách sử dụng API Grok 4.3. Nếu muốn so sánh trực tiếp với OpenAI realtime voice, xem Grok Voice vs GPT-Realtime.

Tạo request một lần trong Apidog, tách BASE_URL, API key và model thành biến môi trường, sau đó bạn có thể chuyển giữa các nhà cung cấp mà không phải viết lại toàn bộ tích hợp.

Apidog Interface

Top comments (0)