DEV Community

Cover image for API Claude Opus 4.7 Miễn Phí Không Giới Hạn
Sebastian Petrus
Sebastian Petrus

Posted on • Originally published at apidog.com

API Claude Opus 4.7 Miễn Phí Không Giới Hạn

Dòng mô hình Claude của Anthropic là một lựa chọn mạnh cho lập trình, tác nhân tự động và suy luận ngữ cảnh dài, nhưng chi phí API có thể khiến nhiều dự án phụ khó bắt đầu. Puter.js cung cấp cách tích hợp Claude không cần khóa Anthropic: người dùng cuối đăng nhập và thanh toán mức sử dụng qua tài khoản Puter, còn ứng dụng của bạn không phải quản lý khóa API hay chịu chi phí trực tiếp.

Dùng thử Apidog hôm nay

Bài viết này hướng dẫn cách thiết lập Claude với Puter.js: chọn model ID, gọi API từ trình duyệt, stream phản hồi, quản lý hội thoại nhiều lượt và các điểm cần cân nhắc trước khi triển khai.

TL;DR

  • Puter.js cho phép gọi Claude từ trình duyệt mà không cần Anthropic API key.
  • Chi phí sử dụng được tính cho người dùng cuối thông qua tài khoản Puter.
  • Các model được hỗ trợ gồm: Opus 4.7, Opus 4.6, Opus 4.6 Fast, Opus 4.5, Opus 4.1, Opus 4, Sonnet 4.6, Sonnet 4.5, Sonnet 4, Haiku 4.5.
  • Tích hợp tối thiểu chỉ cần một thẻ <script> và một lệnh gọi puter.ai.chat.
  • Hỗ trợ stream response, system prompt và hội thoại nhiều lượt.
  • Có thể dùng Apidog để so sánh prompt giữa luồng Puter và API Anthropic chính thức khi bạn cần đánh giá trước khi chuyển đổi.

Cách mô hình “miễn phí không giới hạn” hoạt động

Puter.js là thư viện AI/cloud chạy trong trình duyệt. Thay vì backend của bạn giữ Anthropic API key và chịu phí, người dùng đăng nhập vào Puter; request được tính vào tài khoản Puter của họ. Tài khoản mới có tín dụng khởi đầu, và người dùng có thể nạp thêm nếu cần dùng nhiều hơn.

Với vai trò nhà phát triển, kiến trúc này có ba hệ quả thực tế:

  • Không lưu API key trong codebase: giảm rủi ro lộ khóa, không cần rotate key, không cần quản lý key theo môi trường.
  • Không chịu hạn mức tập trung từ phía bạn: mỗi người dùng chạy trên tài khoản riêng.
  • Không cần thiết lập trực tiếp với Anthropic: Puter đóng vai trò trung gian.

Đổi lại, Puter phù hợp nhất với ứng dụng chạy trong trình duyệt. Một script backend Python hoặc Node.js không thể gọi Puter thuận tiện nếu không có phiên người dùng đã đăng nhập. Với workload backend, hãy cân nhắc API Anthropic chính thức.

Bước 1: Thêm Puter.js vào trang

Với trang HTML tĩnh, thêm script CDN:

<script src="https://js.puter.com/v2/"></script>
Enter fullscreen mode Exit fullscreen mode

Ví dụ đầy đủ:

<!DOCTYPE html>
<html>
<body>
  <script src="https://js.puter.com/v2/"></script>
</body>
</html>
Enter fullscreen mode Exit fullscreen mode

Không cần npm install, không cần cấu hình khóa API, không cần backend.

Nếu bạn đang dùng Vite, Webpack hoặc một app frontend có build step, có thể cài qua NPM:

npm install @heyputer/puter.js
Enter fullscreen mode Exit fullscreen mode
import { puter } from '@heyputer/puter.js';
Enter fullscreen mode Exit fullscreen mode

Dùng CDN khi bạn cần prototype nhanh hoặc trang tĩnh. Dùng NPM khi muốn tích hợp vào dự án frontend có bundler và TypeScript.

Bước 2: Chọn model Claude

Puter dùng model ID theo kiểu đặt tên của Anthropic:

Model ID Khi nào nên dùng
claude-opus-4-7 Model mạnh nhất hiện tại; phù hợp cho suy luận sâu, tác nhân tự động, review code phức tạp
claude-opus-4-6 Opus thế hệ trước; mạnh cho lập trình và suy luận
claude-opus-4.6-fast Biến thể Opus có độ trễ thấp hơn
claude-opus-4-5 Lựa chọn ổn định cho agent production
claude-opus-4-1 Phiên bản cũ, hành vi dễ dự đoán hơn
claude-opus-4 Phiên bản Opus 4 ban đầu
claude-sonnet-4-6 Lựa chọn mặc định cho đa số tác vụ hằng ngày
claude-sonnet-4-5 Sonnet phiên bản trước; vẫn phù hợp cho nhiều use case
claude-sonnet-4 Phiên bản Sonnet 4 ban đầu
claude-haiku-4-5 Nhanh, rẻ; phù hợp cho phân loại hoặc tác vụ khối lượng lớn

Gợi ý chọn nhanh:

  • Dùng claude-sonnet-4-6 làm mặc định.
  • Dùng claude-haiku-4-5 cho phân loại nhanh hoặc tác vụ đơn giản.
  • Dùng claude-opus-4-7 cho prompt khó, lập kế hoạch nhiều bước, review code phức tạp.

Bước 3: Gọi Claude từ trình duyệt

Ví dụ tối thiểu:

<!DOCTYPE html>
<html>
<body>
  <script src="https://js.puter.com/v2/"></script>
  <script>
    puter.ai.chat(
      "Explain quantum computing in simple terms",
      { model: "claude-sonnet-4-6" }
    ).then(response => {
      puter.print(response.message.content[0].text);
    });
  </script>
</body>
</html>
Enter fullscreen mode Exit fullscreen mode

Khi mở file trong trình duyệt, Puter xử lý luồng đăng nhập người dùng nếu cần, gọi model và trả kết quả về trang.

Response có cấu trúc gần với Messages API của Anthropic:

response.message.content[0].text
Enter fullscreen mode Exit fullscreen mode

Với phản hồi văn bản đơn giản, đọc block đầu tiên bằng [0].text. Nếu phản hồi có nhiều phần nội dung, hãy lặp qua response.message.content.

Ví dụ an toàn hơn:

const text = response.message.content
  .filter(block => block.type === "text" || block.text)
  .map(block => block.text)
  .join("");

console.log(text);
Enter fullscreen mode Exit fullscreen mode

Bước 4: Stream phản hồi

Với câu trả lời dài, nên bật stream để UI phản hồi ngay thay vì chờ toàn bộ output hoàn tất.

const response = await puter.ai.chat(
  "Write a detailed essay on the impact of artificial intelligence on society",
  {
    model: "claude-sonnet-4-6",
    stream: true
  }
);

for await (const part of response) {
  puter.print(part?.text);
}
Enter fullscreen mode Exit fullscreen mode

Trong UI chat, bạn có thể append từng chunk vào message hiện tại:

const messageEl = document.querySelector("#assistant-message");

const stream = await puter.ai.chat(
  "Explain how database indexes work",
  {
    model: "claude-sonnet-4-6",
    stream: true
  }
);

for await (const part of stream) {
  if (part?.text) {
    messageEl.textContent += part.text;
  }
}
Enter fullscreen mode Exit fullscreen mode

Bước 5: Tạo hội thoại nhiều lượt

Thay vì truyền một string, truyền mảng message. Mỗi message có rolecontent:

const messages = [
  { role: "user", content: "I am building a Next.js app with Postgres." },
  { role: "assistant", content: "Got it. What do you need help with?" },
  { role: "user", content: "How should I structure the migrations folder?" }
];

const response = await puter.ai.chat(messages, {
  model: "claude-opus-4-7"
});

console.log(response.message.content[0].text);
Enter fullscreen mode Exit fullscreen mode

Để duy trì ngữ cảnh, lưu lịch sử hội thoại và push thêm message sau mỗi lượt:

const messages = [];

async function sendMessage(userText) {
  messages.push({
    role: "user",
    content: userText
  });

  const response = await puter.ai.chat(messages, {
    model: "claude-sonnet-4-6"
  });

  const assistantText = response.message.content[0].text;

  messages.push({
    role: "assistant",
    content: assistantText
  });

  return assistantText;
}
Enter fullscreen mode Exit fullscreen mode

Bước 6: Dùng system prompt

System prompt dùng để đặt vai trò, ràng buộc và format output.

const messages = [
  {
    role: "system",
    content: "You are a senior backend engineer. Reply in numbered bullets, never more than five."
  },
  {
    role: "user",
    content: "How do I prevent SQL injection in a Node app?"
  }
];

const response = await puter.ai.chat(messages, {
  model: "claude-sonnet-4-6"
});

console.log(response.message.content[0].text);
Enter fullscreen mode Exit fullscreen mode

Nên đặt trong system prompt các quy tắc ổn định như:

  • Ngôn ngữ trả lời.
  • Định dạng output.
  • Giới hạn độ dài.
  • Vai trò chuyên môn.
  • Các điều không được làm.

So sánh nhiều model trên cùng một prompt

Để chọn model phù hợp, chạy cùng một prompt qua nhiều model và đo thời gian phản hồi.

const models = [
  "claude-haiku-4-5",
  "claude-sonnet-4-6",
  "claude-opus-4-7"
];

const prompt = "Refactor this React component to use hooks: ...";

for (const model of models) {
  const start = performance.now();

  const response = await puter.ai.chat(prompt, { model });

  const elapsed = performance.now() - start;

  console.log(`${model}: ${elapsed.toFixed(0)}ms`);
  console.log(response.message.content[0].text);
  console.log("---");
}
Enter fullscreen mode Exit fullscreen mode

Cách đánh giá thực tế:

  1. Chuẩn bị 5–10 prompt đại diện cho app của bạn.
  2. Chạy qua Haiku, Sonnet và Opus.
  3. Ghi lại độ trễ, chất lượng câu trả lời và lỗi format.
  4. Chọn model mặc định dựa trên kết quả thực tế, không chỉ dựa trên benchmark chung.

Với đa số ứng dụng, claude-sonnet-4-6 là điểm cân bằng tốt. Dùng Opus cho prompt khó và Haiku cho tác vụ nhanh, lặp nhiều.

Nếu muốn so sánh luồng Puter với API Anthropic chính thức trong Apidog, hãy giữ cả hai nhà cung cấp trong cùng một collection và tách bằng environment.

Bạn nhận được gì và không nhận được gì

Claude qua Puter hữu ích cho ứng dụng trình duyệt, nhưng không phải toàn bộ bề mặt API chính thức.

Bạn nhận được:

  • Danh mục model Claude gồm Opus, Sonnet và Haiku.
  • Hội thoại nhiều lượt.
  • System prompt.
  • Stream response.
  • Hạ tầng do Puter xử lý.
  • Không cần quản lý billing Anthropic từ phía nhà phát triển.

Bạn có thể không nhận được, tùy phiên bản Puter:

  • Tool use/function calling gốc.
  • Input hình ảnh.
  • Prompt caching của Anthropic để giảm chi phí.
  • Gọi phía server không có ngữ cảnh trình duyệt.
  • Header/rate limit trực tiếp từ Anthropic.

Nếu workflow của bạn phụ thuộc nhiều vào tool calling hoặc MCP, API Anthropic chính thức hoặc kiểm thử máy chủ MCP trong Apidog sẽ cho bạn nhiều quyền kiểm soát hơn. Với chatbot, ứng dụng hỏi đáp hoặc trình tạo nội dung chạy trong trình duyệt, Puter thường là đủ.

Khi nào dùng Puter và khi nào dùng API Anthropic chính thức

Dùng Puter khi:

  • Bạn xây ứng dụng public miễn phí và không muốn chịu rủi ro chi phí.
  • Bạn đang prototype và chưa muốn cấu hình billing với Anthropic.
  • Bạn muốn dùng Claude trong static site, hackathon project hoặc browser extension.
  • Người dùng chấp nhận đăng nhập Puter.

Dùng API Anthropic chính thức khi:

  • Bạn cần gọi từ backend: cron job, API endpoint, batch processing.
  • Bạn cần prompt caching.
  • Bạn cần tool use chi tiết, input hình ảnh hoặc Files API.
  • Bạn cần yêu cầu tuân thủ/hợp đồng cụ thể.
  • Người dùng không chấp nhận bước đăng nhập Puter.

Nhiều dự án có thể bắt đầu bằng Puter để prototype, sau đó chuyển sang API chính thức khi cần backend, caching hoặc kiểm soát sâu hơn. Cấu trúc message tương tự nên việc chuyển đổi thường không quá phức tạp.

Để tham khảo luồng tương tự với GPT, xem Cách sử dụng API GPT-5.5.

Kiểm tra tích hợp trong Apidog

Các call Puter chạy trong trình duyệt, vì vậy bạn không thể test trực tiếp như một backend API request thông thường. Cách làm thực tế:

  1. Tạo một trang HTML nhỏ có Puter.js.
  2. Cho trang nhận prompt qua query param hoặc form input.
  3. Dùng trang này làm prototype UI cho luồng Puter.
  4. Trong Apidog, tạo request tương ứng cho Anthropic API chính thức.
  5. Giữ Puter prototype và Anthropic API trong các environment riêng để dễ so sánh khi chuyển đổi.

Ảnh chụp màn hình của Apidog với các tùy chọn môi trường để kiểm tra Puter và Anthropic

Tải xuống Apidog và tạo hai environment:

  • puter-prototype: URL localhost hoặc static page đang chạy Puter.
  • anthropic-prod: https://api.anthropic.com/v1.

Cách này giúp bạn giữ cùng một bộ prompt/test case khi chuyển từ prototype trình duyệt sang API production.

Câu hỏi thường gặp

Điều này có thực sự không giới hạn không?

Không giới hạn từ phía nhà phát triển. Người dùng cuối dùng tài khoản Puter của họ; tài khoản mới có tín dụng khởi đầu và có thể nạp thêm khi cần.

Tôi có cần đăng ký Anthropic không?

Không. Puter xử lý phần tích hợp với Anthropic. Ứng dụng của bạn không cần Anthropic API key.

Có dùng production được không?

Có, với ứng dụng dựa trên trình duyệt. Điểm cần kiểm tra là người dùng của bạn có chấp nhận đăng nhập Puter hay không.

Claude qua Puter có giống API chính thức không?

Puter gọi Claude thay mặt người dùng. Hành vi model nên tương ứng với model được gọi, nhưng độ trễ có thể khác do có thêm lớp trung gian.

Prompt caching thì sao?

Puter hiện không cung cấp các kiểm soát prompt caching của Anthropic. Nếu bạn có system prompt rất dài và cần tối ưu chi phí bằng caching, hãy dùng API chính thức.

Có dùng Puter cho bot Discord hoặc backend service không?

Không thuận tiện. Puter ưu tiên trình duyệt và giả định có phiên người dùng. Backend service nên dùng API Anthropic chính thức.

Nên chọn model mặc định nào?

Dùng claude-sonnet-4-6. Chuyển sang claude-opus-4-7 khi cần suy luận sâu hơn, và claude-haiku-4-5 khi cần tốc độ hoặc xử lý khối lượng lớn.

Kết luận

Puter.js là cách nhanh để thêm Claude vào ứng dụng trình duyệt mà không cần quản lý Anthropic API key. Bạn thêm script, chọn model, gọi puter.ai.chat, sau đó xử lý response hoặc stream response trong UI.

Với workload backend, prompt caching hoặc tool use phức tạp, API Anthropic chính thức vẫn là lựa chọn phù hợp hơn. Nhưng với prototype, static site, hackathon project, side project và ứng dụng public miễn phí, Puter là một đường triển khai đơn giản.

Hãy xây request/test case một lần trong Apidog, so sánh luồng Puter với API chính thức và chọn kiến trúc phù hợp với yêu cầu của bạn.

Top comments (0)