Sebastian Petrus

Posted on May 9 • Originally published at apidog.com

API GPT-5.5 Miễn Phí Không Giới Hạn & Tất Cả Các Mô Hình OpenAI

GPT-5.5 của OpenAI có API trả phí: 5 USD cho mỗi triệu token đầu vào và 30 USD cho mỗi triệu token đầu ra. Với dự án phụ, bản dựng hackathon hoặc ứng dụng công khai miễn phí, chi phí này có thể chặn bạn ngay từ bước prototype. Một cách tiếp cận khác là dùng Puter.js: bạn gọi các mô hình OpenAI như GPT-5.5, GPT-5.5 Pro, các biến thể GPT-5.x, GPT-Image-2, DALL-E và OpenAI TTS trực tiếp từ trình duyệt, không cần khóa OpenAI. Chi phí sử dụng được gắn với người dùng cuối qua tài khoản Puter, không phải tài khoản của bạn.

Thử Apidog ngay hôm nay

Tóm tắt nhanh

Puter.js cho phép gọi các mô hình OpenAI từ trình duyệt mà không cần OpenAI API key, tài khoản OpenAI hoặc backend.
Các mô hình văn bản được hỗ trợ gồm gpt-5.5, gpt-5.5-pro, gpt-5.4, gpt-5, gpt-5-mini, o1, o3, gpt-4.1, gpt-4o và các biến thể chat/codex.
Hình ảnh: gpt-image-2, gpt-image-1.5, dall-e-3.
TTS: gpt-4o-mini-tts, tts-1, tts-1-hd.
Cài đặt tối thiểu: một thẻ <script> và một lệnh gọi puter.ai.chat.
Streaming, function calling, vision input, image generation và text-to-speech đều chạy được trong trình duyệt.
Người dùng cuối thanh toán chi phí sử dụng qua Puter; bạn không phải giữ khóa API hoặc thanh toán OpenAI.
Có thể dùng Apidog để so sánh prompt giữa Puter và API OpenAI chính thức khi chuẩn bị di chuyển.

Cách mô hình “miễn phí không giới hạn” hoạt động

Puter.js thay đổi điểm thanh toán. Thay vì bạn giữ OpenAI API key và chịu toàn bộ chi phí token, người dùng đăng nhập Puter và lệnh gọi được tính vào tài khoản Puter của họ.

Về mặt triển khai, bạn được lợi ở ba điểm:

Không cần OpenAI API key trong mã nguồn: giảm rủi ro rò rỉ secret, không cần rotate key.
Không cần backend chỉ để proxy request: phù hợp cho static site, demo, extension hoặc prototype.
Không có hóa đơn OpenAI ở phía developer: chi phí sử dụng nằm ở tài khoản người dùng cuối.

Đổi lại, Puter phù hợp nhất với ứng dụng chạy trong trình duyệt. Nếu bạn cần cron job, webhook processor, batch job hoặc service backend không có phiên người dùng, API OpenAI chính thức vẫn là lựa chọn phù hợp hơn.

Bước 1: Cài đặt Puter.js

Cách nhanh nhất là thêm CDN vào HTML:

<script src="https://js.puter.com/v2/"></script>

Ví dụ file HTML tối thiểu:

<!DOCTYPE html>
<html>
  <body>
    <script src="https://js.puter.com/v2/"></script>
    <script>
      puter.print("Puter.js đã sẵn sàng");
    </script>
  </body>
</html>

Nếu bạn dùng bundler như Vite, Next.js client component hoặc ứng dụng frontend đóng gói, có thể cài qua npm:

npm install @heyputer/puter.js

import { puter } from "@heyputer/puter.js";

Dùng CDN khi bạn cần demo nhanh. Dùng npm khi bạn muốn tích hợp vào codebase frontend có build pipeline và TypeScript.

Bước 2: Chọn mô hình

Puter cung cấp dòng GPT-5.x cùng các mô hình OpenAI cũ hơn. Bảng dưới đây là cách chọn thực dụng:

ID mô hình	Khi nào nên dùng
`gpt-5.5-pro`	Tác vụ suy luận sâu, agent lập trình, phân tích phức tạp
`gpt-5.5`	Mặc định cho chatbot và tác vụ hằng ngày
`gpt-5.4-nano`	Phân loại, tác vụ khối lượng lớn, ưu tiên tốc độ
`gpt-5.4-mini`	Chat UI, tác vụ trung bình
`gpt-5.3-codex`	Tác vụ liên quan đến mã
`o3`	Chuỗi suy luận phức tạp
`o1-pro`	Lập kế hoạch nhiều bước
`gpt-4.1`, `gpt-4o`, `gpt-4o-mini`	Nền tảng ổn định, quen thuộc

Mô hình tạo hình ảnh:

gpt-image-2: mới hơn, đầu ra sắc nét, nhanh.
gpt-image-1.5, gpt-image-1, dall-e-3, dall-e-2: các lựa chọn ổn định hơn/cũ hơn.

Mô hình text-to-speech:

gpt-4o-mini-tts: giọng tự nhiên hơn.
tts-1, tts-1-hd: TTS cổ điển, độ trễ thấp hơn.

Bước 3: Gọi GPT-5.5 từ trình duyệt

Ví dụ tối thiểu:

<!DOCTYPE html>
<html>
  <body>
    <script src="https://js.puter.com/v2/"></script>

    <script>
      puter.ai
        .chat("Explain WebSockets in three sentences", {
          model: "gpt-5.5",
        })
        .then((response) => {
          puter.print(response);
        });
    </script>
  </body>
</html>

Chạy file này trong trình duyệt. Khi cần, Puter sẽ xử lý bước đăng nhập hoặc tạo tài khoản Puter cho người dùng. Bạn không cần:

OpenAI API key
biến môi trường
backend proxy
endpoint trung gian

Bước 4: Streaming phản hồi

Với chatbot hoặc câu trả lời dài, nên bật streaming để UI phản hồi nhanh hơn.

const response = await puter.ai.chat(
  "Explain the theory of relativity in detail",
  {
    model: "gpt-5.5",
    stream: true,
  }
);

for await (const part of response) {
  puter.print(part?.text);
}

Trong ứng dụng thực tế, thay vì puter.print, bạn append token vào một phần tử UI:

<div id="answer"></div>

<script>
  async function ask() {
    const el = document.querySelector("#answer");

    const stream = await puter.ai.chat(
      "Tóm tắt HTTP/2 cho developer backend",
      {
        model: "gpt-5.5",
        stream: true,
      }
    );

    for await (const part of stream) {
      el.textContent += part?.text ?? "";
    }
  }

  ask();
</script>

Bước 5: Gửi ảnh vào mô hình vision

Bạn có thể truyền URL ảnh làm đối số thứ hai:

puter.ai
  .chat(
    "What do you see in this image? Describe colors, objects, and mood.",
    "https://assets.puter.site/doge.jpeg",
    {
      model: "gpt-5.5",
    }
  )
  .then((response) => {
    puter.print(response);
  });

Các use case phù hợp:

tạo alt text cho ảnh
phân tích ảnh chụp màn hình
QA dựa trên hình ảnh
OCR đơn giản
hỗ trợ accessibility

Bước 6: Tạo hình ảnh bằng `txt2img`

puter.ai.txt2img trả về một phần tử <img> đã tải sẵn hình ảnh được tạo.

puter.ai
  .txt2img(
    "A futuristic cityscape at night, cinematic, neon, rain",
    {
      model: "gpt-image-2",
    }
  )
  .then((imageElement) => {
    document.body.appendChild(imageElement);
  });

Nếu bạn xây dựng UI đầy đủ hơn, nên gắn ảnh vào container riêng:

<button id="generate">Generate</button>
<div id="output"></div>

<script>
  document.querySelector("#generate").addEventListener("click", async () => {
    const output = document.querySelector("#output");
    output.textContent = "Đang tạo ảnh...";

    const img = await puter.ai.txt2img(
      "A clean dashboard UI for a developer tool, dark mode",
      {
        model: "gpt-image-2",
      }
    );

    output.textContent = "";
    output.appendChild(img);
  });
</script>

Người dùng thanh toán chi phí tạo hình ảnh từ tài khoản Puter của họ. Với ứng dụng công khai, bạn vẫn nên thiết kế UI để tránh việc người dùng vô tình tạo quá nhiều ảnh.

Bước 7: Text-to-speech

Dùng txt2speech để tạo audio từ văn bản. Hàm này trả về phần tử <audio>.

puter.ai
  .txt2speech(
    "Welcome back. Your account balance is $1,247.50.",
    {
      provider: "openai",
      model: "gpt-4o-mini-tts",
    }
  )
  .then((audio) => {
    audio.setAttribute("controls", "");
    document.body.appendChild(audio);
  });

Một pattern đơn giản cho UI:

<textarea id="text">Xin chào, đây là bản demo text-to-speech.</textarea>
<button id="speak">Đọc</button>
<div id="audio"></div>

<script>
  document.querySelector("#speak").addEventListener("click", async () => {
    const text = document.querySelector("#text").value;
    const container = document.querySelector("#audio");

    const audio = await puter.ai.txt2speech(text, {
      provider: "openai",
      model: "gpt-4o-mini-tts",
    });

    audio.setAttribute("controls", "");
    container.replaceChildren(audio);
  });
</script>

Use case phù hợp:

voice prompt
hướng dẫn trong app
tường thuật accessibility
demo podcast hoặc voice note

Bước 8: Function calling

Puter dùng định dạng tool/function tương tự OpenAI. Bạn khai báo tool, mô hình trả về tool_calls, sau đó ứng dụng của bạn tự thực thi hàm tương ứng.

const tools = [
  {
    type: "function",
    function: {
      name: "get_weather",
      description: "Get the current weather for a city.",
      parameters: {
        type: "object",
        properties: {
          city: {
            type: "string",
          },
        },
        required: ["city"],
      },
    },
  },
];

const response = await puter.ai.chat(
  "What's the weather in Tokyo right now?",
  {
    model: "gpt-5.5",
    tools,
  }
);

const toolCalls = response.message.tool_calls;

if (toolCalls?.length) {
  const call = toolCalls[0];

  console.log(call.function.name);
  console.log(call.function.arguments);

  // Tại đây bạn tự gọi API thời tiết hoặc hàm nội bộ của ứng dụng.
}

Luồng triển khai thực tế thường là:

Người dùng gửi prompt.
Mô hình chọn tool và trả về tool_calls.
Frontend hoặc backend của bạn thực thi tool.
Bạn gửi kết quả tool lại cho mô hình để tạo câu trả lời cuối.

Định nghĩa tool tương tự OpenAI, nên nếu bạn đã có schema tool hiện tại, việc chuyển đổi sẽ ít thay đổi. Để kiểm thử các luồng dựa trên tool trong môi trường gần production, xem kiểm thử máy chủ MCP trong Apidog.

Bước 9: Điều chỉnh `temperature` và `max_tokens`

Bạn có thể truyền các tham số phổ biến trong object options:

const response = await puter.ai.chat("Tell me about Mars", {
  model: "gpt-5.5",
  temperature: 0.2,
  max_tokens: 200,
});

Gợi ý cấu hình:

temperature: 0.0–0.3: câu trả lời thực tế, ổn định hơn.
temperature: 0.7–1.0: nội dung sáng tạo hơn.
max_tokens: giới hạn độ dài đầu ra, giúp chi phí phía người dùng dễ dự đoán hơn.

Ví dụ cho chatbot public:

const response = await puter.ai.chat(userPrompt, {
  model: "gpt-5.5",
  temperature: 0.3,
  max_tokens: 500,
});

Bạn nhận được gì và không nhận được gì

Puter hữu ích cho app trình duyệt, nhưng không thay thế toàn bộ API OpenAI chính thức.

Bạn nhận được:

Dòng GPT-5.x, bao gồm 5.5, 5.5 Pro, 5.4 mini/nano/pro và các biến thể codex.
Các mô hình OpenAI cũ hơn như GPT-4.1, GPT-4o, o1, o3.
GPT-Image-2 và DALL-E cho tạo hình ảnh.
Dòng OpenAI TTS, gồm gpt-4o-mini-tts.
Streaming, vision input, function calling, temperature, max_tokens.

Bạn có thể không nhận được:

Responses API.
Chiết khấu/bộ điều khiển prompt caching.
Files API cho ngữ cảnh tài liệu tải lên.
Sử dụng server-side không có phiên trình duyệt.
Header rate limit trực tiếp từ OpenAI.
Structured output đầy đủ và schema enforcement của OpenAI.

Nếu bạn cần luồng backend nghiêm túc, xử lý hàng loạt, compliance hoặc structured output chặt chẽ, dùng API OpenAI chính thức. Nếu bạn đang làm prototype, static site, demo hackathon hoặc app trình duyệt công khai, Puter là lựa chọn thực dụng.

Khi nào dùng Puter, khi nào dùng OpenAI API chính thức

Dùng Puter khi:

Bạn phát hành app trình duyệt miễn phí và không muốn gắn billing OpenAI.
Bạn đang prototype và muốn bỏ qua bước tạo API key.
Bạn xây dựng static site, extension hoặc demo hackathon.
Người dùng chấp nhận đăng nhập Puter.
Bạn muốn tránh backend proxy chỉ để gọi LLM.

Dùng API OpenAI chính thức khi:

Bạn cần xử lý server-side: cron job, webhook, batch processing.
Bạn cần prompt caching cho system prompt lớn và ổn định.
Bạn cần Responses API, Files API hoặc structured output đầy đủ.
Bạn cần điều khoản hợp đồng/compliance như BAA, SOC 2, data residency.
Người dùng không chấp nhận đăng nhập Puter.

Một chiến lược phổ biến là bắt đầu bằng Puter để validate sản phẩm, sau đó chuyển sang API chính thức khi bạn gặp giới hạn về backend, compliance hoặc trải nghiệm đăng nhập.

Để thiết lập production trả phí, xem Cách sử dụng API GPT-5.5.

Kiểm tra tích hợp trong Apidog

Các lệnh gọi Puter chạy trong trình duyệt, nên bạn không thể test trực tiếp như một backend API runner thông thường. Cách tổ chức thực dụng hơn:

Tạo một trang HTML nhỏ chứa Puter.js.
Cho trang nhận prompt qua query string hoặc input UI.
Dùng Apidog để mô hình hóa API OpenAI chính thức mà bạn sẽ dùng khi di chuyển.
Giữ hai môi trường riêng trong cùng collection:
- puter-prototype
- openai-prod

Ví dụ môi trường:

Environment	Base URL	Mục đích
`puter-prototype`	`http://localhost:5173`	Trang local chạy Puter.js
`openai-prod`	`https://api.openai.com/v1`	API OpenAI chính thức

Tải Apidog và thiết lập hai môi trường này để so sánh prompt, response shape và kế hoạch migration. Để xem thêm mẫu kiểm thử API, đọc công cụ kiểm thử API dành cho kỹ sư QA.

FAQ

Đây có thực sự là “không giới hạn” không?

Không giới hạn từ phía developer. Người dùng cuối vẫn có số dư trong tài khoản Puter của họ. Tài khoản mới có tín dụng khởi đầu và người dùng có thể nạp thêm nếu cần.

Tôi có cần tài khoản OpenAI không?

Không. Puter xử lý phần liên quan đến OpenAI. Bạn không cần tạo hoặc lưu OpenAI API key.

Có dùng được trong production không?

Có, nếu production của bạn là ứng dụng dựa trên trình duyệt và người dùng chấp nhận đăng nhập Puter. Nếu bạn cần service backend độc lập, dùng OpenAI API chính thức.

GPT-5.5 qua Puter có giống API chính thức không?

Puter gọi API OpenAI thay mặt người dùng. Hành vi mô hình về cơ bản không đổi, nhưng độ trễ có thể khác vì có thêm lớp trung gian.

Prompt caching thì sao?

Puter hiện không cung cấp các điều khiển giá cho prompt caching của OpenAI. Nếu bạn có system prompt lớn, ổn định và cần tối ưu chi phí bằng caching, dùng API chính thức.

Có dùng được trong backend service không?

Không thuận tiện. Puter ưu tiên trình duyệt và giả định có phiên người dùng. Với backend service, dùng OpenAI API chính thức. Nếu bạn đang tìm tùy chọn miễn phí phía server, xem Cách sử dụng API GPT-5.5 miễn phí.

Nên chọn mô hình nào làm mặc định?

gpt-5.5: mặc định cho tác vụ hằng ngày.
gpt-5.4-nano: phân loại khối lượng lớn.
gpt-5.5-pro: tác vụ suy luận khó.
o3: chuỗi suy luận dài.

Người dùng có bị tính phí nhiều không?

Các phiên chat thông thường thường chỉ tốn một phần nhỏ chi phí theo mức giá OpenAI. Tạo hình ảnh đắt hơn. Bạn nên giới hạn max_tokens, tránh auto-generate không cần thiết và hiển thị rõ hành động nào sẽ gọi mô hình.

Có tạo ảnh miễn phí với Puter không?

Có thể gọi txt2img với gpt-image-2 hoặc DALL-E. Chi phí tạo ảnh được tính vào số dư Puter của người dùng. Nếu bạn cần hướng dẫn API chính thức, xem Cách sử dụng API GPT-Image-2.

Tổng kết

Puter.js là cách nhanh để thêm GPT-5.5 và các mô hình OpenAI vào ứng dụng trình duyệt mà không cần OpenAI API key, backend proxy hoặc billing phía developer. Bạn thêm script, chọn model, gọi puter.ai.chat, rồi để người dùng đăng nhập Puter và tự thanh toán chi phí sử dụng.

Nếu bạn cần backend job, prompt caching, Responses API, Files API, structured output đầy đủ hoặc yêu cầu compliance, hãy dùng API OpenAI chính thức. Nếu bạn đang làm prototype, hackathon, static site hoặc app public miễn phí, Puter là đường triển khai gọn hơn.

Xây dựng request một lần trong Apidog, so sánh Puter với API chính thức và chọn hướng phù hợp với kiến trúc của bạn.

DEV Community

API GPT-5.5 Miễn Phí Không Giới Hạn & Tất Cả Các Mô Hình OpenAI

Tóm tắt nhanh

Cách mô hình “miễn phí không giới hạn” hoạt động

Bước 1: Cài đặt Puter.js

Bước 2: Chọn mô hình

Bước 3: Gọi GPT-5.5 từ trình duyệt

Bước 4: Streaming phản hồi

Bước 5: Gửi ảnh vào mô hình vision

Bước 6: Tạo hình ảnh bằng `txt2img`

Bước 7: Text-to-speech

Bước 8: Function calling

Bước 9: Điều chỉnh `temperature` và `max_tokens`

Bạn nhận được gì và không nhận được gì

Khi nào dùng Puter, khi nào dùng OpenAI API chính thức

Kiểm tra tích hợp trong Apidog

FAQ

Tổng kết

Top comments (0)

Tóm tắt nhanh

Cách mô hình “miễn phí không giới hạn” hoạt động

Bước 1: Cài đặt Puter.js

Bước 2: Chọn mô hình

Bước 3: Gọi GPT-5.5 từ trình duyệt

Bước 4: Streaming phản hồi

Bước 5: Gửi ảnh vào mô hình vision

Bước 6: Tạo hình ảnh bằng txt2img

Bước 7: Text-to-speech

Bước 8: Function calling

Bước 9: Điều chỉnh temperature và max_tokens

Bạn nhận được gì và không nhận được gì

Khi nào dùng Puter, khi nào dùng OpenAI API chính thức

Kiểm tra tích hợp trong Apidog

FAQ

Tổng kết

Bước 6: Tạo hình ảnh bằng `txt2img`

Bước 9: Điều chỉnh `temperature` và `max_tokens`