Models / QwenQwen / / Qwen2.5 7B Instruct Turbo API

Qwen2.5 7B Instruct Turbo API

Instruction-tuned 7.61B Qwen2.5 causal LLM with 131K context, RoPE, SwiGLU, RMSNorm, and advanced attention mechanisms.

Try our Qwen2.5 API

Qwen2.5 7B Instruct Turbo API Usage

Endpoint

Qwen/Qwen2.5-7B-Instruct-Turbo

RUN INFERENCE

curl -X POST "https://api.together.xyz/v1/chat/completions" \
  -H "Authorization: Bearer $TOGETHER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "Qwen/Qwen2.5-7B-Instruct-Turbo",
    "messages": [],
    "stream": true
  }'

RUN INFERENCE

from together import Together

client = Together()

response = client.chat.completions.create(
    model="Qwen/Qwen2.5-7B-Instruct-Turbo",
    messages=[],
    stream=True
)
for token in response:
    if hasattr(token, 'choices'):
        print(token.choices[0].delta.content, end='', flush=True)

RUN INFERENCE

import Together from "together-ai";

const together = new Together();

const response = await together.chat.completions.create({
  messages: [],
  model: "Qwen/Qwen2.5-7B-Instruct-Turbo",
  stream: true
});

for await (const token of response) {
  console.log(token.choices[0]?.delta?.content)
}

How to use Qwen2.5 7B Instruct Turbo

Model details

Prompting Qwen2.5 7B Instruct Turbo

Applications & Use Cases

Model Provider:

Qwen

Type:

Chat

Variant:

Instruct

Parameters:

Deployment:

✔ Serverless

✔ On-Demand Dedicated

✔ Monthly Reserved

Quantization

FP8

Context length:

131,072

Pricing:

$0.30

Check pricing

Run in playground

Deploy model

Quickstart docs

Qwen2.5 7B Instruct Turbo API

Qwen2.5 7B Instruct Turbo API Usage

How to use Qwen2.5 7B Instruct Turbo

Model details

Prompting Qwen2.5 7B Instruct Turbo

Applications & Use Cases

Looking for production scale? Deploy on a dedicated endpoint

Subscribe to newsletter