simple_bench_public Workspace

LiteLLMModel.predict:v214

Name

LiteLLMModel.predict(226 versions)

Version

214

Last updated

3 months ago

Last updated by

Laurent VOLFF

Calls:

10 calls

import weave
from litellm.main import acompletion
from openai import RateLimitError
import random
import asyncio
EXPONENTIAL_BASE = 2
@weave.op()
async def predict(self, prompt: str):
    delay = 2
    for i in range(self.max_retries):
        try:
            messages = []
            if self.system_prompt is not None:
                messages.append({
                    "role": "system",
                    "content": self.system_prompt
                })
            messages.append({
                "role": "user",
                "content": prompt
            })
            response = await acompletion(