Spaces:

Arifzyn
/

akane-ai

Sleeping

Arifzyn commited on Apr 12

Commit

d3914ef

verified ·

1 Parent(s): e713c44

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -91,13 +91,12 @@ class ChatResponse(BaseModel):
     response: str
     usage: Dict[str, Any]
 @app.post("/chat", response_model=ChatResponse)
 async def chat(req: ChatRequest):
-    # Pastikan model dimuat sebelum digunakan
-    if model is None:
-        load_model()
     if model is None:
         raise HTTPException(status_code=500, detail="Gagal memuat model")
@@ -150,9 +149,9 @@ async def chat(req: ChatRequest):
         # Set parameter generasi yang lebih sesuai
         generation_config = {
             'max_new_tokens': req.max_tokens,
-            'temperature': req.temperature,
-            'top_p': req.top_p,
-            'do_sample': True,
             'pad_token_id': tokenizer.eos_token_id
         }

     response: str
     usage: Dict[str, Any]
+@app.on_event("startup")
+async def startup_event():
+    load_model()
 @app.post("/chat", response_model=ChatResponse)
 async def chat(req: ChatRequest):
     if model is None:
         raise HTTPException(status_code=500, detail="Gagal memuat model")
         # Set parameter generasi yang lebih sesuai
         generation_config = {
             'max_new_tokens': req.max_tokens,
+            'temperature': 0.7,
+            'top_p': 0.9,
+            'do_sample': False,
             'pad_token_id': tokenizer.eos_token_id
         }