Spaces:

sambanovasystems
/

chat_generator

Runtime error

App Files Files Community

bol20162021 commited on Sep 21, 2024

Commit

99728fb

verified ·

1 Parent(s): 5283eeb

Better error message, add back up API key

Browse files

Files changed (1) hide show

app.py +85 -47

app.py CHANGED Viewed

@@ -25,6 +25,10 @@ character_avatars = {
 }
 predefined_characters = ["Harry Potter", "Hermione Granger",  "poor Ph.D. student", "Donald Trump", "a super cute red panda"]
 def get_character(dropdown_value, custom_value):
@@ -47,71 +51,105 @@ for character, filename in character_avatars.items():
     else:
         pass
-async def generate_response_stream(messages, api_key):
-    client = openai.AsyncOpenAI(
-        api_key=api_key,
-        base_url="https://api.sambanova.ai/v1",
-    )
-    try:
-        if len(messages) >= 10:
-            # avoid hitting rate limit
-            time.sleep(0.5)
-        response = await client.chat.completions.create(
-            model='Meta-Llama-3.1-405B-Instruct',
-            messages=messages,
-            temperature=0.7,
-            top_p=0.9,
-            stream=True
         )
-        full_response = ""
-        async for chunk in response:
-            if chunk.choices[0].delta.content is not None:
-                full_response += chunk.choices[0].delta.content
-                yield full_response
-    except Exception as e:
-        yield f"Error: {str(e)}"
 async def simulate_conversation_stream(character1, character2, initial_message, num_turns, api_key):
-    messages_character_1 = [{"role": "system", "content": f"Avoid overly verbose answer in your response. Act as {character1}."},
-                            {"role": "assistant", "content": initial_message}]
-    messages_character_2 = [{"role": "system", "content": f"Avoid overly verbose answer in your response. Act as {character2}."},
-                            {"role": "user", "content": initial_message}]
     conversation = [
         {"character": character1, "content": initial_message},
-        {"character": character2, "content": ""}  # Initialize with an empty response for character2
     ]
     yield format_conversation_as_html(conversation)
     num_turns *= 2
     for turn_num in range(num_turns - 1):
         current_character = character2 if turn_num % 2 == 0 else character1
         messages = messages_character_2 if turn_num % 2 == 0 else messages_character_1
         full_response = ""
-        async for response in generate_response_stream(messages, api_key):
-            full_response = response
-            conversation[-1]["content"] = full_response
             yield format_conversation_as_html(conversation)
-        if turn_num % 2 == 0:
-            messages_character_1.append({"role": "user", "content": full_response})
-            messages_character_2.append({"role": "assistant", "content": full_response})
-        else:
-            messages_character_2.append({"role": "user", "content": full_response})
-            messages_character_1.append({"role": "assistant", "content": full_response})
-        # Add a new empty message for the next turn, if it's not the last turn
-        if turn_num < num_turns - 2:
-            next_character = character1 if turn_num % 2 == 0 else character2
-            conversation.append({"character": next_character, "content": ""})
 def stream_conversation(character1, character2, initial_message, num_turns, api_key, queue):
     async def run_simulation():
-        async for html in simulate_conversation_stream(character1, character2, initial_message, num_turns, api_key):
-            queue.put(html)
-        queue.put(None)  # Signal that the conversation is complete
-    asyncio.run(run_simulation())
 def validate_api_key(api_key):
     if not api_key.strip():

 }
+BACKUP_API_KEY_0 = os.environ.get('BACKUP_API_KEY_0')
+BACKUP_API_KEY_1 = os.environ.get('BACKUP_API_KEY_1')
+BACKUP_API_KEYS = [BACKUP_API_KEY_0, BACKUP_API_KEY_1]
 predefined_characters = ["Harry Potter", "Hermione Granger",  "poor Ph.D. student", "Donald Trump", "a super cute red panda"]
 def get_character(dropdown_value, custom_value):
     else:
         pass
+async def generate_response_stream(messages, user_api_key):
+    # Combine the user's API key with your backup keys
+    api_keys = [user_api_key] + BACKUP_API_KEYS  # backup_api_keys is a list of your internal keys
+    for idx, api_key in enumerate(api_keys):
+        client = openai.AsyncOpenAI(
+            api_key=api_key,
+            base_url="https://api.sambanova.ai/v1",
         )
+        try:
+            response = await client.chat.completions.create(
+                model='Meta-Llama-3.1-405B-Instruct',
+                messages=messages,
+                temperature=0.7,
+                top_p=0.9,
+                stream=True
+            )
+            full_response = ""
+            async for chunk in response:
+                if chunk.choices[0].delta.content:
+                    full_response += chunk.choices[0].delta.content
+                    yield full_response
+            # If successful, exit the loop
+            return
+        except RateLimitError:
+            if idx == len(api_keys) - 1:
+                # No more API keys to try
+                raise Exception("Rate limit exceeded")
+            else:
+                # Try the next API key
+                continue
+        except Exception as e:
+            # For other exceptions, raise the error
+            raise e
 async def simulate_conversation_stream(character1, character2, initial_message, num_turns, api_key):
+    messages_character_1 = [
+        {"role": "system", "content": f"Avoid overly verbose answer in your response. Act as {character1}."},
+        {"role": "assistant", "content": initial_message}
+    ]
+    messages_character_2 = [
+        {"role": "system", "content": f"Avoid overly verbose answer in your response. Act as {character2}."},
+        {"role": "user", "content": initial_message}
+    ]
     conversation = [
         {"character": character1, "content": initial_message},
+        # We will add new messages as we loop
     ]
     yield format_conversation_as_html(conversation)
     num_turns *= 2
     for turn_num in range(num_turns - 1):
         current_character = character2 if turn_num % 2 == 0 else character1
         messages = messages_character_2 if turn_num % 2 == 0 else messages_character_1
+        # Add a new empty message for the current character
+        conversation.append({"character": current_character, "content": ""})
         full_response = ""
+        try:
+            async for response in generate_response_stream(messages, api_key):
+                full_response = response
+                conversation[-1]["content"] = full_response
+                yield format_conversation_as_html(conversation)
+            # After a successful response, update the messages
+            if turn_num % 2 == 0:
+                messages_character_1.append({"role": "user", "content": full_response})
+                messages_character_2.append({"role": "assistant", "content": full_response})
+            else:
+                messages_character_2.append({"role": "user", "content": full_response})
+                messages_character_1.append({"role": "assistant", "content": full_response})
+        except Exception as e:
+            # Replace the current message with the error message
+            error_message = f"Error: {str(e)}"
+            conversation[-1]["character"] = "System"
+            conversation[-1]["content"] = error_message
             yield format_conversation_as_html(conversation)
+            # Stop the conversation
+            break
 def stream_conversation(character1, character2, initial_message, num_turns, api_key, queue):
     async def run_simulation():
+        try:
+            async for html in simulate_conversation_stream(character1, character2, initial_message, num_turns, api_key):
+                queue.put(html)
+            queue.put(None)  # Signal that the conversation is complete
+        except Exception as e:
+            # Handle exceptions and put the error message in the queue
+            error_message = f"Error: {str(e)}"
+            queue.put(error_message)
+            queue.put(None)  # Signal that the conversation is complete
+    # Create a new event loop for the thread
+    loop = asyncio.new_event_loop()
+    asyncio.set_event_loop(loop)
+    loop.run_until_complete(run_simulation())
+    loop.close()
 def validate_api_key(api_key):
     if not api_key.strip():