Spaces:

huggingface
/

inference-playground

Running on CPU Upgrade

Thomas G. Lopes commited on about 17 hours ago

Commit

f9fa0a5

1 Parent(s): 491aab8

routing mode for snippets

Files changed (2) hide show

src/lib/components/inference-playground/code-snippets.svelte CHANGED Viewed

@@ -40,7 +40,7 @@
 	let showToken = $state(false);
 	type GetSnippetArgs = {
-		tokenStr: string;
 		conversation: ConversationClass;
 		lang: InferenceSnippetLanguage;
 	};
@@ -53,6 +53,7 @@
 			max_tokens: data.config.max_tokens,
 			temperature: data.config.temperature,
 			top_p: data.config.top_p,
 			// eslint-disable-next-line @typescript-eslint/no-explicit-any
 		} as any;
 		// eslint-disable-next-line @typescript-eslint/no-explicit-any
@@ -61,7 +62,7 @@
 		}
 		if (isCustomModel(model)) {
-			const snippets = getInferenceSnippet(conversation, lang, tokenStr, opts);
 			return snippets
 				.filter(s => s.client.startsWith("open") || lang === "sh")
 				.map(s => {
@@ -74,7 +75,7 @@
 				});
 		}
-		return getInferenceSnippet(conversation, lang, tokenStr, opts);
 	}
 	// { javascript: 0, python: 0, http: 0 } at first
@@ -101,10 +102,10 @@
 		if (isCustomModel(conversation.model)) {
 			const t = conversation.model.accessToken;
-			return t && showToken ? t : "YOUR_ACCESS_TOKEN";
 		}
-		return token.value && showToken ? token.value : "YOUR_HF_TOKEN";
 	});
 	const snippetsByLang = $derived({

 	let showToken = $state(false);
 	type GetSnippetArgs = {
+		tokenStr?: string;
 		conversation: ConversationClass;
 		lang: InferenceSnippetLanguage;
 	};
 			max_tokens: data.config.max_tokens,
 			temperature: data.config.temperature,
 			top_p: data.config.top_p,
+			accessToken: tokenStr,
 			// eslint-disable-next-line @typescript-eslint/no-explicit-any
 		} as any;
 		// eslint-disable-next-line @typescript-eslint/no-explicit-any
 		}
 		if (isCustomModel(model)) {
+			const snippets = getInferenceSnippet(conversation, lang, opts);
 			return snippets
 				.filter(s => s.client.startsWith("open") || lang === "sh")
 				.map(s => {
 				});
 		}
+		return getInferenceSnippet(conversation, lang, opts);
 	}
 	// { javascript: 0, python: 0, http: 0 } at first
 		if (isCustomModel(conversation.model)) {
 			const t = conversation.model.accessToken;
+			return t && showToken ? t : undefined;
 		}
+		return token.value && showToken ? token.value : undefined;
 	});
 	const snippetsByLang = $derived({

src/lib/utils/business.svelte.ts CHANGED Viewed

@@ -316,8 +316,8 @@ export type GetInferenceSnippetReturn = InferenceSnippet[];
 export function getInferenceSnippet(
 	conversation: ConversationClass,
 	language: InferenceSnippetLanguage,
-	accessToken: string,
 	opts?: {
 		messages?: ConversationEntityMembers["messages"];
 		streaming?: ConversationEntityMembers["streaming"];
 		max_tokens?: ConversationEntityMembers["config"]["max_tokens"];
@@ -342,7 +342,7 @@ export function getInferenceSnippet(
 		provider,
 		// eslint-disable-next-line @typescript-eslint/no-explicit-any
 		{ ...providerMapping, hfModelId: model.id } as any,
-		{ ...opts, accessToken },
 	);
 	return allSnippets

 export function getInferenceSnippet(
 	conversation: ConversationClass,
 	language: InferenceSnippetLanguage,
 	opts?: {
+		accessToken?: string;
 		messages?: ConversationEntityMembers["messages"];
 		streaming?: ConversationEntityMembers["streaming"];
 		max_tokens?: ConversationEntityMembers["config"]["max_tokens"];
 		provider,
 		// eslint-disable-next-line @typescript-eslint/no-explicit-any
 		{ ...providerMapping, hfModelId: model.id } as any,
+		{ ...opts, directRequest: false },
 	);
 	return allSnippets