chat-ui

Running

nsarrazin HF staff commited on Mar 11, 2024

Commit

eb071be

unverified ·

1 Parent(s): 2edb278

Fix prompt caching on llama.cpp endpoints (#920)

Explicitly enable prompt caching on llama.cpp endpoints

Co-authored-by: Nathan Sarrazin <[email protected]>

Files changed (1) hide show

src/lib/server/endpoints/llamacpp/endpointLlamacpp.ts CHANGED Viewed

@@ -41,6 +41,7 @@ export function endpointLlamacpp(
 				stop: model.parameters.stop,
 				repeat_penalty: model.parameters.repetition_penalty,
 				n_predict: model.parameters.max_new_tokens,
 			}),
 		});

 				stop: model.parameters.stop,
 				repeat_penalty: model.parameters.repetition_penalty,
 				n_predict: model.parameters.max_new_tokens,
+				cache_prompt: true,
 			}),
 		});