zy-wcs.git - Gitblit

			@@ -38,6 +38,9 @@
			@Value("${llm.pythonPlatformUrl}")
			private String pythonPlatformUrl;

			@Value("${llm.thinking}")
			private String thinking;

			/**
			* 通用对话方法：传入 messages，返回大模型文本回复
			*/
			@@ -84,13 +87,18 @@
			Double temperature,
			Integer maxTokens,
			List<Object> tools) {

			ChatCompletionRequest req = new ChatCompletionRequest();
			req.setModel(model);
			req.setMessages(messages);
			req.setTemperature(temperature != null ? temperature : 0.3);
			req.setMax_tokens(maxTokens != null ? maxTokens : 1024);
			req.setStream(false);

			if(thinking.equals("enable")) {
			ChatCompletionRequest.Thinking thinking = new ChatCompletionRequest.Thinking();
			thinking.setType("enable");
			req.setThinking(thinking);
			}
			if (tools != null && !tools.isEmpty()) {
			req.setTools(tools);
			req.setTool_choice("auto");
			@@ -224,18 +232,21 @@
			Consumer<String> onChunk,
			Runnable onComplete,
			Consumer<Throwable> onError) {

			ChatCompletionRequest req = new ChatCompletionRequest();
			req.setModel(model);
			req.setMessages(messages);
			req.setTemperature(temperature != null ? temperature : 0.3);
			req.setMax_tokens(maxTokens != null ? maxTokens : 1024);
			req.setStream(true);
			if(thinking.equals("enable")) {
			ChatCompletionRequest.Thinking thinking = new ChatCompletionRequest.Thinking();
			thinking.setType("enable");
			req.setThinking(thinking);
			}
			if (tools != null && !tools.isEmpty()) {
			req.setTools(tools);
			req.setTool_choice("auto");
			}

			Flux<String> flux = llmWebClient.post()
			.uri("/chat/completions")
			.header(HttpHeaders.AUTHORIZATION, "Bearer " + apiKey)