feat: [backend] vision support (#1510)

Co-authored-by: Garfield Dai <dai.hai@foxmail.com>
2023-11-13 22:05:46 +08:00
parent d0e1ea8f06
commit 41d0a8b295
61 changed files with 1563 additions and 300 deletions
--- a/api/core/completion.py
+++ b/api/core/completion.py
@@ -13,11 +13,12 @@ from core.callback_handler.llm_callback_handler import LLMCallbackHandler
 from core.conversation_message_task import ConversationMessageTask, ConversationTaskStoppedException, \
    ConversationTaskInterruptException
 from core.external_data_tool.factory import ExternalDataToolFactory
+from core.file.file_obj import FileObj
 from core.model_providers.error import LLMBadRequestError
 from core.memory.read_only_conversation_token_db_buffer_shared_memory import \
    ReadOnlyConversationTokenDBBufferSharedMemory
 from core.model_providers.model_factory import ModelFactory
-from core.model_providers.models.entity.message import PromptMessage
+from core.model_providers.models.entity.message import PromptMessage, PromptMessageFile
 from core.model_providers.models.llm.base import BaseLLM
 from core.orchestrator_rule_parser import OrchestratorRuleParser
 from core.prompt.prompt_template import PromptTemplateParser
@@ -30,8 +31,9 @@ from core.moderation.factory import ModerationFactory
 class Completion:
    @classmethod
    def generate(cls, task_id: str, app: App, app_model_config: AppModelConfig, query: str, inputs: dict,
-                 user: Union[Account, EndUser], conversation: Optional[Conversation], streaming: bool,
-                 is_override: bool = False, retriever_from: str = 'dev'):
+                 files: List[FileObj], user: Union[Account, EndUser], conversation: Optional[Conversation],
+                 streaming: bool, is_override: bool = False, retriever_from: str = 'dev',
+                 auto_generate_name: bool = True):
        """
        errors: ProviderTokenNotInitError
        """
@@ -64,16 +66,21 @@ class Completion:
            is_override=is_override,
            inputs=inputs,
            query=query,
+            files=files,
            streaming=streaming,
-            model_instance=final_model_instance
+            model_instance=final_model_instance,
+            auto_generate_name=auto_generate_name
        )

+        prompt_message_files = [file.prompt_message_file for file in files]
+
        rest_tokens_for_context_and_memory = cls.get_validate_rest_tokens(
            mode=app.mode,
            model_instance=final_model_instance,
            app_model_config=app_model_config,
            query=query,
-            inputs=inputs
+            inputs=inputs,
+            files=prompt_message_files
        )

        # init orchestrator rule parser
@@ -95,6 +102,7 @@ class Completion:
                    app_model_config=app_model_config,
                    query=query,
                    inputs=inputs,
+                    files=prompt_message_files,
                    agent_execute_result=None,
                    conversation_message_task=conversation_message_task,
                    memory=memory,
@@ -146,6 +154,7 @@ class Completion:
                app_model_config=app_model_config,
                query=query,
                inputs=inputs,
+                files=prompt_message_files,
                agent_execute_result=agent_execute_result,
                conversation_message_task=conversation_message_task,
                memory=memory,
@@ -257,6 +266,7 @@ class Completion:
    @classmethod
    def run_final_llm(cls, model_instance: BaseLLM, mode: str, app_model_config: AppModelConfig, query: str,
                      inputs: dict,
+                      files: List[PromptMessageFile],
                      agent_execute_result: Optional[AgentExecuteResult],
                      conversation_message_task: ConversationMessageTask,
                      memory: Optional[ReadOnlyConversationTokenDBBufferSharedMemory],
@@ -266,10 +276,12 @@ class Completion:
        # get llm prompt
        if app_model_config.prompt_type == 'simple':
            prompt_messages, stop_words = prompt_transform.get_prompt(
-                mode=mode,
+                app_mode=mode,
+                app_model_config=app_model_config,
                pre_prompt=app_model_config.pre_prompt,
                inputs=inputs,
                query=query,
+                files=files,
                context=agent_execute_result.output if agent_execute_result else None,
                memory=memory,
                model_instance=model_instance
@@ -280,6 +292,7 @@ class Completion:
                app_model_config=app_model_config,
                inputs=inputs,
                query=query,
+                files=files,
                context=agent_execute_result.output if agent_execute_result else None,
                memory=memory,
                model_instance=model_instance
@@ -337,7 +350,7 @@ class Completion:

    @classmethod
    def get_validate_rest_tokens(cls, mode: str, model_instance: BaseLLM, app_model_config: AppModelConfig,
-                                 query: str, inputs: dict) -> int:
+                                 query: str, inputs: dict, files: List[PromptMessageFile]) -> int:
        model_limited_tokens = model_instance.model_rules.max_tokens.max
        max_tokens = model_instance.get_model_kwargs().max_tokens

@@ -348,15 +361,16 @@ class Completion:
            max_tokens = 0

        prompt_transform = PromptTransform()
-        prompt_messages = []

        # get prompt without memory and context
        if app_model_config.prompt_type == 'simple':
            prompt_messages, _ = prompt_transform.get_prompt(
-                mode=mode,
+                app_mode=mode,
+                app_model_config=app_model_config,
                pre_prompt=app_model_config.pre_prompt,
                inputs=inputs,
                query=query,
+                files=files,
                context=None,
                memory=None,
                model_instance=model_instance
@@ -367,6 +381,7 @@ class Completion:
                app_model_config=app_model_config,
                inputs=inputs,
                query=query,
+                files=files,
                context=None,
                memory=None,
                model_instance=model_instance