Fix/langchain document schema (#2539)

Co-authored-by: jyong <jyong@dify.ai>
2024-02-23 14:16:44 +08:00
parent 769be13189
commit 91ea6fe4ee
15 changed files with 983 additions and 22 deletions
--- a/api/core/splitter/fixed_text_splitter.py
+++ b/api/core/splitter/fixed_text_splitter.py
@@ -3,7 +3,10 @@ from __future__ import annotations

 from typing import Any, Optional, cast

-from langchain.text_splitter import (
+from core.model_manager import ModelInstance
+from core.model_runtime.model_providers.__base.text_embedding_model import TextEmbeddingModel
+from core.model_runtime.model_providers.__base.tokenizers.gpt2_tokenzier import GPT2Tokenizer
+from core.splitter.text_splitter import (
    TS,
    AbstractSet,
    Collection,
@@ -14,10 +17,6 @@ from langchain.text_splitter import (
    Union,
 )

-from core.model_manager import ModelInstance
-from core.model_runtime.model_providers.__base.text_embedding_model import TextEmbeddingModel
-from core.model_runtime.model_providers.__base.tokenizers.gpt2_tokenzier import GPT2Tokenizer
-

 class EnhanceRecursiveCharacterTextSplitter(RecursiveCharacterTextSplitter):
    """