文档API 参考📓 教程🧑‍🍳 食谱🤝 集成💜 Discord🎨 Studio
文档

Embedders (嵌入器)

Haystack 中的嵌入器使用预训练模型将文本或文档转换为向量表示。然后,您可以将嵌入用于问答、信息检索等任务。

📘

有关如何选择适合您的嵌入器的通用指南,请阅读我们的选择合适的嵌入器页面。

Haystack 中提供了以下嵌入器

嵌入器描述
AmazonBedrockTextEmbedder使用 Amazon Bedrock API 中的模型计算文本(如查询)的嵌入。
AmazonBedrockDocumentEmbedder使用 Amazon Bedrock API 中的模型计算文档的嵌入。
AmazonBedrockDocumentImageEmbedder计算文档的图像嵌入。
AzureOpenAITextEmbedder使用通过 Azure 部署的 OpenAI 模型计算文本(如查询)的嵌入。
AzureOpenAIDocumentEmbedder使用通过 Azure 部署的 OpenAI 模型计算文档的嵌入。
CohereTextEmbedder使用 Cohere 模型嵌入简单字符串(如查询)。需要 Cohere 的 API 密钥。
CohereDocumentEmbedder使用 Cohere 模型嵌入文档列表。需要 Cohere 的 API 密钥。
CohereDocumentImageEmbedder计算文档列表的图像嵌入,并将获得的向量存储在每个文档的嵌入字段中。
FastembedTextEmbedder使用 Fastembed 支持的模型计算字符串的嵌入。
FastembedDocumentEmbedder使用 Fastembed 支持的模型计算文档列表的嵌入。
FastembedSparseTextEmbedder使用 Fastembed 支持的模型将简单字符串(如查询)嵌入到稀疏向量中。
FastembedSparseDocumentEmbedder使用 Fastembed 支持的模型丰富文档列表及其稀疏嵌入。
GoogleGenAITextEmbedder使用 Google AI 模型嵌入简单字符串(如查询)。需要 Google 的 API 密钥。
GoogleGenAIDocumentEmbedder使用 Google AI 模型嵌入文档列表。需要 Google 的 API 密钥。
HuggingFaceAPIDocumentEmbedder使用各种 Hugging Face API 计算文档嵌入。
HuggingFaceAPITextEmbedder使用各种 Hugging Face API 嵌入字符串。
JinaTextEmbedder使用 Jina AI 嵌入模型嵌入简单字符串(如查询)。需要 Jina AI 的 API 密钥。
JinaDocumentEmbedder使用 Jina AI 嵌入模型嵌入文档列表。需要 Jina AI 的 API 密钥。
JinaDocumentImageEmbedder计算文档列表的图像嵌入,并将获得的向量存储在每个文档的嵌入字段中。
MistralTextEmbedder使用 Mistral API 和模型将字符串转换为向量。
MistralDocumentEmbedder使用 Mistral API 和模型计算文档列表的嵌入。
NvidiaTextEmbedder将简单字符串(如查询)嵌入到向量中。
NvidiaDocumentEmbedder用文档内容的嵌入来丰富文档的元数据。
OllamaTextEmbedder使用与 Ollama 库兼容的嵌入模型计算字符串的嵌入。
OllamaDocumentEmbedder使用与 Ollama 库兼容的嵌入模型计算文档列表的嵌入。
OpenAIDocumentEmbedder使用 OpenAI 嵌入模型嵌入文档列表。需要有效 OpenAI 账户的 API 密钥。
OpenAITextEmbedder使用 OpenAI 嵌入模型嵌入简单字符串(如查询)。需要有效 OpenAI 账户的 API 密钥。
OptimumTextEmbedder使用 Hugging Face Optimum 库加载的模型嵌入文本。
OptimumDocumentEmbedder使用 Hugging Face Optimum 库加载的模型计算文档的嵌入。
SentenceTransformersTextEmbedder使用 Sentence Transformer 模型嵌入简单字符串(如查询)。
SentenceTransformersDocumentEmbedder使用 Sentence Transformer 模型嵌入文档列表。
SentenceTransformersDocumentImageEmbedder计算文档列表的图像嵌入,并将获得的向量存储在每个文档的嵌入字段中。
STACKITTextEmbedder使用 STACKIT API 进行文本嵌入。
STACKITDocumentEmbedder使用 STACKIT API 进行文档嵌入。
VertexAITextEmbedder使用 VertexAI 嵌入 API 中的模型计算文本(如查询)的嵌入。此集成即将弃用。我们建议使用 GoogleGenAITextEmbedder 集成。
VertexAIDocumentEmbedder使用 VertexAI 嵌入 API 中的模型计算文档的嵌入。此集成即将弃用。我们建议使用 GoogleGenAIDocumentEmbedder 集成。
WatsonxTextEmbedder使用 IBM Watsonx 模型计算文本(如查询)的嵌入。
WatsonxDocumentEmbedder使用 IBM Watsonx 模型计算文档的嵌入。

相关链接

在我们的 API 参考中查看参数详情