Add TextReranker documentation (#2500)

as-suvorov · web-flow · commit 3f61b0b55763 · 2025-08-08T12:17:56.000Z
Ticket: 170852
diff --git a/samples/cpp/rag/README.md b/samples/cpp/rag/README.md
@@ -12,12 +12,18 @@ Install [../../export-requirements.txt](../../export-requirements.txt) to conver
 pip install --upgrade-strategy eager -r ../../export-requirements.txt
 ```
 
-Then, run the export with Optimum CLI:
+To export text embedding model run Optimum CLI command:
 
 ```sh
 optimum-cli export openvino --trust-remote-code --model BAAI/bge-small-en-v1.5 BAAI/bge-small-en-v1.5
 ```
 
+To export text reranking model run Optimum CLI command:
+
+```sh
+optimum-cli export openvino --trust-remote-code --model cross-encoder/ms-marco-MiniLM-L6-v2 cross-encoder/ms-marco-MiniLM-L6-v2
+```
+
 
 ## Run
 
diff --git a/samples/python/rag/README.md b/samples/python/rag/README.md
@@ -12,12 +12,18 @@ Install [../../export-requirements.txt](../../export-requirements.txt) to conver
 pip install --upgrade-strategy eager -r ../../export-requirements.txt
 ```
 
-Then, run the export with Optimum CLI:
+To export text embedding model run Optimum CLI command:
 
 ```sh
 optimum-cli export openvino --trust-remote-code --model BAAI/bge-small-en-v1.5 BAAI/bge-small-en-v1.5
 ```
 
+To export text reranking model run Optimum CLI command:
+
+```sh
+optimum-cli export openvino --trust-remote-code --model cross-encoder/ms-marco-MiniLM-L6-v2 cross-encoder/ms-marco-MiniLM-L6-v2
+```
+
 Alternatively, do it in Python code:
 
 ```python
diff --git a/site/docs/supported-models/_components/text-rerank-models-table/index.tsx b/site/docs/supported-models/_components/text-rerank-models-table/index.tsx
@@ -0,0 +1,20 @@
+import React from 'react';
+import { TEXT_RERANK_MODELS } from './models';
+import { BaseModelsTable, LinksCell } from '../base-models-table';
+
+export default function TextRerankModelsTable(): React.JSX.Element {
+  const headers = ['Architecture', 'Example HuggingFace Models'];
+
+  const rows = TEXT_RERANK_MODELS.map(({ architecture, models }) => (
+    <>
+      <tr key={architecture}>
+        <td rowSpan={models.length}>
+          <code>{architecture}</code>
+        </td>
+        <LinksCell links={models[0].links} />
+      </tr>
+    </>
+  ));
+
+  return <BaseModelsTable headers={headers} rows={rows} />;
+}
diff --git a/site/docs/supported-models/_components/text-rerank-models-table/models.ts b/site/docs/supported-models/_components/text-rerank-models-table/models.ts
@@ -0,0 +1,63 @@
+type TextRerankModelType = {
+  architecture: string;
+  models: Array<{
+    links: string[];
+  }>;
+};
+
+export const TEXT_RERANK_MODELS: TextRerankModelType[] = [
+  {
+    architecture: 'BertForSequenceClassification',
+    models: [
+      {
+        links: [
+          'https://huggingface.co/cross-encoder/ms-marco-MiniLM-L2-v2',
+          'https://huggingface.co/cross-encoder/ms-marco-MiniLM-L4-v2',
+          'https://huggingface.co/cross-encoder/ms-marco-MiniLM-L6-v2',
+          'https://huggingface.co/cross-encoder/ms-marco-MiniLM-L12-v2',
+          'https://huggingface.co/cross-encoder/ms-marco-TinyBERT-L2-v2',
+          'https://huggingface.co/tomaarsen/reranker-MiniLM-L12-gooaq-bce',
+        ],
+      },
+    ],
+  },
+  {
+    architecture: 'XLMRobertaForSequenceClassification',
+    models: [
+      {
+        links: [
+          'https://huggingface.co/BAAI/bge-reranker-v2-m3',
+          'https://huggingface.co/BAAI/bge-reranker-base',
+        ],
+      },
+    ],
+  },
+  {
+    architecture: 'GemmaForCausalLM',
+    models: [
+      {
+        links: ['https://huggingface.co/BAAI/bge-reranker-v2-gemma'],
+      },
+    ],
+  },
+  {
+    architecture: 'ModernBertForSequenceClassification',
+    models: [
+      {
+        links: [
+          'https://huggingface.co/tomaarsen/reranker-ModernBERT-base-gooaq-bce',
+          'https://huggingface.co/tomaarsen/reranker-ModernBERT-large-gooaq-bce',
+          'https://huggingface.co/Alibaba-NLP/gte-reranker-modernbert-base',
+        ],
+      },
+    ],
+  },
+  {
+    architecture: 'ModernBertForMaskedLM',
+    models: [
+      {
+        links: ['https://huggingface.co/answerdotai/ModernBERT-base'],
+      },
+    ],
+  },
+];
diff --git a/site/docs/supported-models/index.mdx b/site/docs/supported-models/index.mdx
@@ -4,6 +4,7 @@ import VLMModelsTable from './_components/vlm-models-table';
 import WhisperModelsTable from './_components/whisper-models-table';
 import TextEmbeddingsModelsTable from './_components/text-embeddings-models-table';
 import SpeechGenerationModelsTable from './_components/speech-generation-models-table';
+import TextRerankModelsTable from './_components/text-rerank-models-table';
 
 
 # Supported Models
@@ -78,6 +79,14 @@ pip install timm einops
 
 <SpeechGenerationModelsTable />
 
+## Text Rerank Models
+
+<TextRerankModelsTable />
+
+:::info
+LoRA adapters are not supported.
+:::
+
 :::info
 
 Some models may require access request submission on the Hugging Face page to be downloaded.
diff --git a/site/docs/use-cases/text-rerank/_sections/_run_model/_code_example_cpp.mdx b/site/docs/use-cases/text-rerank/_sections/_run_model/_code_example_cpp.mdx
@@ -0,0 +1,20 @@
+import CodeBlock from '@theme/CodeBlock';
+
+<CodeBlock language="cpp" showLineNumbers>
+{`#include "openvino/genai/rag/text_rerank_pipeline.hpp"
+
+int main(int argc, char* argv[]) {
+    std::vector<std::string> documents(argv + 3, argv + argc);
+    std::string models_path = argv[1], query = argv[2];
+    
+    ov::genai::TextRerankPipeline pipeline(models_path, "${props.device || 'CPU'}", ov::genai::top_n(3));
+    
+    auto rerank_result = pipeline.rerank(query, documents);
+    
+    std::cout << "Reranked documents:\\n";
+    for (const auto& [index, score] : rerank_result) {
+        std::cout << "Document " << index << " (score: " << score << "): " << documents[index] << '\\n';
+    }
+}
+`}
+</CodeBlock>
diff --git a/site/docs/use-cases/text-rerank/_sections/_run_model/_code_example_python.mdx b/site/docs/use-cases/text-rerank/_sections/_run_model/_code_example_python.mdx
@@ -0,0 +1,14 @@
+import CodeBlock from '@theme/CodeBlock';
+
+<CodeBlock language="python" showLineNumbers>
+{`import openvino_genai
+
+pipeline = openvino_genai.TextRerankPipeline(model_path, "${props.device || 'CPU'}", top_n=3)
+
+rerank_result = pipeline.rerank(query, documents)
+
+print("Reranked documents:")
+for index, score in rerank_result:
+    print(f"Document {index} (score: {score:.4f}): {documents[index]}")
+`}
+</CodeBlock>
diff --git a/site/docs/use-cases/text-rerank/_sections/_run_model/index.mdx b/site/docs/use-cases/text-rerank/_sections/_run_model/index.mdx
@@ -0,0 +1,29 @@
+import CodeExampleCPP from './_code_example_cpp.mdx';
+import CodeExamplePython from './_code_example_python.mdx';
+
+## Run Model Using OpenVINO GenAI
+
+The `TextRerankPipeline` enables you to reorder candidate documents or passages by semantic relevance to a query using a cross-encoder or reranker model. You can control how many top results are returned using the `top_n` parameter.
+
+<LanguageTabs>
+    <TabItemPython>
+        <Tabs groupId="device">
+            <TabItem label="CPU" value="cpu">
+                <CodeExamplePython device="CPU" />
+            </TabItem>
+            <TabItem label="GPU" value="gpu">
+                <CodeExamplePython device="GPU" />
+            </TabItem>
+        </Tabs>
+    </TabItemPython>
+    <TabItemCpp>
+        <Tabs groupId="device">
+            <TabItem label="CPU" value="cpu">
+                <CodeExampleCPP device="CPU" />
+            </TabItem>
+            <TabItem label="GPU" value="gpu">
+                <CodeExampleCPP device="GPU" />
+            </TabItem>
+        </Tabs>
+    </TabItemCpp>
+</LanguageTabs>
diff --git a/site/docs/use-cases/text-rerank/index.mdx b/site/docs/use-cases/text-rerank/index.mdx
@@ -0,0 +1,18 @@
+---
+sidebar_position: 2
+---
+import OptimumCLI from '@site/src/components/OptimumCLI';
+import ConvertModelSection from '../_shared/_convert_model.mdx';
+import RunModelSection from './_sections/_run_model/index.mdx';
+
+# Text Reranking
+
+<ConvertModelSection>
+    Download and convert a reranker model (e.g. [cross-encoder/ms-marco-MiniLM-L6-v2](https://huggingface.co/cross-encoder/ms-marco-MiniLM-L6-v2)) to OpenVINO format from Hugging Face:
+
+    <OptimumCLI model='cross-encoder/ms-marco-MiniLM-L6-v2' outputDir='cross-encoder/ms-marco-MiniLM-L6-v2' trustRemoteCode />
+
+    See all supported [Reranker Models](/docs/supported-models/#text-rerank-models).
+</ConvertModelSection>
+
+<RunModelSection />
diff --git a/site/src/pages/_sections/UseCasesSection/components/text-rerank.tsx b/site/src/pages/_sections/UseCasesSection/components/text-rerank.tsx
@@ -0,0 +1,33 @@
+import Button from '@site/src/components/Button';
+import { LanguageTabs, TabItemCpp, TabItemPython } from '@site/src/components/LanguageTabs';
+import UseCaseCard from './UseCaseCard';
+
+import CodeExampleCpp from '@site/docs/use-cases/text-rerank/_sections/_run_model/_code_example_cpp.mdx';
+import CodeExamplePython from '@site/docs/use-cases/text-rerank/_sections/_run_model/_code_example_python.mdx';
+
+export const TextRerank = () => (
+  <UseCaseCard>
+    <UseCaseCard.Title>Text Rerank for RAG</UseCaseCard.Title>
+    <UseCaseCard.Description>
+      Boost the relevance and accuracy of your Retrieval-Augmented Generation (RAG) workflows by
+      reranking retrieved documents with the TextRerankPipeline.
+    </UseCaseCard.Description>
+    <UseCaseCard.Features>
+      <li>Reorder search results by semantic relevance to the query</li>
+    </UseCaseCard.Features>
+    <UseCaseCard.Code>
+      <LanguageTabs>
+        <TabItemPython>
+          <CodeExamplePython />
+        </TabItemPython>
+        <TabItemCpp>
+          <CodeExampleCpp />
+        </TabItemCpp>
+      </LanguageTabs>
+    </UseCaseCard.Code>
+    <UseCaseCard.Actions>
+      <Button label="Explore Use Case" link="docs/use-cases/text-rerank" variant="primary" />
+      <Button label="View Code Samples" link="docs/samples" variant="primary" outline />
+    </UseCaseCard.Actions>
+  </UseCaseCard>
+);
diff --git a/site/src/pages/_sections/UseCasesSection/index.tsx b/site/src/pages/_sections/UseCasesSection/index.tsx
@@ -7,6 +7,7 @@ import { ImageGeneration } from './components/image-generation';
 import { ImageProcessing } from './components/image-processing';
 import { SpeechRecognition } from './components/speech-recognition';
 import { TextGeneration } from './components/text-generation';
+import { TextRerank } from './components/text-rerank';
 import { TextEmbedding } from './components/text-embedding';
 
 export const UseCasesSection = () => (
@@ -20,6 +21,7 @@ export const UseCasesSection = () => (
       <SpeechRecognition />
       <ImageProcessing />
       <TextEmbedding />
+      <TextRerank />
     </div>
     <div className={styles.useCasesFooter}>
       <strong>Looking for more?</strong>&nbsp;See all{' '}