run-llama
diff --git a/‎docs/docs/examples/embeddings/itrex.ipynb
Lines changed: 94 additions & 0 deletions b/‎docs/docs/examples/embeddings/itrex.ipynb
Lines changed: 94 additions & 0 deletions
diff --git a/‎docs/docs/examples/embeddings/octoai.ipynb
Lines changed: 138 additions & 0 deletions b/‎docs/docs/examples/embeddings/octoai.ipynb
Lines changed: 138 additions & 0 deletions
diff --git a/‎docs/docs/examples/llm/solar.ipynb
Lines changed: 88 additions & 0 deletions b/‎docs/docs/examples/llm/solar.ipynb
Lines changed: 88 additions & 0 deletions
@@ -0,0 +1,94 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# Optimized BGE Embedding Model using Intel® Extension for Transformers\n",
+    "\n",
+    "LlamaIndex has support for loading quantized BGE embedding models generated by [Intel® Extension for Transformers](https://github.com/intel/intel-extension-for-transformers) (ITREX) and use ITREX [Neural Engine](https://github.com/intel/intel-extension-for-transformers/blob/main/intel_extension_for_transformers/llm/runtime/deprecated/docs/Installation.md), a high-performance NLP backend, to accelerate the inference of models without compromising accuracy.\n",
+    "\n",
+    "Refer to our blog of [Efficient Natural Language Embedding Models with Intel Extension for Transformers](https://medium.com/intel-analytics-software/efficient-natural-language-embedding-models-with-intel-extension-for-transformers-2b6fcd0f8f34) and [BGE optimization example](https://github.com/intel/intel-extension-for-transformers/tree/main/examples/huggingface/pytorch/text-embedding/deployment/mteb/bge) for more details.\"\n",
+    "\n",
+    "In order to be able to load and use the quantized models, install the required dependency `pip install intel-extension-for-transformers torch accelerate datasets onnx`. \n",
+    "\n",
+    "Loading is done using the class `ItrexQuantizedBgeEmbedding`; usage is similar to any HuggingFace local embedding model; See example:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "%pip install llama-index-embeddings-huggingface-itrex"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/home/yuwenzho/.conda/envs/yuwen/lib/python3.9/site-packages/tqdm/auto.py:21: TqdmWarning: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html\n",
+      "  from .autonotebook import tqdm as notebook_tqdm\n",
+      "2024-03-29 15:40:42 [INFO] Start to extarct onnx model ops...\n",
+      "2024-03-29 15:40:42 [INFO] Extract onnxruntime model done...\n",
+      "2024-03-29 15:40:42 [INFO] Start to implement Sub-Graph matching and replacing...\n",
+      "2024-03-29 15:40:43 [INFO] Sub-Graph match and replace done...\n"
+     ]
+    }
+   ],
+   "source": [
+    "from llama_index.embeddings.huggingface_itrex import ItrexQuantizedBgeEmbedding\n",
+    "\n",
+    "embed_model = ItrexQuantizedBgeEmbedding(\n",
+    "    \"Intel/bge-small-en-v1.5-sts-int8-static-inc\"\n",
+    ")"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "384\n",
+      "[-0.005477035418152809, -0.000541043293196708, 0.036467909812927246, -0.04861024394631386, 0.0288068987429142]\n"
+     ]
+    }
+   ],
+   "source": [
+    "embeddings = embed_model.get_text_embedding(\"Hello World!\")\n",
+    "print(len(embeddings))\n",
+    "print(embeddings[:5])"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "yuwen",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}
@@ -0,0 +1,138 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "<a href=\"https://colab.research.google.com/github/run-llama/llama_index/blob/main/docs/docs/examples/embeddings/octoai.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# OctoAI Embeddings\n",
+    "\n",
+    "This guide shows you how to use [OctoAI's Embeddings](https://octo.ai/docs/text-gen-solution/getting-started) through LlamaIndex."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "First, let's install LlamaIndex and OctoAI's dependencies"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "%pip install llama-index-embeddings-octoai"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "!pip install llama-index"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Include your OctoAI API key below. You can get yours at [OctoAI](https://octo.ai). \n",
+    "\n",
+    "[Here](https://octo.ai/docs/getting-started/how-to-create-an-octoai-access-token) are some instructions in case you need more guidance."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "OCTOAI_API_KEY = \"\""
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "We can then query embeddings on OctoAI"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from llama_index.embeddings.octoai import OctoAIEmbedding\n",
+    "\n",
+    "embed_model = OctoAIEmbedding(api_key=OCTOAI_API_KEY)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "# Basic embedding example\n",
+    "embeddings = embed_model.get_text_embedding(\"How do I sail to the moon?\")\n",
+    "print(len(embeddings), embeddings[:10])\n",
+    "assert len(embeddings) == 1024"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Using Batched Embeddings"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "texts = [\n",
+    "    \"How do I sail to the moon?\",\n",
+    "    \"What is the best way to cook a steak?\",\n",
+    "    \"How do I apply for a job?\",\n",
+    "]\n",
+    "\n",
+    "embeddings = embed_model.get_text_embedding_batch(texts)\n",
+    "print(len(embeddings))\n",
+    "assert len(embeddings) == 3\n",
+    "assert len(embeddings[0]) == 1024"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 4
+}
@@ -0,0 +1,88 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "id": "cae1b4a8",
+   "metadata": {},
+   "source": [
+    "# Solar LLM\n",
+    "\n",
+    "Warning: Solar LLM is deprecated. Please use Upstage LLM instead. \n",
+    "See [Upstage LLM](https://docs.llamaindex.ai/en/stable/examples/llm/upstage/)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "715d392e",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "!pip install llama-index-llms-solar"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "1fdc2dc3-1454-41e9-8862-9dfd75b5b61f",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import os\n",
+    "\n",
+    "os.environ[\"SOLAR_API_KEY\"] = \"SOLAR_API_KEY\""
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "26b168b8-9ebf-479d-ac53-28bc952da354",
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "assistant: Mother also went into the room.\n"
+     ]
+    }
+   ],
+   "source": [
+    "# from llama_index.llms import\n",
+    "from llama_index.llms.solar import Solar\n",
+    "from llama_index.core.base.llms.types import ChatMessage, MessageRole\n",
+    "\n",
+    "llm = Solar(model=\"solar-1-mini-chat\", is_chat_model=True)\n",
+    "response = llm.chat(\n",
+    "    messages=[\n",
+    "        ChatMessage(role=\"user\", content=\"아버지가방에들어가셨다\"),\n",
+    "        ChatMessage(role=\"assistant\", content=\"Father went into his room\"),\n",
+    "        ChatMessage(role=\"user\", content=\"엄마도들어가셨다\"),\n",
+    "    ]\n",
+    ")\n",
+    "\n",
+    "print(response)"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": "Python 3 (ipykernel)",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 5
+}