Helm部署Milvus与langchain集成

Milvus Helm LangChain

 2026/03/24 

本文默认读者是一个helm糕手，会略过一些基础的概念，仅对关键部分做解释

Milvus是一个向量数据库，但是和之前用过的Chorma和FAISS相比，更加倾向于是一个功能完整的分布式数据库

维度	FAISS	Chroma	Milvus
定位	高性能向量搜索库	轻量级向量数据库	云原生分布式向量数据库
核心特点	极致检索速度、支持GPU加速	极简API、与LangChain等AI框架无缝集成	完整的数据管理能力、支持分布式、混合检索
架构/部署	本地嵌入式库，无服务端	本地或Docker部署，嵌入式优先	分布式、云原生，可部署在K8s上或使用云服务
数据规模	十亿级（通过GPU/多卡）	百万级	百亿/千亿级
索引与功能	提供多种索引算法(IVF, HNSW, PQ)，但无数据持久化、无CRUD，只是搜索库	基础索引，支持元数据过滤，但不支持复杂混合检索	支持向量与标量字段的混合检索、数据分区、多副本、高可用等完整数据库特性
性能指标	极致快（毫秒级，尤其在GPU上），纯算法层优化	较快，但在大规模数据和高并发场景下性能衰减明显	快（毫秒级，<50ms），且在亿级数据下性能表现稳定，高QPS
易用性	较高，需自行集成和管理索引文件	极高，几行Python代码即可运行	中等，功能丰富，但需要一定的运维知识（尤其是自建）
典型场景	学术研究、对性能有极致要求的特定场景、作为其它数据库的核心引擎	快速原型验证、个人项目、Jupyter Notebook中的AI实验	企业级生产环境、大规模RAG应用、推荐系统、多模态搜索

Milvus现在也支持单机部署或使用Lite轻量版直接用pip安装，不过我这里肯定是用更高级的方法部署，也就是Helm部署

参考文档：https://milvus.io/docs/zh/overview.md
官网推荐使用Operator或者Helm部署

Helm部署

# mlivus需要一个provisioner，必须搞一个
kubectl apply -f https://raw.githubusercontent.com/rancher/local-path-provisioner/master/deploy/local-path-storage.yaml
# 我使用的是kind部署的测试集群，所以默认就有
kubectl get sc
NAME PROVISIONER RECLAIMPOLICY VOLUMEBINDINGMODE ALLOWVOLUMEEXPANSION AGE
standard (default) rancher.io/local-path Delete WaitForFirstConsumer false 5d5h

# 我使用的helm版本为v4.0.4
helm repo add zilliztech https://zilliztech.github.io/milvus-helm/
helm repo update

# 直接部署的方式，但我没采用这种方式，因为后面肯定主要追求helm集成到我们自己的工程文件中
helm install my-release zilliztech/milvus \
 --set image.all.tag=v2.6.11 \
 --set pulsarv3.enabled=false \
 --set woodpecker.enabled=true \
 --set streaming.enabled=true \
 --set indexNode.enabled=false

# 搜索与拉取helm chart
helm search repo zilliztech/milvus --versions
NAME CHART VERSION APP VERSION DESCRIPTION 
zilliztech/milvus 5.0.16 2.6.13 Milvus is an open-source vector database built ...
zilliztech/milvus 5.0.15 2.6.12 Milvus is an open-source vector database built ...
zilliztech/milvus 5.0.14 2.6.11 Milvus is an open-source vector database built ...
...

helm pull zilliztech/milvus --version 5.0.14 --untar
cd milvus/

# 查看values.yaml文件，参数说明
上面他关闭和开启的几个模块：
pulsarv3 Pulsar (消息队列)因为启用了woodpecker，所以不需要了
woodpecker 啄木鸟 云原生预写日志（WAL）系统，作用是替代外部的消息队列
streaming 流服务 提供流数据的接入、管理和订阅功能，默认使用minio，也可以用公有云服务
indexNode 索引节点，用以加速向量检索，但消耗资源

# 调整参数（注意需要指定存储类）
pulsarv3.enabled=false
woodpecker.enabled=true
streaming.enabled=true
indexNode.enabled=false
etcd.persistence.storageClass=standard
minio.persistence.storageClass=standard
# 使用本地文件--首次部署
helm upgrade --install milvus . -f ./values.yaml -n milvus --create-namespace

配置Milvus使用OSS

# 在开始之前可以先用mc确认一下aksk以及endpoint是否正确
mc ls mlivus/milvus-wangsheng-test/
[2026-03-23 22:18:01 CST] 0B test/

# 关闭原本有的minio
minio:
 enabled: false
...

# 配置外部S3
# 他妈的这个b参数我真的试了几个小时，才试出来
externalS3:
 enabled: true
 host: "oss-cn-beijing.aliyuncs.com"
 port: "443"
 accessKey: "LTAIxxxx"
 secretKey: "qbfxxxxx"
 useSSL: true
 bucketName: "milvus-wangsheng-test"
 rootPath: "test"
 useIAM: false
 cloudProvider: "aliyun"
 iamEndpoint: ""
 region: "cn-beijing"
 useVirtualHost: true

# 清理方法
helm delete milvus -n milvus
kubectl delete pvc --all -n milvus

# helm更新
helm upgrade --install milvus . -f ./values.yaml -n milvus

部署Attu可视化看板

Attu 是 Milvus 官方推出的开源图形化管理工具

# 打一个端口转发，使外部可以访问到milvus本地
kubectl -n milvus port-forward --address 0.0.0.0 service/milvus 27017:19530 & 
kubectl -n milvus port-forward --address 0.0.0.0 svc/milvus 9091:9091 &

# 现在访问端点是 192.168.10.100:27017

# 部署attu
docker run -d \
 --name attu \
 -p 8000:3000 \
 -e MILVUS_URL=192.168.10.100:27017 \
 zilliz/attu:latest
 
# 访问端口8000就可以看到，直接点访问就可以点进去了

理解Milvus

要使用milvus首先要理解milvus的基本理论知识
Milvus 采用的是存储与计算分离的架构，它把整个系统拆成了四个层级：

**接入层 (Access Layer/Proxy)**：
就像酒店的前台。它不存数据，只负责校验你的请求、限流，并将请求转发给内部组件。
**协调器 (Coordinators)**：
系统的”大脑”。负责分配任务（比如告诉某个 Worker 该去处理哪个数据段）、管理元数据（存放在 Etcd）以及给数据分配唯一的 ID（TSO）。
执行节点 (Worker Nodes)：
系统的”苦力”。分为 QueryNode（负责搜）、DataNode（负责写）和 IndexNode（负责建立索引）。
**存储层 (Storage)**：

**对象存储 (OSS/MinIO)**：存放真正的向量数据和索引文件（你刚才折腾最久的地方）。
**元数据存储 (Etcd)**：存 Collection 结构、Pod 状态等。
消息队列 (Pulsar/Kafka)：这是 Milvus 的血液。所有的写入操作都会先变成一条消息进入队列。

实际上的使用流程

定义 Schema：选好维度和距离算法。
创建 Collection：定好 shards_num（影响写入吞吐）。
插入数据：批量插入（Batch Insert）效率远高于单条。
建立索引：选好 index_type（影响查询延迟）。
Load：设置 replica_number（影响查询并发）。
Search：开始你的向量检索。

使用Milvus

~~在理解流程的基础上，我准备使用我之前用langchain写的一个streamlit的项目，小改一手让他用milvus~~

~~是我高估自己了，我是个菜逼，整了半天硬是跑不通，算了跑个简单的得了~~

哈哈，成啦，我简直是个天才

之前失败是因为调整了oss参数，却没有清空etcd数据，数据不同步
导致proxy向mixcoord发起创建collection的请求失败
所以连接是通的，但发起collection的请求一直死锁

测试milvus连接

# 现在访问端点是 192.168.10.100:27017
cd langchain_project_PDF/
conda activate langchain
pip install -U pymilvus

cat > test_milvus.py <<EOF
from pymilvus import connections, utility

def test_connection():
 print("正在尝试连接 Milvus...")
 try:
 # 设置一个短的 timeout，防止无限等待
 connections.connect(
 alias="default", 
 host="192.168.10.100", 
 port="27017", 
 timeout=5
 )
 
 # 获取服务器版本，这是最轻量的请求
 version = utility.get_server_version()
 print(f"✅ 连接成功！Milvus 版本: {version}")
 
 # 列出所有集合名
 collections = utility.list_collections()
 print(f"当前数据库中的集合: {collections}")
 
 except Exception as e:
 print(f"❌ 连接失败: {e}")
 finally:
 connections.disconnect("default")

if __name__ == "__main__":
 test_connection()

EOF
python test_milvus.py

正在尝试连接 Milvus...
✅ 连接成功！Milvus 版本: 2.6.11
当前数据库中的集合: []

集成到langchain代码

import streamlit as st
from streamlit_extras.add_vertical_space import add_vertical_space
from PyPDF2 import PdfReader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_huggingface import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS
# from langchain_community.vectorstores import Milvus
from langchain_deepseek import ChatDeepSeek
from langchain.chains.question_answering import load_qa_chain
from langchain.callbacks.streamlit import StreamlitCallbackHandler
from langchain.callbacks import get_openai_callback
import pickle
import os
from dotenv import load_dotenv
import hashlib

# Milvus 相关导入
from pymilvus import connections, utility
from langchain_community.vectorstores import Milvus

load_dotenv()

# 1.创建UI
with st.sidebar:
 st.title("Ask for PDF")
 st.markdown("该项目提供PDF文件上传的功能，用户可以输入问题，在PDF文件中进行搜索")
 add_vertical_space(10) # 空五行
 st.write("测试项目")

# 写一个main作为程序入口
def main():
 st.header("Ask for PDF")
 
 # 文件上传器
 pdf = st.file_uploader("上传PDF", type="pdf")
 if pdf is not None:
 st.write(f">{pdf.name}上传完成")

 # ==================== MD5 哈希处理文件名 ====================
 # 解决中文名报错，并实现文件去重
 file_bytes = pdf.read()
 file_hash = hashlib.md5(file_bytes).hexdigest()
 collection_name = f"pdf_{file_hash}" 
 pdf.seek(0) # 重要：复位指针，确保下文 PdfReader 能读取内容
 # =============================================================

 # 2.读取pdf
 pdf_reader = PdfReader(pdf)
 text = ""
 for page in pdf_reader.pages:
 text += page.extract_text()
 
 # 3.文本切割
 text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=20, length_function=len)
 texts = text_splitter.split_text(text)
 st.write(texts)
 
 # 4.向量初始化
 embeddings = HuggingFaceEmbeddings(
 model_name="sentence-transformers/all-mpnet-base-v2",
 model_kwargs={'device': 'cpu'}
 )
 st.write(">嵌入式模型初始化完成")
 
 # 保留原有的 store_name 变量，兼容你之前的注释代码
 store_name = pdf.name[:-4]
 
 # ==================== FAISS 原代码（保留注释）====================
 # 如果数据库文件已存在，直接使用
 # if os.path.exists(f"{store_name}.pkl"):
 # with open(f"{store_name}.pkl", "rb") as f:
 # vectorstore = pickle.load(f)
 # st.write(">数据库已从磁盘加载")
 # else:
 # vectorstore = FAISS.from_texts(texts, embeddings)
 # # 数据库保存
 # with open(f"{store_name}.pkl","wb") as f:
 # pickle.dump(vectorstore, f)
 # st.write(f">数据库已保存为 {store_name}.pkl")
 # ================================================================
 
 # ==================== Milvus 新代码 (修正版) ====================
 # 定义统一的连接参数，避免使用 url 导致格式错误
 milvus_config = {
 "host": "192.168.10.100",
 "port": "19530"
 }

 # 连接到 Milvus
 connections.connect(
 alias="default",
 **milvus_config
 )
 st.write(f">已连接到 Milvus 服务器，映射集合名: {collection_name}")
 
 # 检查集合是否已存在
 if utility.has_collection(collection_name):
 # 从已有集合加载向量存储
 vectorstore = Milvus(
 embedding_function=embeddings,
 connection_args=milvus_config,
 collection_name=collection_name
 )
 st.write(f">Milvus 集合 '{collection_name}' 已从服务器加载")
 else:
 # 创建新的 Milvus 集合并插入向量
 vectorstore = Milvus.from_texts(
 texts=texts,
 embedding=embeddings,
 connection_args=milvus_config,
 collection_name=collection_name,
 drop_old=False
 )
 st.write(f">Milvus 集合 '{collection_name}' 已创建并保存")
 # ================================================================
 
 # 5.用户输入问题，检索数据库
 query = st.text_input("输入问题:")
 if query:
 docs = vectorstore.similarity_search(query, k=30)
 
 # web流式输出
 response_container = st.empty()
 st_callback = StreamlitCallbackHandler(parent_container=response_container)

 llm = ChatDeepSeek(
 model="deepseek-chat", 
 temperature=0.7,
 streaming=True,
 callbacks=[st_callback]
 )
 chain = load_qa_chain(llm, chain_type="stuff")
 
 # 回调统计token
 with get_openai_callback() as cb:
 reponse = chain.invoke({"question": query, "input_documents": docs})
 st.write(f">检索结果: {reponse['output_text']}")
 st.success(f"> 总Token数: {cb.total_tokens}")

if __name__ == '__main__':
 main()