96SEO 2026-05-26 23:55 0
RAG如何实现无SQL查询MySQL?
在上一篇文章中,我们介绍了Milvus向量数据库,它是用来存储向量数据的。我们将各种非结构化的文档转为向量,存储在向量数据库。但是RAG系统不只有非结构化的数据,也有结构化的数据,比如说存储在MySQL或者其他关系型数据库中的数据。如何在RAG系统里面对这类数据进行检索查询呢?这就是本文要分享的内容:文本转SQL,即Text2SQL。
文本转SQL通俗来说就是用户输入自然语言,通过LLM大语言模型将自然语言结合表结构生成SQL的过程。这种技术Ke以帮助用户geng方便地查询数据库,而不需要编写复杂的SQL语句。

实现Text2SQL的核心思路是利用LLM理解用户的自然语言输入,并结合数据库的表结构生成相应的SQL语句。这个过程Ke以分为以下几个步骤:
. 问题向量化:将用户输入的自然语言问题转换为向量表示。
. 向量检索:利用向量数据库检索与问题相关的表结构、字段注释和实例SQL。
. 构造Prompt:将检索到的信息和用户问题组合成一个Prompt,输入到LLM中。
. 生成SQL:LLM根据Prompt生成相应的SQL语句。
. 执行SQL:将生成的SQL语句在数据库中执行,并返回结果。
. 重试机制:Ru果生成的SQL语句执行失败,利用错误信息修正Prompt,重新生成SQlL语句,直到成功或达到Zui大重试次数。
Milvus + LLM + MySql = Text2Sql
import os
import openai
from dotenv import load_dotenv
load_dotenv
from pymilvus import MilvusClient
from milvus_model.dense import OpenAIEmbeddingFunction
from sqlalchemy import create_engine, text
# ====================== 基础配置 ======================
openai.api_key = os.getenv
embedding_fn = OpenAIEmbeddingFunction(
model_name='text-embedding-3-large',
api_key=openai.api_key
)
# 连接 Milvus 服务
client = MilvusClient
# 连接 MySql 数据库
DB_URL = "mysql+pymysql://root:root@localhost:3306/finance_enterprise_db"
engine = create_engine
# ====================== 创建集合 ======================
def create_collections:
for name, dim in :
if client.has_collection:
client.drop_collection
schema = client.create_schema
schema.add_field
schema.add_field
schema.add_field
index_params = client.prepare_index_params
index_params.add_index
client.create_collection
# ====================== 获取表结构和字段注释 ======================
def get_all_tables:
with engine.connect as conn:
tables = conn.execute).fetchall
return for t in tables]
def get_ddl:
# 这里简化处理,实际应查询 INFORMATION_SCHEMA 获取完整的建表DDL
return f"CREATE TABLE {table} "
def get_columns:
# 这里简化为固定示例,实际应查询 INFORMATION_SCHEMA.COLUMNS 获取真实字段和注释
return
def get_examples:
# 示例 SQL,用于给 LLM 参考的学习样本
return
# ====================== 数据入库 ======================
def build_all:
create_collections
tables = get_all_tables
# 将 DDL 信息入库
ddls = )} for t in tables]
client.insert
# 将字段描述入库
descs =
for t in tables:
cols = get_columns
for col in cols:
text = f"{t}.{col}:{col}"
vector = embedding_fn
descs.append
client.insert
# 将示例Q2SQL入库
examples =
for q, sql in get_examples:
text = f"问题:{q}
SQL:{sql}"
vector = embedding_fn
examples.append
client.insert
# ====================== Text2SQL核心流程 ======================
def text2sql_finance:
# 问题向量化
q_emb = embedding_fn
# 向量检索三大知识库
ddl_hits = client.search(
collection_name="ddl_knowledge",
data=,
limit=3,
output_fields=
)
example_hits = client.search(
collection_name="q2sql_knowledge",
data=,
limit=3,
output_fields=
)
desc_hits = client.search(
collection_name="dbdesc_knowledge",
data=,
limit=5,
output_fields=
)
ddl_texts=for hit in ddl_hits]
example_texts=for hit in example_hits]
desc_texts=for hit in desc_hits]
prompt=f"""你是财务专家,请根据下面提供的、、,
生成可直接运行的MySql查询语句。
### 表结构信息:
{chr.join}
### 字段含义说明:
{chr.join}
### 参考示例:
{chr.join}
### 用户问题:
{question}
### 要求:
. 只返回纯SQL,不要任何解释和
标记。
. 必须使用提供的真实表和字段。
. 日期、金额等严格按业务逻辑处理。
. 不要编造字段。"""
response=openai.chat.completions.create(
model=“gpt-4o-mini”,
messages=,
temperature=0.7)
sql=response.choices.message.content.strip
print
try:
with engine.connectas conn:
result=conn.execute).fetchall
print
for row in result:
print
except Exception as e:
print)
if __name__==“__main__”:
build_all
question=“查2026年主营业务收入TOP前5的公司”
text2sql_finance
实践与优化方向`
``
markdown
知识库构建 ` ``
多轮会话支持
错误诊断Neng力
支持复杂查询
实时同步机制
智Neng优化机制
`
python
通过上述实践,我们成功实现了基于RAG + LLM + Milvus + MySql的Text2Sql方案,在实际应用中还需根据具体业务场景进行优化调整,以满足生产环境的需求。
希望这篇文章Neng够帮助你理解如何实现无SQL查询MySQL,Ru果你有任何问题或建议,欢迎在评论区留言讨论!
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback