96SEO 2026-02-23 14:10 2
项目#xff0c;将之前的奥运会数据集加载到索引中#xff0c;使用推理处理器和

expansion查询以自然语言表达形式搜索历史奥运会比赛信息。
年夏季奥运会参赛者的数据集。
它包含有关比赛年份、比赛类型、参赛者姓名、他们是否赢得奖牌以及最终获得哪枚奖牌以及其他信息的信息。
eland请注意下面我使用的版本。
如果你使用的不是同一个版本则可能需要根据你使用的版本中的任何最终语法更改来调整代码。
密钥是从环境变量中读取的你需要根据自己的情况使用适当的值或者使用你喜欢的任何方法来读取凭据。
environ.get(SERVERLESS_ENDPOINT_URL)
environ.get(SERVERLESS_API_KEY)client
Elasticsearch(serverless_endpoint,api_keyserverless_api_key
)client.info()如果一切配置正确你应该得到如下输出
d6c6698e28c34e58b6f858df9442abac,
minimum_wire_compatibility_version:
minimum_index_compatibility_version:
模型。
我们将检查该模型是否之前已部署并将其删除以执行全新安装。
此外由于部署阶段可能需要几分钟我们将不断检查模型配置信息以确保在进入下一阶段之前模型定义存在。
有关更多信息请查看Get
try:client.ml.delete_trained_model(model_id.elser_model_2,
exceptions.NotFoundError:print(Model
client.ml.put_trained_model(model_id.elser_model_2,input{field_names:
client.ml.get_trained_models(model_id.elser_model_2,
status[trained_model_configs][0][fully_defined]:print(ELSER
deployed.)breakelse:print(ELSER
deployed.)time.sleep(5)一旦我们确认模型已下载并准备部署我们就可以继续启动
https://www.elastic.co/guide/en/elasticsearch/reference/current/get-trained-models-stats.html
get_model_routing_state(model_id.elser_model_2):try:status
client.ml.get_trained_models_stats(model_id.elser_model_2,)return
status[trained_model_stats][0][deployment_stats][nodes][0][routing_state][routing_state]except:return
get_model_routing_state(.elser_model_2)
deploymentclient.ml.start_trained_model_deployment(model_id.elser_model_2,number_of_allocations16,threads_per_allocation4,wait_forstarting)while
get_model_routing_state(.elser_model_2)
deployed.)breakelse:print(ELSER
csv_fileAthletes_summer_games.csved.csv_to_eland(csv_file,es_clientclient,es_dest_indexindex,es_if_existsreplace,es_dropnaTrue,es_refreshTrue,index_col0,es_type_overrides{City:
elser-olympic-games。
你还可以将生成的数据框
我们使用语义搜索探索过去奥运会比赛数据的下一步是创建一个包含运行
的摄取管道。
已选择一组字段并将其串联成推理处理器将在其上工作的单个字段。
根据你的用例你可能需要使用另一种策略。
模型将串联字段作为输入并将输出存储在稀疏向量类型字段中参见以下要点。
client.ingest.put_pipeline(idelser-ingest-pipeline,descriptionIngest
concatenated_text,output_field:
concatenated_text_embedding}]}}]
这是使用自然语言表达查询过去奥运会比赛数据之前的最后一个阶段。
我们将更新之前创建的索引的映射添加一个
indexelser-olympic-gamesmappings_properties{concatenated_text:
text},concatenated_text_embedding:
}client.indices.put_mapping(indexindex,propertiesmappings_properties
client.update_by_query(indexelser-olympic-games,pipelineelser-ingest-pipeline,wait_for_completionFalse
的分配数量和每个分配的线程数。
完成此步骤后我们现在可以开始使用语义搜索探索过去的奥运会数据集。
查询使用自然语言表达来检索有关过去奥运会比赛的信息。
在进行演示之前让我们创建一个函数来检索和格式化搜索结果。
semantic_search(search_text):response
client.search(indexelser-olympic-games,size3,query{bool:
Medal}}]}},source_excludes*_embedding,
hit[_source][Medal]print(fScore:
{medal}\n)上述函数将接收有关往届奥运会比赛获胜者的问题并使用
查询执行语义搜索。
检索到的结果将被格式化并打印出来。
请注意我们强制查询中存在奖牌因为我们只对获胜者感兴趣。
我们还将结果的大小限制为
3因为我们预计会有三名获胜者金牌、银牌、铜牌。
同样根据你的用例你可能不一定会做同样的事情。
serverless以避免任何额外费用。
要进一步了解请随时查看我们的
自行决定。
任何当前不可用的特性或功能可能无法按时交付或根本无法交付。
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback