当前位置：首页 > SEO教程 >

如何计算企业网站制作成本？

96SEO 2026-02-20 07:26 0

1.1

轻松下载和训练最先进的预训练模型。

使用预训练模型可以降低计算成本以及节省从头开始训练模型的时间。

这些模型可用于不同模态的任务例如

文本文本分类、信息抽取、问答系统、文本摘要、机器翻译和文本生成。

图像图像分类、目标检测和图像分割。

音频语音识别和音频分类。

多模态表格问答系统、OCR、扫描文档信息抽取、视频分类和视觉问答。

Transformers

库支持三个最流行的深度学习库PyTorch、TensorFlow

1.1.2

supportALBERT✅✅✅✅✅BART✅✅✅✅✅BEiT❌❌✅❌✅BERT✅✅✅✅✅Bert

Generation✅❌✅❌❌BigBird✅✅✅❌✅BigBirdPegasus❌❌✅❌❌Blenderbot✅✅✅✅✅BlenderbotSmall✅✅✅✅✅CamemBERT✅✅✅✅❌Canine✅❌✅❌❌CLIP✅✅✅✅✅ConvBERT✅✅✅✅❌ConvNext❌❌✅✅❌CTRL✅❌✅✅❌Data2VecAudio❌❌✅❌❌Data2VecText❌❌✅❌❌Data2VecVision❌❌✅✅❌DeBERTa✅✅✅✅❌DeBERTa-v2✅✅✅✅❌Decision

Transformer❌❌✅❌❌DeiT❌❌✅❌❌DETR❌❌✅❌❌DistilBERT✅✅✅✅✅DPR✅✅✅✅❌DPT❌❌✅❌❌ELECTRA✅✅✅✅✅Encoder

decoder❌❌✅✅✅FairSeq

Machine-Translation✅❌✅❌❌FlauBERT✅❌✅✅❌Flava❌❌✅❌❌FNet✅✅✅❌❌Funnel

Neo❌❌✅❌✅GPT-J❌❌✅✅✅Hubert❌❌✅✅❌I-BERT❌❌✅❌❌ImageGPT❌❌✅❌❌LayoutLM✅✅✅✅❌LayoutLMv2✅✅✅❌❌LED✅✅✅✅❌Longformer✅✅✅✅❌LUKE✅❌✅❌❌LXMERT✅✅✅✅❌M2M100✅❌✅❌❌Marian✅❌✅✅✅MaskFormer❌❌✅❌❌mBART✅✅✅✅✅MegatronBert❌❌✅❌❌MobileBERT✅✅✅✅❌MPNet✅✅✅✅❌mT5✅✅✅✅✅Nystromformer❌❌✅❌❌OpenAI

GPT✅✅✅✅❌OpenAI

GPT-2✅✅✅✅✅OPT❌❌✅❌❌Pegasus✅✅✅✅✅Perceiver✅❌✅❌❌PLBart✅❌✅❌❌PoolFormer❌❌✅❌❌ProphetNet✅❌✅❌❌QDQBert❌❌✅❌❌RAG✅❌✅✅❌Realm✅✅✅❌❌Reformer✅✅✅❌❌RegNet❌❌✅❌❌RemBERT✅✅✅✅❌ResNet❌❌✅❌❌RetriBERT✅✅✅❌❌RoBERTa✅✅✅✅✅RoFormer✅✅✅✅✅SegFormer❌❌✅❌❌SEW❌❌✅❌❌SEW-D❌❌✅❌❌Speech

Encoder

decoder❌❌✅❌✅Speech2Text✅❌✅✅❌Speech2Text2✅❌❌❌❌Splinter✅✅✅❌❌SqueezeBERT✅✅✅❌❌Swin❌❌✅❌❌T5✅✅✅✅✅TAPAS✅❌✅✅❌TAPEX✅✅✅✅✅Transformer-XL✅❌✅✅❌TrOCR❌❌✅❌❌UniSpeech❌❌✅❌❌UniSpeechSat❌❌✅❌❌VAN❌❌✅❌❌ViLT❌❌✅❌❌Vision

Encoder

decoder❌❌✅✅✅VisionTextDualEncoder❌❌✅❌✅VisualBert❌❌✅❌❌ViT❌❌✅✅✅ViTMAE❌❌✅✅❌Wav2Vec2✅❌✅✅✅WavLM❌❌✅❌❌XGLM✅✅✅❌✅XLM✅❌✅✅❌XLM-RoBERTa✅✅✅✅✅XLM-RoBERTa-XL❌❌✅❌❌XLMProphetNet✅❌✅❌❌XLNet✅✅✅✅❌YOLOS❌❌✅❌❌

注意Tokenizer

answering掩码恢复Fill-mask文本摘要Summarization机器翻译Translation特征提取Feature

extraction

Transformers/pipelines/__init__.py

SUPPORTED_TASKS

例如当前我们需要进行一个情感分析的推断任务。

我们可以直接使用如下代码

from

Transformers/pipelines/__init__.py

SUPPORTED_TASKS

上面部分在进行推理时使用的是对应任务的默认模型。

但是有时候我们希望使用指定的模型可以通过指定

pipeline()

pipeline(sentiment-analysis,modelIDEA-CCNL/Erlangshen-Roberta-110M-Sentiment)

result

0.9374911785125732}]第二种方法和上面的方法加载的是相同的模型。

不过这种方法可以使用本地模型进行推理。

from

AutoModelForSequenceClassification

from

r../pretrained_model/IDEA-CCNL(Erlangshen-Roberta-110M-Sentiment)

model

AutoModelForSequenceClassification.from_pretrained(model_path)

tokenizer

AutoTokenizer.from_pretrained(model_path)classifier

modelmodel,

0.9374911785125732}]总结上面部分介绍了使用

pipeline()

对文本分类任务的推断的方法。

针对文本其他类型任务、图像和音频的任务使用方法基本一致详细可参照

1.3

有时候需要随机初始化模型权值比如使用自己的数据进行预训练。

首先我们需要初始化一个

config

使用的是默认值不过根据需要我们可以修改对应的参数。

当然我们也可以使用

config

r../pretrained_model/IDEA-CCNL(Erlangshen-Roberta-110M-Sentiment)

config

AutoConfig.from_pretrained(model_path)

model

AutoModel.from_config(config)1.3.2

使用预训练权值初始化模型权值

AutoModelForXXX.from_pretrained()

XXX是因为不同类型的任务所使用的类是不一样的。

例如我们需要加载一个文本序列分类模型需要使用

AutoModelForSequenceClassification。

from

AutoModelForSequenceClassificationmodel

AutoModelForSequenceClassification.from_pretrained(IDEA-CCNL/Erlangshen-Roberta-110M-Sentiment)AutoModelForSequenceClassification.from_pretrained()

from

AutoModelForSequenceClassificationmodel_path

r../pretrained_model/IDEA-CCNL(Erlangshen-Roberta-110M-Sentiment)

model

AutoModelForSequenceClassification.from_pretrained(model_path)我们也可以使用具体的模型类比如下面的

from

BertForSequenceClassificationmodel_path

r../pretrained_model/IDEA-CCNL(Erlangshen-Roberta-110M-Sentiment)

model

BertForSequenceClassification.from_pretrained(model_path)注意上面的模型类型都是针对

PyTorch

TFBertForSequenceClassification

总结官方推荐使用

因为模型本身是无法理解原始文本、图像或者音频的。

所以需要先将数据转换成模型可以接受的形式然后再传入模型中。

1.4.1

vocab这些数值会被构建成张量并作为模型的输入。

模型所需要的其他输入也是由

tokenizer

tokenizer。

只有这样才能确保文本以预训练语料库相同的方式进行分割并使用相同的对应

token

AutoTokenizer.from_pretrained()

加载一个预训练

r../pretrained_model/IDEA-CCNL(Erlangshen-Roberta-110M-Sentiment)

tokenizer

AutoTokenizer.from_pretrained(model_path)encoded_input

tokenizer(今天心情很好)

tokenizer.decode(encoded_input[input_ids])

[CLS]

当我们处理一批句子时它们的长度并不总是相同的。

但是模型的输入需要具有统一的形状shape。

填充是实现此需求的一种策略即为

token

当句子太短时可以采用填充的策略。

但有时候句子可能太长模型无法处理。

在这种情况下可以将句子进行截断。

tokenizer()

tokenizer(batch_sentences,paddingTrue,

truncationTrue,return_tensorspt)

{input_ids:tensor([[

0]]),attention_mask:tensor([[1,

0],[1,

针对音频数据预处理主要包括重采样Resample、特征提取Feature

Extractor、填充pad和截断Truncate详细信息请参照

这里。

针对多模态数据不同类型的数据使用前面介绍的对应预处理方法详细信息请参照

这里。

虽然每种数据的预处理方法不完全一样但是最终的目的都是一致的将原始数据转换为模型可以接受的形式。

1.5

下面将以一个文本多分类的例子简单介绍如何使用我们自己的数据训练一个分类模型。

1.5.1

print(datasets[train][0])在这里需要注意一下因为我们是使用自己的数据进行模型训练所以上面

load_dataset

传入的参数是一些字符串比如load_dataset(imdb)然后会自动下载对应数据集。

1.5.2

在将数据喂给模型之前需要将数据进行预处理Tokenize、填充、截断等。

from

AutoTokenizer.from_pretrained(configure[model_path])def

tokenize_function(examples):return

paddingmax_length,

datasets.map(tokenize_function,

batchedTrue)

print(tokenized_datasets[train][0])首先加载

tokenizer然后使用

AutoModelForSequenceClassification#

步加载模型

AutoModelForSequenceClassification.from_pretrained(configure[model_path],

num_labelsget_num_labels())与前面部分不同的地方在于上面的代码中有一个

num_labels

在模型训练过程中我们希望能够输出模型的性能指标比如准确率、精确率、召回率、F1

Datasets

compute_metrics(eval_pred):logits,

labels

metric.compute(predictionspredictions,

1.5.5

TrainingArguments(output_dirconfigure[output_dir],evaluation_strategyepoch)在上面的代码中我们设置了两个参数output_dir

epoch

经过前面一系列的步骤后我们终于可以开始进行模型训练了。

Transformers

Trainer

Trainer(modelclassification_model,argstraining_args,train_datasettokenized_datasets[train],eval_datasettokenized_datasets[validation],tokenizertokenizer,compute_metricscompute_metrics)

trainer.train()#

trainer.save_model()有时候我们需要调试模型就需要自己编写模型训练循环详细方法可以参照

1.5.7

经过前面的介绍现在我们就可以开始动手训练我们自己的文本多分类模型了。

Transformers

库微调预训练模型。

针对其他类型的任务相比文本分类任务会存在一些差异具体指导可以参照以下链接

任务类型参考链接文本分类Text

classificationhttps://huggingface.co/docs/transformers/tasks/sequence_classificationToken

classification例如

NERhttps://huggingface.co/docs/transformers/tasks/token_classification问答系统Question

answeringhttps://huggingface.co/docs/transformers/tasks/question_answering语言模型Language

modelinghttps://huggingface.co/docs/transformers/tasks/language_modeling机器翻译Translationhttps://huggingface.co/docs/transformers/tasks/translation文本摘要Sumarizationhttps://huggingface.co/docs/transformers/tasks/summarization多项选择Multiple

choicehttps://huggingface.co/docs/transformers/tasks/multiple_choice音频分类Audio

classificationhttps://huggingface.co/docs/transformers/tasks/audio_classification自动语音识别ASRhttps://huggingface.co/docs/transformers/tasks/asr图像分类Image

classificationhttps://huggingface.co/docs/transformers/tasks/image_classification

[1]

https://github.com/nlp-with-transformers/notebooks

[5]

https://github.com/datawhalechina/learn-nlp-with-transformers

标签： WordPress模板使用方法做服装的外贸网站企业网站的制作成本

为您推荐

SEO优化服务概述

作为专业的SEO优化服务提供商，我们致力于通过科学、系统的搜索引擎优化策略，帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。

百度官方合作伙伴白帽SEO技术数据驱动优化效果长期稳定

SEO优化核心服务

网站技术SEO

网站结构优化 - 提升网站爬虫可访问性
页面速度优化 - 缩短加载时间，提高用户体验
移动端适配 - 确保移动设备友好性
HTTPS安全协议 - 提升网站安全性与信任度
结构化数据标记 - 增强搜索结果显示效果

内容优化服务

关键词研究与布局 - 精准定位目标关键词
高质量内容创作 - 原创、专业、有价值的内容
Meta标签优化 - 提升点击率和相关性
内容更新策略 - 保持网站内容新鲜度
多媒体内容优化 - 图片、视频SEO优化

外链建设策略

高质量外链获取 - 权威网站链接建设
品牌提及监控 - 追踪品牌在线曝光
行业目录提交 - 提升网站基础权威
社交媒体整合 - 增强内容传播力
链接质量分析 - 避免低质量链接风险

SEO服务方案对比

服务项目	基础套餐	标准套餐	高级定制
关键词优化数量	10-20个核心词	30-50个核心词+长尾词	80-150个全方位覆盖
内容优化	基础页面优化	全站内容优化+每月5篇原创	个性化内容策略+每月15篇原创
技术SEO	基本技术检查	全面技术优化+移动适配	深度技术重构+性能优化
外链建设	每月5-10条	每月20-30条高质量外链	每月50+条多渠道外链
数据报告	月度基础报告	双周详细报告+分析	每周深度报告+策略调整
效果保障	3-6个月见效	2-4个月见效	1-3个月快速见效

SEO优化实施流程

我们的SEO优化服务遵循科学严谨的流程，确保每一步都基于数据分析和行业最佳实践：

网站诊断分析

全面检测网站技术问题、内容质量、竞争对手情况，制定个性化优化方案。

关键词策略制定

基于用户搜索意图和商业目标，制定全面的关键词矩阵和布局策略。

技术优化实施

解决网站技术问题，优化网站结构，提升页面速度和移动端体验。

内容优化建设

创作高质量原创内容，优化现有页面，建立内容更新机制。

外链建设推广

获取高质量外部链接，建立品牌在线影响力，提升网站权威度。

数据监控调整

持续监控排名、流量和转化数据，根据效果调整优化策略。

SEO优化常见问题

SEO优化一般需要多长时间才能看到效果？

SEO是一个渐进的过程，通常需要3-6个月才能看到明显效果。具体时间取决于网站现状、竞争程度和优化强度。我们的标准套餐一般在2-4个月内开始显现效果，高级定制方案可能在1-3个月内就能看到初步成果。

你们使用白帽SEO技术还是黑帽技术？

我们始终坚持使用白帽SEO技术，遵循搜索引擎的官方指南。我们的优化策略注重长期效果和可持续性，绝不使用任何可能导致网站被惩罚的违规手段。作为百度官方合作伙伴，我们承诺提供安全、合规的SEO服务。

SEO优化后效果能持续多久？

通过我们的白帽SEO策略获得的排名和流量具有长期稳定性。一旦网站达到理想排名，只需适当的维护和更新，效果可以持续数年。我们提供优化后维护服务，确保您的网站长期保持竞争优势。

你们提供SEO优化效果保障吗？

我们提供基于数据的SEO效果承诺。根据服务套餐不同，我们承诺在约定时间内将核心关键词优化到指定排名位置，或实现约定的自然流量增长目标。所有承诺都会在服务合同中明确约定，并提供详细的KPI衡量标准。

SEO优化效果数据

基于我们服务的客户数据统计，平均优化效果如下：

+85%

自然搜索流量提升

+120%

关键词排名数量

+60%

网站转化率提升

3-6月

平均见效周期

行业案例 - 制造业

优化前：日均自然流量120，核心词无排名
优化6个月后：日均自然流量950，15个核心词首页排名
效果提升：流量增长692%，询盘量增加320%

行业案例 - 电商

优化前：月均自然订单50单，转化率1.2%
优化4个月后：月均自然订单210单，转化率2.8%
效果提升：订单增长320%，转化率提升133%

行业案例 - 教育

优化前：月均咨询量35个，主要依赖付费广告
优化5个月后：月均咨询量180个，自然流量占比65%
效果提升：咨询量增长414%，营销成本降低57%

为什么选择我们的SEO服务

专业团队

10年以上SEO经验专家带队
百度、Google认证工程师
内容创作、技术开发、数据分析多领域团队
持续培训保持技术领先

数据驱动

自主研发SEO分析工具
实时排名监控系统
竞争对手深度分析
效果可视化报告

透明合作

清晰的服务内容和价格
定期进展汇报和沟通
效果数据实时可查
灵活的合同条款

我们的SEO服务理念

我们坚信，真正的SEO优化不仅仅是追求排名，而是通过提供优质内容、优化用户体验、建立网站权威，最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系，共同成长。

SEO教程

如何计算企业网站制作成本？

1.1

Transformers

相关资源对应网址如下

1.1.2

decoder❌❌✅✅✅FairSeq

GPT✅✅✅✅❌OpenAI

Encoder

Encoder

注意Tokenizer

extraction

SUPPORTED_TASKS

from

SUPPORTED_TASKS

pipeline()

result

from

from

model

tokenizer

modelmodel,

pipeline()

1.3

config

config

config

model

使用预训练权值初始化模型权值

from

from

model

from

model

PyTorch

总结官方推荐使用

1.4.1

tokenizer

token

加载一个预训练

tokenizer

tokenizer(今天心情很好)

[CLS]

token

tokenizer()

{input_ids:tensor([[

0],[1,

1.5

1.5.1

load_dataset

1.5.2

from

paddingmax_length,

batchedTrue)

tokenizer然后使用

步加载模型

num_labels

Datasets

labels

1.5.5

epoch

Trainer

trainer.train()#

1.5.7

Transformers

任务类型参考链接文本分类Text

classification例如

[1]

[5]

为您推荐

SEO优化服务内容导航

SEO优化服务概述

SEO优化核心服务

网站技术SEO

内容优化服务

外链建设策略

SEO服务方案对比

SEO优化实施流程

网站诊断分析

关键词策略制定