xmlns="http://www.w3.org/2000/svg"style="display:EncodingsAuthors:SuhyungJang,Summary:利用大语言模型编码增强模型训练中的建筑语义保护作者:SuhyungJang,/>机构:延世大学建筑工程系(韩国);慕尼黑工业大学高等研究院(德国)1.引言AI行业的有效应用取决于建筑项目信息在机器可理解格式中的准确表示。以往研究多关注数据格式(如照片、点云、BIM图),但往往忽视了编码方法的选择,默认使用one-hot模型训练中作为编码工具的潜力尚未得到充分开发。本研究提出使用LLM编码”),并在建筑对象子类型分类任务中通过GraphSAGE生成的嵌入,并探讨了维度压缩对语义保留的影响。3.LLM函数会稀释语义特征。本研究将神经网络最后一层的维度设置为与目标LLM嵌入一致,并使用**余弦嵌入损失(CosineEmbeddingLoss)**计算输出嵌入ee_pestyle="height:0.05em;">pstyle="height:0.2861em;">与目标嵌入ee_testyle="height:0.05em;">tstyle="height:0.15em;">之间的差异:L=\frac{\mathbf{e}_p\cdot\mathbf{e}_t}{\|\mathbf{e}_p\|\|\mathbf{e}_t\|}\quad(1)L(estyle="height:0.05em;">pstyle="height:0.2861em;">,estyle="height:0.05em;">tstyle="height:0.15em;">)=1−style="height:-2.314em;">∥estyle="height:0.05em;">pstyle="height:0.2861em;">∥∥estyle="height:0.05em;">tstyle="height:0.15em;">∥style="top:-3.677em;">estyle="height:0.05em;">pstyle="height:0.2861em;">⋅estyle="height:0.05em;">tstyle="height:0.15em;">style="height:0.9721em;">(1)3.2Matryoshka表示模型为了应对高维嵌入带来的计算效率问题,研究采用了Matryoshka表示模型,将高维嵌入投影到低维空间(如1,024维),同时保留关键语义特征。5.结果如表分数align="left">加权平均分数align="left">One-hotalign="left">0.8475align="left">One-hotalign="left">0.8705align="left">text-embedding-3-smallalign="left">1,536align="left">0.8498align="left">text-embedding-3-smallalign="left">0.8655align="left">text-embedding-3-largealign="left">3,072align="left">0.8529align="left">text-embedding-3-largealign="left">0.8766align="left">4,096align="left">0.87145.1One-hot0.006596p=0.006596)。这表明压缩过程可能在去除噪声的同时保留了关键语义线索。5.2LLM编码之间的对比在压缩格式下,不同LLM得益于其庞大的训练基数和参数量,表现优异。结果还显示,压缩后的嵌入往往优于原始高维嵌入,这可能是因为当前使用的模型(GraphSAGE)规模尚不足以充分捕捉极高维度的全部语义。7.LLM/>致谢本项目由韩国国土交通部(KAIA)和德国慕尼黑工业大学高等研究院(TUM-IAS)汉斯·费舍尔高级奖学金项目资助。OriginalrepresentationLink:2602.15791v1部分平台可能图片显示异常,请以我的博客内容为准 标签: Enhancing Building Semantics Preservation in AI Model Training with Large Language Model Encodings 上一篇: 昌邑市住房和建设局网站专业制作软件园网站的服务是什么? 下一篇: 合肥网站前端开发,使用WordPress和速卖通插件的月收入大约是多少? 为您推荐 昌邑市住房和建设局网站专业制作软件园网站的服务是什么? 博物馆网站如何通过搜索引擎优化吸引访客? 如何构建一个针对校园二手商品交易的生活信息服务系统? 如何免费创建个人网站并享受其提供的服务? 如何为安吉地区设计一个吸引广州客户的家居网站? 合肥网站前端开发,使用WordPress和速卖通插件的月收入大约是多少? 导师再次要求重写作业?8款降AI率软件推荐,本科生必看! 如何免费获取学生专属的HTML网页模板,用于制作自己的图片展示网站? 2025年不锈钢带制造厂推荐:五大不锈钢带制造企业深度解析,哪个品牌最值得信赖? AI元人文:从分野到纠缠——一种基于值动力学的统一视角这个可以为一个的,例如:AI元人文如何从分野走向统一?