首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
Euler的博客
累计撰写
214
篇文章
累计创建
83
个标签
累计收到
0
条评论
栏目
首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
目 录
CONTENT
最新文章
【LLaMA-Factory】核心参数配置指南
LLaMA-Factory 核心参数配置指南 在使用 LLaMA-Factory 进行模型微调时,界面上的几个核心参数往往让初学者感到困惑。这些参数看似简单,实际上每个都影响着模型的训练效果和性能表现。本文将深入解析这五个关键参数的作用机制和配置建议。 量化等级:在内存与精度间寻找平衡 量化等级(Q
2025-11-13
10
0
0
模型微调
【LLaMA-Factory】微调方法详解:LoRA、Freeze、OFT与Full对比
在使用LLaMA-Factory进行模型微调时,我们经常会遇到一个关键选择:应该使用哪种微调方法?LLaMA-Factory提供了四种主要的微调方法:LoRA、Freeze、OFT和Full。每种方法都有其独特的原理、适用场景和资源需求。本文将深入解析这四种方法的区别,帮助你在实际项目中做出合适的选
2025-11-13
9
0
0
模型微调
【LoRA】LoRA vs QLoRA 的区别
核心区别 LoRA (Low-Rank Adaptation) 参数高效微调方法 冻结原始模型权重,只训练低秩适配器(adapter) 模型以全精度(FP16/BF16)加载到显存 显存占用较高,适合显存充足的情况 QLoRA (Quantized LoRA) LoRA + 量化(Quantizat
2025-11-12
8
0
0
深度学习
【LoRA】LoRA 微调中的 target_modules 参数详解
LoRA 微调中的 target_modules 参数详解 什么是 target_modules? 在使用 LoRA (Low-Rank Adaptation) 进行大模型微调时,target_modules 是一个关键参数,它指定了哪些模块需要添加 LoRA 适配器。 简单来说:LoRA 不会修改
2025-11-11
6
0
0
深度学习
【深度学习】PERF 中 QUESTION_ANS 与 FEATURE_EXTRACTION 的区别
在进行参数高效微调(PERF/PEFT)时,QUESTION_ANS 和 FEATURE_EXTRACTION 这两种任务类型看似都需要特征提取,但实际上它们在训练过程中有本质的不同。 核心差异 任务目标 QUESTION_ANS:生成式任务,需要根据输入生成特定答案 FEATURE_EXTRACT
2025-11-11
4
0
0
深度学习
【深度学习】PEFT TaskType 任务类型详解
PEFT(Parameter-Efficient Fine-Tuning)是 Hugging Face 提供的参数高效微调库,在使用 LoRA、Prefix Tuning 等微调方法时,需要指定 TaskType 来告诉 PEFT 库当前任务的类型。正确选择任务类型对于模型微调的成功至关重要。 Ta
2025-11-11
5
0
0
深度学习
【Python】Matplotlib 中文乱码问题排查与修复指南
问题描述 在使用 matplotlib 绘制图表时,如果图表标题、坐标轴标签或图例中包含中文字符,可能会出现以下问题: 中文显示为方框:□□□ 或 [][][] 中文显示为乱码:显示为其他字符或符号 字体警告信息:控制台输出字体相关的警告信息 问题原因 matplotlib 默认使用的字体(如 De
2025-11-07
9
0
0
Python
【数据库】数据库主键ID选取策略深度解析
在数据库设计中,主键(Primary Key)的选择是一个看似简单但实际非常复杂的问题。不同的主键策略会直接影响系统的性能、可扩展性、安全性和维护成本。本文将按照从原理到实践的逻辑,深入探讨主键的实现原理、性能瓶颈、各种ID方案的优劣,以及架构层面的选择策略。 一、主键ID的核心作用 在深入讨论之前
2025-11-06
10
0
0
数据库与搜索
【数据库】聚簇索引与非聚簇索引
一、核心概念 聚簇索引(Clustered Index) 本质:数据行的物理存储顺序与索引键值的逻辑顺序相同,索引和数据存储在一起。 形象比喻:像一本按拼音排序的字典,内容本身就是按拼音顺序存放的,找到索引位置就直接找到了内容。 非聚簇索引(Non-Clustered Index) 本质:索引的逻辑
2025-11-06
6
0
0
数据库与搜索
【理论】机器学习与大模型研究中的常见实验方案
在学术研究与工程实践中,**实验设计(Experimental Design)**是验证一个模型是否真的“有效”的核心环节。 一个好的实验方案不仅能证明方法确实带来了改进,更能揭示其背后的因果机制、泛化能力与局限性。 本文将系统梳理机器学习与语言模型(LLM)研究中常见的实验设计思路,帮助你在科研或
2025-11-04
6
0
0
深度学习
1
2
3
4
5
...
22