首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
Euler的博客
累计撰写
224
篇文章
累计创建
88
个标签
累计收到
0
条评论
栏目
首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
目 录
CONTENT
以下是
AI前沿
相关的文章
【论文】:精确零样本密集检索无需相关性标签(HyDE)
论文地址: Precise Zero-Shot Dense Retrieval without Relevance Labels 核心问题 现有的密集检索(Dense Retrieval)系统在零样本场景下表现不佳,特别是当没有相关性标签进行监督学习时。 具体表现 零样本学习困难:缺乏相关性标签时,
2025-10-08
27
0
0
论文
【论文】大型语言模型的低秩适配(LoRA)
论文概述 论文标题: LoRA: Low-Rank Adaptation of Large Language Models 作者: Edward Hu, Yelong Shen, Phillip Wallis, Zeyuan Allen-Zhu, Yuanzhi Li, Shean Wang, Lu
2025-09-30
20
0
0
论文
【理论】深入理解Transformer中的正弦位置编码
引言 位置编码(Positional Encoding)是Transformer架构中一个精妙而关键的组件。不同于卷积神经网络天然具备的空间感知能力,Transformer的自注意力机制本身是位置无关的——如果不加入位置信息,模型无法区分"我爱你"和"你爱我"。本文将深入探讨Transformer为
2025-09-30
15
0
0
理论
【论文】注意力机制(Attention)
论文概述 论文标题: Attention Is All You Need 作者: Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Łukasz Kaiser, Illia
2025-09-30
20
0
0
论文
【理论】注意力机制与多头注意力机制理解
1. 基础注意力机制 1.1 核心概念 注意力机制模拟人类阅读时的"聚焦"行为,让模型在处理每个位置时,能够关注到输入序列中最重要的部分。 1.2 数学原理 \text{Attention}(Q,K,V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\r
2025-09-29
25
0
0
深度学习
【提示词】顺序性指令微调大语言模型
Fine-Tuning Large Language Models with Sequential Instructions 核心问题 现有的指令微调(Instruction Tuning)模型在处理包含多个指令的复杂查询时表现不佳。 具体表现 多步骤指令执行困难:模型难以导航单个命令中的一系列子任
2025-09-28
11
0
0
论文
【机器学习】F1-Score、Recall、Precision详解:机器学习评估指标的核心
概述 在机器学习分类任务中,准确率(Accuracy)虽然是最直观的评估指标,但在处理不平衡数据集或需要关注特定类别性能时,往往不够全面。Precision(精确率)、Recall(召回率)和F1-Score(F1分数)这三个指标能够更细致地评估模型的性能,特别是在二分类和多分类问题中。 混淆矩阵基
2025-09-24
38
0
0
AI前沿
【LLM】Gemini Schema结构化响应
1. 简介 Gemini API的结构化响应功能允许开发者定义期望的输出格式,确保AI模型返回符合特定Schema的JSON数据。这对于需要稳定数据格式的应用场景非常有用,比如数据提取、API集成、自动化处理等。 通过使用Pydantic模型定义Schema,我们可以: 确保输出格式的一致性 进行类
2025-09-10
482
0
13
大语言模型
【深度学习】Transformer 注意力机制与 LoRA target_modules 详解
1. Transformer 自注意力机制结构 1.1 基础组件 class SelfAttention(nn.Module): def __init__(self, d_model, n_heads): super().__init__() self.d_m
2025-08-26
448
0
6
深度学习
【机器学习】从KNN算法到图像风格迁移:原理与实践
从KNN算法到图像风格迁移:原理与实践 引言 在机器学习的众多算法中,K近邻(K-Nearest Neighbors, KNN)算法以其简洁直观的思想而备受青睐。"物以类聚,人以群分"这句古话完美诠释了KNN的核心理念。但你是否想过,这样一个看似简单的算法,竟然也能应用于图像风格迁移这样的复杂任务?
2025-08-26
391
0
11
AI前沿
1
2
3
4
5
6
7