AI前沿-Euler的博客

累计撰写 219 篇文章
累计创建 87 个标签
累计收到 0 条评论

目录CONTENT

以下是 AI前沿相关的文章

【深度学习】PEFT TaskType 任务类型详解 PEFT（Parameter-Efficient Fine-Tuning）是 Hugging Face 提供的参数高效微调库，在使用 LoRA、Prefix Tuning 等微调方法时，需要指定 TaskType 来告诉 PEFT 库当前任务的类型。正确选择任务类型对于模型微调的成功至关重要。 Ta
- 2025-11-11
- 31
- 0
- 0
- 深度学习
【理论】机器学习与大模型研究中的常见实验方案在学术研究与工程实践中，**实验设计（Experimental Design）**是验证一个模型是否真的“有效”的核心环节。一个好的实验方案不仅能证明方法确实带来了改进，更能揭示其背后的因果机制、泛化能力与局限性。本文将系统梳理机器学习与语言模型（LLM）研究中常见的实验设计思路，帮助你在科研或
- 2025-11-04
- 10
- 0
- 0
- 深度学习
【论文】训练万亿参数模型的内存优化（ZeRO）论文地址标题：ZeRO: Memory Optimizations Toward Training Trillion Parameter Models 链接：https://ar5iv.labs.arxiv.org/html/1910.02054 作者：Samyam Rajbhandari, Je
- 2025-11-03
- 15
- 0
- 0
- 论文
【上下文工程】Agent的上下文工程：Manus实战经验深度解析论文地址原文链接：Context Engineering for AI Agents: Lessons from Building Manus 作者：Yichao 'Peak' Ji 发布时间：2025年7月18日机构：Manus AI 核心内容概述这篇文章来自 Manus AI 团队的技术分
- 2025-10-23
- 17
- 0
- 0
- 大语言模型
【OCR】通过光学压缩实现长上下文的高效OCR(DeepSeek-OCR) 论文信息论文标题：DeepSeek-OCR: Contexts Optical Compression 论文地址：https://arxiv.org/html/2510.18234 作者：Haoran Wei, Yaofeng Sun, Yukun Li (DeepSeek-AI) 发表时间：2
- 2025-10-22
- 9
- 0
- 0
- 论文
【论文】Lost in the Middle：语言模型长上下文位置偏见深度解析论文地址论文标题：Lost in the Middle: How Language Models Use Long Contexts 论文链接：https://ar5iv.labs.arxiv.org/html/2307.03172 作者：Nelson F. Liu, Kevin Lin, Joh
- 2025-10-21
- 19
- 0
- 0
- 论文
【论文】嵌入式检索的理论极限：LIMIT论文解读论文地址标题：On the Theoretical Limitations of Embedding-Based Retrieval 链接：arXiv 作者与机构：Orion Weller, Michael Boratko, Iftekhar Naim, Jinhyuk Lee（Google De
- 2025-10-17
- 31
- 0
- 0
- 论文
【LLM】OpenRouter模型工具调用支持分析技术背景在使用OpenRouter API调用大语言模型时，经常会遇到工具调用（Tool Calling）的需求。工具调用是现代AI应用中的重要功能，允许模型调用外部工具来执行特定任务，如搜索、计算、API调用等。然而，在实际使用过程中，我发现了一个重要问题：并非所有模型都支持工具调用功能。特别
- 2025-10-16
- 26
- 0
- 0
- 大语言模型
【MCP】MCP协议演进：从SSE到Streamable HTTP 引言在AI工具集成的世界中，Model Context Protocol (MCP) 作为连接AI模型与外部工具的标准协议，其传输层的选择直接影响着系统的可靠性、性能和可扩展性。本文将深入分析MCP协议从Server-Sent Events (SSE) 演进到Streamable HTTP的技术原
- 2025-10-15
- 15
- 0
- 0
- MCP
【论文】密集向量检索在开放域问答中的应用(DPR) 论文信息标题：Dense Passage Retrieval for Open-Domain Question Answering arXiv链接：https://arxiv.org/abs/2004.04906 作者：Vladimir Karpukhin, Barlas Oğuz, Sewon
- 2025-10-14
- 20
- 0
- 0
- 论文

1
2
3
4
5
6
7