首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
Euler的博客
累计撰写
214
篇文章
累计创建
83
个标签
累计收到
0
条评论
栏目
首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
目 录
CONTENT
以下是
AI前沿
相关的文章
【理论】机器学习与大模型研究中的常见实验方案
在学术研究与工程实践中,**实验设计(Experimental Design)**是验证一个模型是否真的“有效”的核心环节。 一个好的实验方案不仅能证明方法确实带来了改进,更能揭示其背后的因果机制、泛化能力与局限性。 本文将系统梳理机器学习与语言模型(LLM)研究中常见的实验设计思路,帮助你在科研或
2025-11-04
6
0
0
深度学习
【论文】训练万亿参数模型的内存优化(ZeRO)
论文地址 标题:ZeRO: Memory Optimizations Toward Training Trillion Parameter Models 链接:https://ar5iv.labs.arxiv.org/html/1910.02054 作者:Samyam Rajbhandari, Je
2025-11-03
8
0
0
论文
【上下文工程】Agent的上下文工程:Manus实战经验深度解析
论文地址 原文链接:Context Engineering for AI Agents: Lessons from Building Manus 作者:Yichao 'Peak' Ji 发布时间:2025年7月18日 机构:Manus AI 核心内容概述 这篇文章来自 Manus AI 团队的技术分
2025-10-23
9
0
0
大语言模型
【OCR】通过光学压缩实现长上下文的高效OCR(DeepSeek-OCR)
论文信息 论文标题:DeepSeek-OCR: Contexts Optical Compression 论文地址:https://arxiv.org/html/2510.18234 作者:Haoran Wei, Yaofeng Sun, Yukun Li (DeepSeek-AI) 发表时间:2
2025-10-22
5
0
0
论文
【论文】Lost in the Middle:语言模型长上下文位置偏见深度解析
论文地址 论文标题:Lost in the Middle: How Language Models Use Long Contexts 论文链接:https://ar5iv.labs.arxiv.org/html/2307.03172 作者:Nelson F. Liu, Kevin Lin, Joh
2025-10-21
5
0
0
论文
【论文】嵌入式检索的理论极限:LIMIT论文解读
论文地址 标题:On the Theoretical Limitations of Embedding-Based Retrieval 链接:arXiv 作者与机构:Orion Weller, Michael Boratko, Iftekhar Naim, Jinhyuk Lee(Google De
2025-10-17
20
0
0
论文
【LLM】OpenRouter模型工具调用支持分析
技术背景 在使用OpenRouter API调用大语言模型时,经常会遇到工具调用(Tool Calling)的需求。工具调用是现代AI应用中的重要功能,允许模型调用外部工具来执行特定任务,如搜索、计算、API调用等。 然而,在实际使用过程中,我发现了一个重要问题:并非所有模型都支持工具调用功能。特别
2025-10-16
12
0
0
大语言模型
【MCP】MCP协议演进:从SSE到Streamable HTTP
引言 在AI工具集成的世界中,Model Context Protocol (MCP) 作为连接AI模型与外部工具的标准协议,其传输层的选择直接影响着系统的可靠性、性能和可扩展性。本文将深入分析MCP协议从Server-Sent Events (SSE) 演进到Streamable HTTP的技术原
2025-10-15
10
0
0
MCP
【论文】密集向量检索在开放域问答中的应用(DPR)
论文信息 标题:Dense Passage Retrieval for Open-Domain Question Answering arXiv链接:https://arxiv.org/abs/2004.04906 作者:Vladimir Karpukhin, Barlas Oğuz, Sewon
2025-10-14
16
0
0
论文
【模型安全】大语言模型投毒攻击仅需近乎恒定的样本数量
论文地址 arXiv: https://arxiv.org/html/2510.07192 论文标题: Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples 作者机构: UK AI Security In
2025-10-14
11
0
0
论文
1
2
3
4
5
6
7