论文-Euler的博客

累计撰写 226 篇文章
累计创建 89 个标签
累计收到 0 条评论

目录CONTENT

以下是论文相关的文章

【论文】训练万亿参数模型的内存优化（ZeRO）论文地址标题：ZeRO: Memory Optimizations Toward Training Trillion Parameter Models 链接：https://ar5iv.labs.arxiv.org/html/1910.02054 作者：Samyam Rajbhandari, Je
- 2025-11-03
- 38
- 0
- 0
- 论文
【OCR】通过光学压缩实现长上下文的高效OCR(DeepSeek-OCR) 论文信息论文标题：DeepSeek-OCR: Contexts Optical Compression 论文地址：https://arxiv.org/html/2510.18234 作者：Haoran Wei, Yaofeng Sun, Yukun Li (DeepSeek-AI) 发表时间：2
- 2025-10-22
- 24
- 0
- 0
- 论文
【论文】Lost in the Middle：语言模型长上下文位置偏见深度解析论文地址论文标题：Lost in the Middle: How Language Models Use Long Contexts 论文链接：https://ar5iv.labs.arxiv.org/html/2307.03172 作者：Nelson F. Liu, Kevin Lin, Joh
- 2025-10-21
- 92
- 0
- 0
- 论文
【论文】嵌入式检索的理论极限：LIMIT论文解读论文地址标题：On the Theoretical Limitations of Embedding-Based Retrieval 链接：arXiv 作者与机构：Orion Weller, Michael Boratko, Iftekhar Naim, Jinhyuk Lee（Google De
- 2025-10-17
- 44
- 0
- 0
- 论文
【论文】密集向量检索在开放域问答中的应用(DPR) 论文信息标题：Dense Passage Retrieval for Open-Domain Question Answering arXiv链接：https://arxiv.org/abs/2004.04906 作者：Vladimir Karpukhin, Barlas Oğuz, Sewon
- 2025-10-14
- 43
- 0
- 0
- 论文
【模型安全】大语言模型投毒攻击仅需近乎恒定的样本数量论文地址 arXiv: https://arxiv.org/html/2510.07192 论文标题: Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples 作者机构: UK AI Security In
- 2025-10-14
- 32
- 0
- 0
- 论文
【论文】Qwen3 Embedding：基于大语言模型的文本嵌入与重排序技术论文地址 arXiv: https://arxiv.org/html/2506.05176 HuggingFace: https://huggingface.co/Qwen GitHub: https://github.com/QwenLM/Qwen3-Embedding ModelScope: h
- 2025-10-14
- 88
- 0
- 0
- 论文
【论文】大语言模型在国际天文学奥林匹克竞赛(IOAA)中的金牌表现论文地址 arXiv: https://arxiv.org/html/2510.05016 标题: Large Language Models Achieve Gold Medal Performance at the International Olympiad on Astronomy & As
- 2025-10-13
- 47
- 0
- 0
- 论文
【论文】旋转位置编码增强的Transformer(RoFormer/RoPE) 论文概述论文标题: RoFormer: Enhanced Transformer with Rotary Position Embedding 作者: Jianlin Su, Yu Lu, Shengfeng Pan, Ahmed Murtadha, Bo Wen, Yunfeng Liu 机构:
- 2025-10-11
- 30
- 0
- 0
- 论文
【论文】顺序性指令微调大语言模型(SIT) 论文地址: Fine-Tuning Large Language Models with Sequential Instructions 核心问题现有的指令微调（Instruction Tuning）模型在处理包含多个指令的复杂查询时表现不佳。具体表现多步骤指令执行困难：模型难以导航单个命令中
- 2025-10-10
- 22
- 0
- 0
- 论文

1
2