首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
Euler的博客
累计撰写
211
篇文章
累计创建
82
个标签
累计收到
0
条评论
栏目
首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
目 录
CONTENT
以下是
理论
相关的文章
【论文】训练万亿参数模型的内存优化(ZeRO)
论文地址 标题:ZeRO: Memory Optimizations Toward Training Trillion Parameter Models 链接:https://ar5iv.labs.arxiv.org/html/1910.02054 作者:Samyam Rajbhandari, Je
2025-11-03
4
0
0
论文
【OCR】通过光学压缩实现长上下文的高效OCR(DeepSeek-OCR)
论文信息 论文标题:DeepSeek-OCR: Contexts Optical Compression 论文地址:https://arxiv.org/html/2510.18234 作者:Haoran Wei, Yaofeng Sun, Yukun Li (DeepSeek-AI) 发表时间:2
2025-10-22
3
0
0
论文
【论文】Lost in the Middle:语言模型长上下文位置偏见深度解析
论文地址 论文标题:Lost in the Middle: How Language Models Use Long Contexts 论文链接:https://ar5iv.labs.arxiv.org/html/2307.03172 作者:Nelson F. Liu, Kevin Lin, Joh
2025-10-21
3
0
0
论文
【论文】嵌入式检索的理论极限:LIMIT论文解读
论文地址 标题:On the Theoretical Limitations of Embedding-Based Retrieval 链接:arXiv 作者与机构:Orion Weller, Michael Boratko, Iftekhar Naim, Jinhyuk Lee(Google De
2025-10-17
17
0
0
论文
【论文】密集向量检索在开放域问答中的应用(DPR)
论文信息 标题:Dense Passage Retrieval for Open-Domain Question Answering arXiv链接:https://arxiv.org/abs/2004.04906 作者:Vladimir Karpukhin, Barlas Oğuz, Sewon
2025-10-14
14
0
0
论文
【模型安全】大语言模型投毒攻击仅需近乎恒定的样本数量
论文地址 arXiv: https://arxiv.org/html/2510.07192 论文标题: Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples 作者机构: UK AI Security In
2025-10-14
10
0
0
论文
【论文】Qwen3 Embedding:基于大语言模型的文本嵌入与重排序技术
论文地址 arXiv: https://arxiv.org/html/2506.05176 HuggingFace: https://huggingface.co/Qwen GitHub: https://github.com/QwenLM/Qwen3-Embedding ModelScope: h
2025-10-14
7
0
0
论文
【范式】深入理解 Point-wise、Pair-wise 与 List-wise 排序模型
一、引言 在招聘智能匹配、搜索排序、推荐系统等任务中,模型的核心目标都是:根据相关性将候选项排序。以招聘场景为例,给定一个职位(Job Description, JD),我们希望模型能自动为候选简历打分,并按匹配度排序,从而找到最合适的人选。 然而,排序问题本质上并非单一预测问题。不同的建模方式对“
2025-10-14
9
0
0
理论
【论文】大语言模型在国际天文学奥林匹克竞赛(IOAA)中的金牌表现
论文地址 arXiv: https://arxiv.org/html/2510.05016 标题: Large Language Models Achieve Gold Medal Performance at the International Olympiad on Astronomy & As
2025-10-13
6
0
0
论文
【论文】旋转位置编码增强的Transformer(RoFormer/RoPE)
论文概述 论文标题: RoFormer: Enhanced Transformer with Rotary Position Embedding 作者: Jianlin Su, Yu Lu, Shengfeng Pan, Ahmed Murtadha, Bo Wen, Yunfeng Liu 机构:
2025-10-11
13
0
0
论文
1
2