首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
Euler的博客
累计撰写
215
篇文章
累计创建
84
个标签
累计收到
0
条评论
栏目
首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
目 录
CONTENT
以下是
大模型
相关的文章
【模型训练】只奖励最终答案,为什么模型仍然学会了正确推理?
——RLVR 的工程机制与实践启示 1. 背景:RLVR 是否真的提升了推理能力? 随着 DeepSeek-R1 及其所采用的 GRPO(Group Relative Policy Optimization)算法引发广泛关注,Reinforcement Learning with Verifiabl
2026-01-07
1
0
0
深度学习
【OCR】通过光学压缩实现长上下文的高效OCR(DeepSeek-OCR)
论文信息 论文标题:DeepSeek-OCR: Contexts Optical Compression 论文地址:https://arxiv.org/html/2510.18234 作者:Haoran Wei, Yaofeng Sun, Yukun Li (DeepSeek-AI) 发表时间:2
2025-10-22
5
0
0
论文