首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
Euler的博客
累计撰写
211
篇文章
累计创建
82
个标签
累计收到
0
条评论
栏目
首页
AI前沿
图像处理
大语言模型
MCP
深度学习
模型微调
理论
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
友链
目 录
CONTENT
以下是
理论
相关的文章
【论文】训练万亿参数模型的内存优化(ZeRO)
论文地址 标题:ZeRO: Memory Optimizations Toward Training Trillion Parameter Models 链接:https://ar5iv.labs.arxiv.org/html/1910.02054 作者:Samyam Rajbhandari, Je
2025-11-03
4
0
0
论文
【理论】深入理解Transformer中的正弦位置编码
引言 位置编码(Positional Encoding)是Transformer架构中一个精妙而关键的组件。不同于卷积神经网络天然具备的空间感知能力,Transformer的自注意力机制本身是位置无关的——如果不加入位置信息,模型无法区分"我爱你"和"你爱我"。本文将深入探讨Transformer为
2025-09-30
7
0
0
理论
【理论】注意力机制与多头注意力机制理解
1. 基础注意力机制 1.1 核心概念 注意力机制模拟人类阅读时的"聚焦"行为,让模型在处理每个位置时,能够关注到输入序列中最重要的部分。 1.2 数学原理 \text{Attention}(Q,K,V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\r
2025-09-29
12
0
0
深度学习
【架构】结构化并发:现代编程中的并发范式革命
在现代软件开发中,并发编程已经从"可选的优化技术"演变为"必须掌握的核心技能"。随着多核处理器的普及和云计算的兴起,开发者需要处理越来越复杂的并发场景。然而,传统的并发编程方式往往容易产生资源泄漏、死锁和难以调试的问题。结构化并发(Structured Concurrency)作为一种新兴的编程范式
2025-07-04
187
0
11
软件架构
【邮件协议】ISC协议详解
概述 有时收到一些会议邀请邮件时会收到一个以 .ics 为后缀的附件,这个文件执行后能够在本地的日历中添加一个事件提醒。这篇文章介绍了 ics 文件的概念,介绍了 ics 文件内容以及编写 ics 文件。 ICS文件是什么 ICS (Internet Calendaring and Scheduli
2025-07-01
359
0
4
后端技术
【机器学习】深度学习是怎么工作的
深度学习是什么 要解解释深度学习是什么,我们不妨先看看深度学习解决的都是什么样的问题。 深度学习解决什么问题 按照信号角度划分 领域 应用 文本领域(NLP) 填词 问答 生成诗歌 词法、语法分析,错误修正 文本分类、文本摘要 情感分析、代码生成、代码解析 图像领域 OCR 图片分类 目标检测 目标
2025-07-01
134
0
17
深度学习
【微服务】微服务中的熔断、降级与限流
概念 降级 先说说什么是降级,熔断和限流都要配合降级,降级通俗来讲就是Plan B,即当Plan A执行失败的时候,需要如何处理.可以直接返回失败,也可以转而调用另一个服务. 熔断 系统调用某个服务失败或者某种状态达到阈值的时候,自发的一种保护行为,通过限制调用端调用来实现.例如某个服务需要调用算法
2025-07-01
449
0
5
微服务
【架构】Armstrong公理系统通俗详解:数据库设计的基本法则
关系数据库就像一本精心设计的通讯录,而Armstrong公理系统则是帮我们整理这本通讯录的基本规则。本文将用简单易懂的语言和生活实例,带你理解这套看似复杂的理论。 1. 什么是函数依赖? 想象你有一个学生信息表,包含学号、姓名、手机号、班级和年龄等信息。 1.1 函数依赖的通俗解释 函数依赖就是"这
2025-05-15
206
0
16
数据库与搜索
软件架构