首页
人工智能
图像处理
大语言模型
MCP
深度学习
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
Euler的博客
累计撰写
142
篇文章
累计创建
19
个标签
累计收到
0
条评论
栏目
首页
人工智能
图像处理
大语言模型
MCP
深度学习
论文
软件架构
计算机科学
操作系统
软件工程
后端技术
开发工具
数据库与搜索
ElasticSearch
运维部署
路由系统
认知思维
目 录
CONTENT
以下是
llm
相关的文章
2025-07-16
【LLM】OpenRouter调用Anthropic Claude上下文缓存处理
背景 在使用OpenRouter调用Anthropic Claude大模型时,部分模型支持上下文缓存功能。当缓存命中时,调用成本会显著降低。虽然像DeepSeek这类模型自带上下文缓存机制,但本文主要针对构建Agent场景下,需要多次调用Anthropic Claude时的缓存设置策略。 缓存机制的
2025-07-16
3
0
0
MCP
2025-07-16
【LLM】OpenRouter 指定模型供应商指南
在使用 OpenRouter 作为模型供应商时,我们会发现不同供应商提供的同一模型在响应速度、价格和可用性方面存在差异。本文将介绍如何通过指定特定供应商来优化模型使用体验。 供应商差异分析 以 deepseek/deepseek-r1-0528 模型为例,不同供应商在以下方面存在明显差异: 响应速度
2025-07-16
3
0
0
大语言模型
2025-07-02
【LLM】如何使用DeepSeek推理模型(deepseek-reasoner)
一、模型简介 DeepSeek推理模型(deepseek-reasoner)是DeepSeek推出的一款具备深度推理能力的AI模型。其核心优势在于通过**Chain of Thought(CoT,思维链)**机制,在生成最终答案前先进行逻辑推理过程的详细推导,从而显著提升回答的准确性和可解释性。该模
2025-07-02
1
0
0
大语言模型
2025-07-01
【LLM】本地部署Gemma模型(图文)
工具简介 我们需要使用到两个工具,一个是****Ollama,另一个是open-webui。 Ollama Ollama 是一个开源的大语言平台,基于 Transformers 和 PyTorch 架构,基于问答交互方式,提供大语言模型常用的功能,如代码生成、文本生成、数据分析等。 Ollama 的
2025-07-01
1
0
0
大语言模型
2025-05-19
【ASR】构建简洁的音频转写系统:基于火山引擎ASR实现
在当今数字化时代,语音识别技术已经成为许多应用不可或缺的一部分。无论是会议记录、语音助手还是内容字幕,将语音转化为文本的能力对提升用户体验和工作效率至关重要。本文将介绍如何构建一个简洁的音频转写系统,专注于文件上传、云存储以及ASR(自动语音识别)的集成,特别是基于火山引擎ASR服务的实现。 系统架
2025-05-19
3
0
0
人工智能
后端技术
2025-05-15
【MCP】FastAPI-MCP:为AI模型赋能的零配置API工具
引言 在当前AI快速发展的时代,如何让AI模型更便捷地与后端服务交互成为了开发者面临的重要挑战。Model Context Protocol (MCP)作为一个新兴协议,为AI模型提供了调用外部工具的能力,而FastAPI-MCP则是一个革命性的工具,它能够自动将现有的FastAPI应用转换为MCP
2025-05-15
14
0
0
MCP
后端技术