site:www.51cto.com - Search News

51CTO

深度解析 PageIndex：无向量 RAG 框架的技术实现与原理剖析

在 AI 时代，如何让大模型更好地理解和检索长文档一直是一个挑战。传统的 RAG（检索增强生成）方案依赖向量数据库，需要将文档切片、向量化、存储，流程复杂且效果受限于切片策略。

51CTO

这是2026年最重要的一个判断：

去年，Claude Code横空出世，AI写代码的能力达到了人类水平。但有一个致命问题：它被关在浏览器里。你只能用它写代码、改代码、调试代码。但它没法真正"做事"。它不能自动部署你的应用到 ...

51CTO

探析可解释人工智能 (XAI) 方法在 GDPR 合规性中的应用

人工智能 (AI) 正迅速渗透到我们生活的方方面面，并在各个领域展现出巨大的潜力。尤其是在信贷、住房和医疗等高风险领域，AI驱动的自动化决策 (ADM) 系统正发挥着越来越重要的作用。

51CTO

鸿蒙开发者社区

大家好，我是玄姐。摘要：从单体智能到蜂群思维。本文深入拆解 Claude Code 最新发布的 "Agent Teams" 架构，手把手教你如何开启这一实验性功能，并利用 tmux 构建并行的多智能体开发环境。

51CTO

一文轻松搞懂 MHA、MQA、GQA 和 MLA

今天咱们来唠唠那些听起来高大上、实则超实用的注意力机制：MHA、MQA、GQA 和 MLA。是不是光看这些缩写就头大了？别怕，我这就带你一文看懂它们的原理和计算公式，让你轻松掌握这些前沿 ...

51CTO

鸿蒙开发者社区

近年来，随着大型语言模型（LLMs）的快速发展，代码智能化取得了前所未有的进步。从代码生成到调试再到测试，这些模型已经成为推动软件开发、数据科学和计算问题解决的重要工具。

51CTO

鸿蒙开发者社区

大家好，我是玄姐。背景与痛点长文写作后的配图工作往往是效率的黑洞：构思画面、编写提示词、生成、筛选、插入，一篇几千字的文章往往需要耗费半小时以上。为了解决这个问题，开发 ...

51CTO

NVIDIA：Blackwell GPU MXFP8 预训练最佳实践

笔者之前写过 FP8 训练的综述文章以及 FP4 训练和推理的综述文章，本文对其进一步补充，介绍 NVIDIA 最新的使用 MXFP8 预训练的方案。精度缩放——即在预训练过程中使用更少的比特来表示模型 ...

51CTO

鸿蒙开发者社区

Model Context Protocol（MCP）作为新一代 AI 服务交互协议，近期发布了 Java SDK 0.8 版本。新版本带来了更强大的会话管理能力和工具集成机制，但在使用原生 SDK 时，开发者仍面临以下挑战：依赖注入 ...

51CTO

鸿蒙开发者社区

Claude Code 是 Anthropic 公司的 AI 编程方面最拿出手的 AI 智能体产品。最近 Claude Code 被一个民间高手做了深度逆向工程，曝光了 Claude Code 的核心多层 AI 智能体技术架构、实现机制和运行逻辑等 ...

51CTO

HunYuan MoE：聊一聊 LLM 参数量、计算量和 MFU 等

最近在看腾讯最新混元大模型的 Paper 时（[2411.02265] Hunyuan-Large: An Open-Source MoE Model with 52 Billion Activated Parameters by Tencent [1]），看到了如下关于计算 Budget 的公式由于我们的工作中也会经常根据 ...

51CTO

鸿蒙开发者社区

“ 怎么解决大模型的记忆问题，以及保证结果的准确性，目前还是大模型应用中一个亟待解决的问题 ” 看过作者文章的人对RAG技术应该有了初步的了解，但不知道是否了解大模型的窗口大小 ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results