#大语言模型

0 篇文章

【万字长文】Agent Harness 全解剖：从执行循环到生产落地

2024 年，Princeton 团队做了一个实验。他们把 GPT-4 扔进一个标准的代码修复基准 SWE-bench，让它解决真实的 GitHub Issue。

#大语言模型 #Agent Harness #基础设施

一技术猿· 3 天前

1000

文章

ReaGeo：从地理编码到空间相关性——大模型如何理解地图地址及地图搜索

本文介绍团队发表在ACL 2026的论文ReaGeo，首个基于大语言模型的端到端地理编码框架——直接让LLM从文本...

#大语言模型 #ReaGeo #地理编码

高德技术· 6 天前

1200

文章

第三章三种缓存，决定 Agent 系统的性能上限

我们在把 Agent 做到企业级生产环境之后，很快会遇到一个更基础、也更现实的问题：为什么同样是一个 Agen

#缓存 #大语言模型 #Agent 系统

明春技谈· 8 天前

400

文章

AI 导购在 vivo 官网的落地实践

通过定义解决问题的边界能力、搭建多层架构方案、方案落地逐步递进地展开AI导购在为用户服务的应用过程。

#vivo #大语言模型 #AI导购

vivo互联网技术· 大约 1 个月前

1700

文章

从0到1搭建 Agent ：Agent 原理分析及个人助手实践（长文干货）

本文系统阐述了Agent的关键技术原理以及实践案例。

#大语言模型 #Agent #个人助手

阿里技术· 大约 1 个月前

11200

文章

从「黑盒向量」到「用户'话'像」：解开用户画像之谜

晨光里的AI——AI产品经理的成长之路

#用户画像 #推荐算法 #大语言模型

晨光里的AI· 大约 1 个月前

1200

文章

基于大模型技术的多语言电商搜索

本文首先将以多语言语义相关性、多语言Query改写两个典型任务，介绍如何利用大模型重构这些任务，最后再介绍如何在开源LLM基础上进行多语言电商领域增强，以及在下游任务上的提升。

#阿里巴巴 #大语言模型 #多语言搜索

阿里国际智能技术· 大约 1 个月前

1700

文章

看懂这篇，你就能秒懂 LLM底层秘密—Transformer原理解析

由浅入深介绍LLM的基础知识，从大模型的使用，到原理解析，再到LLM系统实战。

#Transformer #大语言模型 #原理解析

腾讯技术工程· 大约 1 个月前

1400

文章

拥抱大模型：深入剖析ReAct的核心原理、技术架构及其对AI领域的深远影响

ReAct范式

#React #大语言模型 #智能体架构

腾讯技术工程· 大约 1 个月前

1300

文章

详尽地带你从零开始设计实现一个AI Agent框架

理论结合实践

#大语言模型 #AI Agent #ReAct 模式

腾讯技术工程· 大约 1 个月前

1500

文章

从0开发大模型的17种Agent架构演进详细拆解

足够详尽

#大语言模型 #Agent架构 #控制流设计

腾讯技术工程· 大约 1 个月前

1300

文章

技术干货｜用户研究Agent：行为分析与大模型结合的探索与实践

在数字化运营中，用户行为分析是洞察业务痛点、驱动增长的核心手段。火山引擎用户研究Agent是新一代用户精准洞察与决策助手。

#火山引擎 #大语言模型 #用户研究Agent

字节跳动数据平台· 大约 1 个月前

1000

文章

淘宝搜索算法：推理范式下生成式检索应用 | AIGI专题

本项目是个性化生成式检索在淘宝主搜索场景的首次落地，完成了大体的框架设计，迈出了从零到一的关键一步。我们成功证明了生成式召回范式的潜力，并给当前召回系统带来了可观的增量。

#淘宝 #大语言模型 #生成式检索

淘天集团智能算法产品· 大约 1 个月前

2100

文章

高性能 LLM 推理框架的设计与实现

张志商汤科技研发工程师

#性能优化 #大语言模型 #推理框架

AIAI发布小助手· 超过 2 年前

1.1k00

文章

怎么阻止大模型说瞎话？

声明：欢迎转载，转载请注明出处以及链接，码字不易，欢迎小伙伴们点赞和分享。一、前言目前制约大模型落地应用除了速度慢之外，最重要的还是因为大模型还存在比较大幻觉问题。有人曾经问过我，大模型幻觉是偶然…

#大语言模型 #幻觉问题 #事实性

AIAI发布小助手· 超过 2 年前

1.4k00

文章