企业级AI搜索解决方案:阿里云AI搜索开放平台

发布于:2025-05-23 ⋅ 阅读:(19) ⋅ 点赞:(0)

随着信息技术的飞速发展,搜索引擎作为信息获取的重要工具,扮演着不可或缺的角色。阿里云 AI 搜索开放平台以其强大的技术支持和灵活的开放性,持续为用户提供高效的搜索解决方案。

一、阿里云 AI 搜索开放平台

一站式的 AI 搜索开放平台作为阿里云 AI 搜索整个产品体系核心,提供丰富的 AI 搜索组件化服务。兼容主流开发框架 LangChain和 LlamaIndex,支持搜索专属大模型、百炼等大模型服务,以及 Elasticsearch、Havenask 等开源引擎。用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务,实现智能搜索、检索增强生成(RAG)、多模态搜索等场景的搭建。

核心优势:

  • 多模态搜索 支持文本、图像、文档联合检索,覆盖 PDF、DOC、图片等格式,可提取结构化内容(如标题、表格、代码),并结合多模态大模型理解图片语义。
  • 大模型深度集成 提供 Qwen3、QwQ、DeepSeek、GTE 多语言文本向量化模型等大语言模型,支持语义分析、NL2SQL 转换、对话生成,降低模型幻觉率,提升问答准确性。
  • 全链路组件化服务 内置文档解析、切片、向量化、查询分析、排序、效果评估等20+原子化服务能力,可灵活组合搭建智能搜索、RAG或推荐系统。
  • 多场景支持 覆盖电商搜索、智能客服、知识库问答、多模态内容检索等场景,提供行业适配模板(如电商排序策略、医疗文档分析)。

应用场景:

  • 智能客服

基于 RAG(检索增强生成)技术,结合 Qwen3、QwQ 等大模型,构建企业专属智能客服系统,通

过私有知识库与联网搜索能力,提供精准、安全的问答服务。

  • 对话式搜索

提供基于 LLM 的对话式搜索服务,支持自然语言交互与多模态结果展示,适用于搜索引擎、问答机器

人等场景。

  • 知识图谱增强

通过文档解析、向量化与 RAG 技术,构建并优化企业知识图谱,实现语义化查询与关联分析。

  • 个性化推荐

结合用户行为数据、向量化推荐与排序服务,实现电商、内容平台等场景的精准推荐。

二、产品能力介绍

无论是文档解析、图片理解还是 OCR 识别,AI 搜索开放平台都能高效处理多类型数据,凭借行业分析、意图识别与排序算法,显著提升特定业务场景下的搜索效率与准确性。此外,基于大模型的自动测评功能,涵盖无幻觉率、准确率和相关性等指标,帮助开发者不断优化搜索体验。

1. 文档解析服务

支持文档、图片分钟级解析,针对 PDF、DOC、HTML、TXT 等文档,能够区分多种版式,从非结构化文档中

提取出标题、分段等逻辑层级结构,以及文本、表格、图片、代码等信息,去除页眉、页脚、识别上标、下标

等信息,以结构化的格式输出。

2. 图片解析服务

针对架构图、分析图表等图片数据,提供图片内容理解服务,可基于多模态大模型对图片内容进行解析理解以及文字识别,也可基于 OCR 能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。

3. 文档切片服务

提供通用文档切片服务,可基于文档语义、段落结构以及指定规则进行切分,以便提升后续文档处理及检索效率,输出的切片树可在检索召回时进行上下文补全。

4. 多语言向量模型

  • 文本向量化提供将文本数据转化为稠密向量形式表达的服务,支持多款不同语言、输入长度、输出维度的文本向量模型,可用于信息检索、文本分类、相似性比较等场景。
  • 文本稀疏向量化提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间更小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升最终检索效果。
  • 向量微调服务提供向量模型调优服务,可通过定制训练向量降维模型,在不带来过多检索效果损失的情况下,辅助将高维度向量降低维度,以便提升性价比。

5. 查询分析服务

提供 Query 内容分析服务,基于大语言模型及 NLP 能力,可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL 处理等,有效提升 RAG 场景中检索问答效果。

6. 搜索引擎

提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与 AI 搜索开放平台丰富的API服务组合使用。

7. 排序服务

提供 Query 及 DOC 的相关性排序服务,在 RAG 及搜索场景中,可通过排序服务找到相关性更高的内容并依次返回,引入排序服务可有效提升检索及大模型生成的准确率。

8. 大模型内容生成服务

提供多种大语言模型服务,包含 DeepSeek 全系模型(含R1/V3及7B/14B蒸馏版本)、通义系列通义千问-Turbo通义千问-Plus通义千问-Max大模型。同时内置 OpenSearch- 通义千问 -Turbo 大模型,该模型以 qwen-turbo 大规模语言模型为模型底座,进行有监督的模型微调强化 RAG 检索增强的能力,降低模型幻觉率。

三、新功能介绍

1. 大模型联网能力

通过集成大语言模型(LLM)和联网搜索技术,为用户提供更智能、更全面的搜索体验。了解更多

2. GTE 多语言文本向量化模型

GTE 多语言通用文本向量模型(iic/gte_sentence-embedding_multilingual-base),来源于 ModelScope 模型库,并开放自部署能力,助力企业构建更高并发、更低延迟的多语言搜索与分析系统。了解更多

3. 服务开发能力

服务开发能力,旨在通过集成 dsw 能力并新增 notebook 功能,进一步提升用户编排效率了解更多

4. Qwen3 模型

通义最新大模型 Qwen3 是 Qwen 系列中最新一代的大型语言模型,提供了一整套密集和混合专家模型(MoE)。基于广泛的训练,Qwen3 在推理、指令跟随、Agent 能力和多语言支持方面取得了突破性进展。了解更多

5. QWQ 模型

基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。了解更多

四、计费

阿里云 AI 搜索开放平台均采用按量付费模式,按照服务调用量与模型定制训练实际消耗的计算时(CU)计费。

部分示例:

模型名称

模型ID

计费单位

0-500个单位定价

超出500个单位定价

文档内容解析

ops-document-analyze-001

元/千tokens

0.005

0.002

元/张图片

0.006

元/个表格

0.012

图片文本识别

ops-image-analyze-ocr-001

元/次

0.08

0.02

文档切片

ops-document-split-001

元/千tokens

0.005

0.00002

文本稀疏向量

ops-text-sparse-embedding-001

元/千tokens

0.006

0.0006

排序服务

ops-bge-reranker-larger

元/个docs

0.001

0.00003

ops-text-reranker-001

元/个docs

0.001

0.00015

五、结尾

阿里云 AI 搜索旨在帮助用户简化搜索应用的构建过程,提供丰富的开箱即用服务,涵盖多模态数据处理、精准搜索算法、效果测评与场景开发,全面满足各种搜索需求。

了解更多阿里云 AI 搜索开放平台


网站公告

今日签到

点亮在社区的每一天
去签到