智驱未来 云网随行阿里云基础设施AI技术沙龙云网络专场在杭州举办

发布于:2025-07-10 ⋅ 阅读:(27) ⋅ 点赞:(0)

智驱未来 云网随行阿里云基础设施AI技术沙龙云网络专场在杭州

活动简介

聚焦AI场景下的算力资源网络建设,「智驱未来,云网随行」阿里云基础设施AI Tech Day首场 ·云网络专场于6月20日下午在杭州太极禅院顺利举办,现场吸引了来自吉利、极氪、万帮、正元智慧、分叉智能、小影科技、哈啰、国家(杭州)新型互联网交换中心、飞致云等25家AI领域相关企业或有AI建设诉求企业的35名技术/研发负责人、架构师及IT运维工程师参与,同时也吸引了浙江大学、浙江外国语学院、杭州师范大学等从事AI领域研究的师生参与现场学习讨论。 本次技术沙龙旨在聚焦企业在AI模型及应用运营或者使用过程中的实际需求,探讨如何通过优化模型调度、算力资源池化、数据深度挖掘等场景下的AI基础设施 & 网络架构,帮助企业打造智能、弹性、稳定的下一代AI Infra。
在这里插入图片描述
**阿里云 公共云事业部 江浙皖大区副总经理 张思远(紫鉴)**致开场辞,随着AI能力的加持,企业的IT基础设施建设已经不仅仅是一个流程和工具的重构,而是深刻地纳入企业的业务流程,成为很多企业的战略决策参与者。在AI的加持下,我们今天的云基础设施也在重新被定义,也希望云基础设施能够成为AI爆发的创新土壤。在AI时代,无论是企业还是个人的竞争更多是认知速度的竞争。认知速度都要向网络速度靠拢,零等待的高性能智能网络可能是AI时代业务爆发的一个底座和前提。希望阿里云无论是网络、计算、通义、PAI等基础能力能够助力大家共同创造和见证AI未来。

Part 1:AI 数据采集和模型调用

在这一章节,围绕着企业AI模型训练和推理过程中的数据采集、模型调度和弹性资源池建设等问题,就阿里云解决方案以及最佳实践展开分享。
在这里插入图片描述

在这一章节,阿里云 通义实验室 高级产品解决方案架构师郑海超(海焘) 介绍了阿里云通义模型的建设和实践经验。随着多年的发展,通义已经成为全球最大的开源模型家族,并在多个行业场景支持业务创新,加速创维电视/雷鸟AI眼镜等消费电子产品创新,以及陶白白/猎聘AI面试官等社交娱乐体验;而通义系列模型的强大能力,离不开阿里云AI Infra层的支撑,包括 PAI、弹性算力、全球一张算力网络等,支撑通义从数据采集到数据加工,模型训练和调优以及提供推理服务的全场景需求。
**阿里云 云网络 产品解决方案架构师 姜辉(靖韦)**就AI场景数据采集网络方案和实践进行了分享,包括AI数据采集场景的常见痛点,模型训练场景常用的数据采集方式及业务特点,阿里云在数据采集场景的方案等,其中方案层面重点介绍了阿里云的海量IP数据采集方案、NAT网关数据采集方案和定向数据采集方案等,基本覆盖了客户常见的数据采集场景。
**阿里云 弹性计算 产品解决方案架构师 储依帆(徽岳)**分享AI Infra 关键基础算力与容器编排调度方案。阿里云具备AIInfra整体全栈能力,不仅提供了通用与加速计算高性能算力,并在IaaS基础上基于深厚的技术积累演进推出了AI训推任务的加速组件DeepGPU,实现了算力效率的大幅提升;同时,面向全链路工程化,阿里云ACK容器服务可以帮助客户更高效地串联起AI模型与AI应用,具备了数据采集与处理、算力调度与监控、角色拓扑编排、数据加速等方面的全栈能力。

Part 2:AI 算力资源池化

无论是AI模型的训推或者AI应用的搭建和服务提供,均离不开强大的算力支撑,那如何整合异构算力资源,以更高效的提升企业AI效能,阿里云PAI和云网络就此展开解决方案和最佳实践的分享。
在这里插入图片描述
**阿里云 计算平台 高级产品解决方案架构师曹志(骁志)**就PAI全球化模型推理服务的创新与实践展开分享。围绕资源的高利用率、服务的高性能、业务的高可用,AGI的推理服务有诸多挑战,BladeLLM核心引擎,提升AGI服务的性能与效率,提供全面多样的量化功能支持、高效的请求调度策略以及支持采用Prompt Cache和高效解码方法,实现两阶段加速;同时,在AI平台共享网关的基础上,EAS提供专属网关实现跨地域的服务调度,满足客户在安全隔离与访问控制方面的需求,降低客户高并发和高吞吐业务场景带来的网络风险。

阿里云云网络 高级产品解决方案架构师 任江波(硕丰)紧接着就AI场景算力池化网络方案与实践进行分享,模型的训练、 AI应用的迭代均离不开强大的算力支撑,如何整合异构算力,让算力池化,按需调度,让业务专注于自身。基于阿里云弹性公网 EIP、云企业网CEN、私网连接PrivateLink和云原生ALB等核心产品构建一张覆盖全球的异构AI算力网络,真正实现算网融合,算力资源池化,弹性调度,按需使用。支撑AI场景下高效数据采集、超大带宽训练数据运载、超低时延推理数据传输、超高安全工具调用和极致高效的算力调度能力。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在最后的客户互动讨论环节,来自阿里云网络、通义、PAI、ECS等团队的PDSA、PD和研发同学,与到场客户一起围绕企业AI(模型/应用等)建设及使用场景的典型问题展开深度探讨和交流,包括
IaaS层核心力与网络需求、外部数据获取与模型优化、AI应用与智能体服务部署、基础架构重构与资源融合
等相关的架构合理性、合规性、成本、质量等。