Cyber Weekly #58-EW帮帮网

赛博·新闻

1、DeepSeek新版R1更新，幻觉率大幅降低

5月28日，DeepSeek-R1模型已升级至DeepSeek-R1-0528版本，核心在于显著提升模型的思维深度与推理能力。该版本基于DeepSeek V3 Base模型，通过强化后训练显著优化了在数学、编程及通用逻辑任务中的表现，在多项基准测试中达到国内顶尖水平并接近国际领先模型（如o3与Gemini-2.5-Pro）。具体提升包括：复杂推理能力大幅增强，如在AIME2025测试中准确率从旧版70%提升至87.5%，模型解题时平均token使用量增加表明思考更深入；幻觉问题明显改善，在改写、总结等场景中幻觉率降低45~50%；创意写作能力优化，可生成更长且结构更完整的文本；新增支持工具调用（Function Calling）和JSON格式输出。API同步更新，调用方式不变但调整了max_tokens参数定义（限制单次输出总长度，默认为32K，最大64K）。模型开源版本（128K上下文）权重已在ModelScope和HuggingFace发布，沿用MIT许可，其蒸馏出的DeepSeek-R1-0528-Qwen3-8B模型在数学测试中表现优异。用户可通过官网、APP、小程序开启“深度思考”或调用API体验新版本。

ModelScope：https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528

Huggingface：https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

2、小米多模态大模型XiaomiMiMo-VL开源

5月31日，小米正式发布新一代多模态大模型MiMo-VL-7B。MiMo-VL-7B在图像、视频与语言等多模态理解任务中表现出色，以7B的参数规模在OlympiadBench以及MathVision、MathVerse等多个数学类推理基准上，超越Qwen2.5-VL-72B和QVQ-72B-Preview等体量高出十倍的模型，也超越闭源模型GPT-4o。在长达十余步的GUI操作任务中，模型也展现出较强的执行逻辑与场景理解能力，甚至能够完成如「将小米SU7添加至心愿单」这类具有明确目标的多轮任务，具备高度Agent化潜力。MiMo-VL-7B的多模态能力来源于两大技术支撑：一是采用了高质量的图文、视频和操作序列构成的2.4T规模预训练数据，二是引入创新的MORL（混合在线强化学习）训练策略，将文本、多模态感知推理能力与RLHF信号融合，实现更稳定的策略学习与推理表现。目前，小米已将MiMo-VL-7B的完整模型、技术报告和评估工具全面开源，相关资源已发布至HuggingFace和GitHub平台，支持50+多模态任务评估。与此同时，小米还同步发布了语言模型MiMo-7B的最新强化版本MiMo-7B-RL-0530。在数学代码类任务中，其表现已接近目前最强开源推理模型DeepSeekR1和OpenAI的闭源模型o1、o3-mini。

HuggingFace：https://huggingface.co/XiaomiMiMo

技术报告：https://github.com/XiaomiMiMo/MiMo-VL/blob/main/MiMo-VL-Technical-Report.pdf

3、腾讯混元语音数字人模型宣布开源

5月28日，腾讯混元发布并开源语音数字人模型HunyuanVideo-Avatar。据介绍，HunyuanVideo-Avatar基于腾讯混元视频大模型（HunyuanVideo）及腾讯音乐天琴实验室MuseV技术联合研发，支持头肩、半身与全身景别，以及多风格、多物种与双人场景，面向视频创作者提供高一致性、高动态性的视频生成能力。用户可上传人物图像与音频，HunyuanVideo-Avatar模型会自动理解图片与音频，比如人物所在环境、音频所蕴含的情感等，让图中人物自然地说话或唱歌，生成包含自然表情、唇形同步及全身动作的视频。现在，HunyuanVideo-Avatar的单主体能力已经开源，并在腾讯混元官网上线，用户可以在PC端「模型广场」中体验。目前支持上传不超过14秒的音频进行视频生成。后续将逐步上线和开源其他能力。

体验入口：https://hunyuan.tencent.com/modelSquare/home/play?modelId=126

项目主页：https://hunyuanvideo-avatar.github.io

Github：https://github.com/Tencent-Hunyuan/HunyuanVideo-Avatar

CNB：https://cnb.cool/tencent/hunyuan/HunyuanVideo-Avatar

技术报告：https://arxiv.org/pdf/2505.20156

，赞110

4、蚂蚁百灵发布新款多模态大模型

5月28日，蚂蚁百灵大模型（Ling）团队今天正式开源统一多模态大模型Ming-lite-omni。据介绍，Ming-lite-omni是一款基于Ling-lite构建的MoE架构的全模态模型，其总参数22B，激活参数3B。其支持「跨模态融合与统一」「理解与生成统一」。在多项理解和生成能力评测中，Ming-lite-omni以仅3B的参数激活量，性能与10B量级领先的多模态大模型相当或更优。官方表示，这也是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。另外，蚂蚁百灵大模型团队还将持续优化Ming-lite-omni在全模态理解和生成任务上的效果，并提升Ming-lite-omni的多模复杂推理能力；同时也会训练更大尺寸的全模态模型Ming-plus-omni，以期进一步解决更多高度专业化或领域化的复杂交互问题。Ming-lite-omni当前模型权重和推理代码已开源。

Github：https://github.com/inclusionAI/Ming/tree/main/Ming-omni

HuggingFace：https://huggingface.co/inclusionAI/Ming-Lite-Omni

ModelScope：https://modelscope.cn/models/inclusionAI/Ming-Lite-Omni

ProjectPage：https://lucaria-academy.github.io/Ming-Omni/

赛博·洞见

1、Claude4核心成员：2027年，AI将自动化几乎所有白领工作

Claude核心研究员SholtoDouglas指出，当前AI（以ClaudeOpus4为代表）在编程领域已实现重大突破：模型具备工具调用与长期记忆能力，能独立完成多步骤复杂任务（如查找资料、调试代码、运行测试），任务时间跨度显著延长，正从“代码助手”升级为“解决方案设计者”。强化学习（RL）将持续推动智能代理进化，预计2025年底编程代理可实现“数小时稳定自主运行”，人类仅需偶尔干预。编程能力是AI发展的“领先指标”，医学、法律等专业领域突破取决于现实验证机制与基础设施（如自动化实验室）的完善。到2027-2030年，AI几乎能自动化所有白领工作，但物理世界任务（如生物实验、制造）受限于硬件配套。模型公司（实验室）的核心优势在于算力转化能力与模型可靠性，应用公司则聚焦垂直场景落地；二者将竞合并存，而客户关系、任务编排与整合体验是未来关键。AI对齐问题日益重要，需通过可解释性研究确保模型安全可控，并呼吁政府与学界共同推进对齐科学。当前瓶颈并非AI智力上限，而在于现实反馈机制与能源供给。

2、中国AI实力崛起，DeepSeek跃升全球第二

知名分析机构Artificial Analysis日前发布了《2025年第二季度中国AI现状报告》，指出中国AI实验室正迅速缩小与美国在前沿模型技术方面的差距，部分领域甚至已实现反超。其中，DeepSeek的最新模型R1-0528表现突出，排行榜上跃升至第二，仅次于OpenAI，与Google、Anthropic、Meta等旗舰模型并肩。报告显示，中国的AI生态系统正展现出高度的活力与多样性。包括DeepSeek、阿里巴巴、字节跳动、腾讯、月之暗面、智谱、阶跃、小米、百川、MiniMax和零一万物在内的十余家中国实验室，已推出多款在多项基准测试中表现优异的模型，展示出持续的创新能力。值得关注的是，中国多家实验室正在积极采用「开放权重」（OpenWeights）策略，在2024年11月，阿里发布QwQ-32B预览版，被认为是中国首次在开放权重大型模型上实现对美国的超越，随后DeepSeek的R1系列进一步巩固了这一领先地位。

3、最新必读！互联网女皇340页AI报告解读：AI岗位暴涨，这些职业面临最大危机

互联网女皇MaryMeeker的最新AI趋势报告揭示，AI正以前所未有的速度和规模重塑世界。ChatGPT等产品用户裂变速度创纪录，商业化迅猛，推动科技巨头（如苹果、英伟达、微软等）对AI基础设施的资本支出在2024年飙升至2120亿美元（同比增63%），英伟达成为最大赢家。然而，顶级AI模型的训练成本在8年内暴涨2400倍，单个模型成本正迈向10亿甚至100亿美元，呈现“越卷越贵”态势；与此同时，开源模型（如DeepSeek、Llama3、Qwen）在推理和编程能力上正快速逼近顶级闭源模型。AI不仅在数字世界表现出色（如GPT-4.5在图灵测试中73%被误认为人），更加速向物理世界渗透，自动驾驶（如Waymo、Tesla）、工业机器人（中国部署量领先全球）、AI医疗和农业等应用落地。这引发了就业结构的剧变：AI相关岗位需求暴涨448%，而传统IT岗位萎缩9%，AIAgent正崛起为新型数字劳动力，能执行多步骤任务并重塑各行业业务流程，标志着AI正从工具升级为核心生产力，深刻改变产业格局和人类工作方式。

4、人均超级教师或成可能：DeepSeekR1新模型亲测手记（附提示词）

DeepSeekR1模型（0528版本）的代码能力实现重大飞跃，特别是开启“深度思考”功能后，能帮助一线教师轻松生成高质量、功能完善的交互式教学工具（如语文填空游戏、数学打地鼠游戏、课堂观察表、积分系统等），实现过去需专业开发才能完成的任务。这种“教育+AI”的结合，让不懂编程的普通教师也能通过自然语言指令创建精美实用的课堂应用，大幅提升教学效率和趣味性，使“人均超级教师”成为可能。技术壁垒的降低让教育科技触手可及，但作者强调，在AI赋能的新时代，教师对教育的理解和创意才是核心竞争力——懂教育、有想法的人能更好地驾驭AI，将其转化为实现教育理想的工具，技术只是起点，教育的专业理解和人文追求才是关键，这是一个属于教育理想者的时代。

5、代码/3D/设计/PPT...新版DeepSeekR1深度测评，还有提示语技巧2.0

DeepSeekR1-0528版本在代码生成（尤其复杂3D交互场景如巧克力工厂模拟与火箭发射）、物理引擎模拟（小球碰撞、汽车碰撞）、视觉设计（动态天气卡片、外卖UI、像素画板）及中文写作（万字科幻小说沉浸感强）方面均达到Claude3.7至Opus4水准，显著超越旧版V3；其幻觉控制明显改善，能理性应对误导性问题并补充文学知识，提示语技巧可更简洁（2.0版本强调目标与框架，信任模型推理能力）。

6、送给智者的礼物——天机：思维模型MCPServer

蓝衣剑客提出的“天机”思维模型MCP系统，核心在于通过人机协作的“人马座”模式（人类战略思维与AI执行力的结合）应对AI时代的生产关系变革。系统聚焦解决四大痛点：思考与决策脱节、标准化工具与个性化思维的矛盾、知识孤岛现象及认知偏见限制。其设计遵循成长性（自适应学习与共创进化）、贴合性（基于用户认知特性定制模型）和平衡性（兼顾简单与强大、通用与专业）原则，提供分层工具链：从基础认知入口（如模型推荐）到应用深化（如知识缺口检测），再到高阶思维提升（如交互式推理）及个性化模型定制。该系统通过动态推荐算法、结构化分步推理机制及持续学习系统（记录反馈、检测知识盲区并优化推荐），旨在将人类角色从执行者转化为AI指挥者，激发创造力并实现“涌现智能”，最终在量化策略、教育科技等场景中提升决策质量与创新效能。

7、端午节偷偷整理的AI实战和教程合集，推荐收藏，节后起飞

本文通过精选的AI提示词技巧和工具实战指南，帮助用户高效掌握人工智能技术在各领域的应用，大幅提升工作与创作效率。文章系统整理了垂直行业提示词（如产品PRD生成、教育可视化）、内容创作（标题生成、排版设计、视频剪辑）、模型评测（DeepSeek、Claude、Gemini）及AI工具（编程助手、知识管理、音视频生成）等实战方案，强调提示词工程是解锁AI潜力的关键——例如用一句话生成完整产品文档、30次迭代优化出万能提示词、特定Prompt解决数学教育难题等。同时揭示AI技术迭代带来的效率革命：如MCP协议实现复杂工作流自动化、开源工具替代手动操作、跨领域创作（绘本MV/播客/网站）的平民化。最终指出在信息过载时代，掌握这些方法能让人快速构建第二大脑，将技术转化为实际生产力，保持终身学习竞争力。

赛博·工具

1、fontawesome

比较完善全面的图标网站。

2、uiset

共收集95个免费优质的UI资源，包括插图、图标、颜色、图案、头像、表情、美化等领域的项目。

Cyber Weekly #58