AI Repos
1、Fin-R1
Fin-R1 是一款针对金融领域复杂推理的大型语言模型,由上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合财跃星辰研发并开源发布。该模型以 Qwen2.5-7B-Instruct 为基座,通过高质量的可验证金融问题微调训练,最终表现在多个金融领域基准测试上的表现达到参评模型的SOTA水平。
2、ableton-mcp
AbletonMCP 通过模型上下文协议 (MCP) 将 Ableton Live 连接到 Claude AI,让 Claude 能够直接与 Ableton Live 交互并控制它。这种集成可实现即时辅助的音乐制作、曲目创建和 Live 会话操控。
3、rf-detr
RF-DETR 是第一个在 Microsoft COCO 基准上超过 60 AP 的实时模型,同时在基础规模上具有竞争力。它还在 RF100-VL 上实现了最先进的性能,RF100-VL 是一个对象检测基准,用于衡量模型域对现实世界问题的适应性。RF-DETR 的速度与当前的实时对象模型相当。
4、pdf-craft
利用本地AI模型和LLM将PDF转换为Markdown或EPUB。本地AI模型提取PDF正文,识别文本,并确定阅读顺序,适用于论文和小书本。对于大型书籍,项目结合LLM构建EPUB结构,处理注释和引用,并校正OCR错误。本地处理适用于Markdown转换,而EPUB转换则需配置LLM服务,推荐DeepSeek,以实现更完善的结构化书籍输出。
5、midscene
该项目是一个UI自动化工具,支持自然语言交互,用户通过描述目标和步骤,AI即可控制界面。它支持Chrome插件、Puppeteer/Playwright集成,并新增UI-TARS和Qwen2.5-VL开源模型,优化UI自动化场景。项目提供可视化报告和Playground用于调试,支持任务缓存、JSON格式交互和自然语言断言,并完全开源。
6、WebChat
一个去中心化、无服务器的匿名聊天浏览器插件,在任何网站上,无需注册,一键开启与他人聊天,利用 WebRTC 端到端加密,所有聊天数据保存到本地,安全隐私。非常适合有即时交流的需求场景,如浏览到有趣的新闻或技术时,与同一浏览的人发起聊天讨论。
AI News
1、中国PLA部署“DeepSeek”用于非作战任务
中国PLA已授权在军事医院等非作战领域使用AI工具“DeepSeek”,协助医生制定治疗方案。南华早报称,其开源大模型R1-70B已部署于PLA医院及武警单位,强调数据安全。专家认为,这有助于解决技术挑战,为高风险军事应用铺路。PLA长期推动AI增强战斗力,分析师预测其将用于战场情报与决策。DeepSeek以低成本、高效率著称,已超ChatGPT成为苹果商店热门应用。印度或需关注其潜在军事扩展影响。
2、马斯克Neuralink首试成功,瘫痪者脑控电脑引发热议
30岁的Noland Arbaugh因2016年潜水事故瘫痪,2024年1月成为首位植入Elon Musk旗下Neuralink脑机接口(BCI)芯片的人。他通过思维控制电脑,恢复部分独立性,能玩棋类和视频游戏。此技术检测脑电信号并转化为数字指令,虽非首创,却因Musk备受关注。专家称其为里程碑,但隐私与技术稳定性存隐忧。Noland希望未来控制轮椅或机器人,尽管曾因设备问题短暂失效。Neuralink与Synchron等公司竞争,探索BCI潜力,或将革新残障人士生活。
3、英伟达股价看涨:1万亿美元数据中心支出前景驱动
英伟达在GTC大会上预测2028年数据中心基础设施支出将超1万亿美元,其GPU主导AI建设,2024年已占25%-30%市场份额。新Blackwell Ultra和Vera Rubin芯片提升推理性能,Dynamo软件优化多GPU协同。CEO黄仁勋看好机器人与自动驾驶市场,推出Isaac GROOT N1并携手GM、丰田开发AI系统。当前股价前瞻市盈率26倍、PEG低于0.5,估值吸引,分析认为其创新与市场潜力使其为长期投资佳选。
4、OpenAI与Meta拟与印度Reliance合作,推动AI业务扩展
据The Information报道,OpenAI和Meta Platforms正分别与印度Reliance Industries洽谈AI合作。OpenAI讨论通过Reliance Jio分发ChatGPT,并考虑将其订阅价降至几美元,还计划通过API向企业客户销售模型,或在本地运行以保护数据。Reliance也与双方探讨在其吉吉瓦级数据中心托管Meta和OpenAI模型,该中心位于古吉拉特邦Jamnagar,号称全球最大。Meta拒绝置评,OpenAI和Reliance未回应。此合作若成,将助力AI在印度市场的普及。
5、Sam Altman预言:AI或减少工程师需求,技术未来引热议
OpenAI CEO Sam Altman在采访中表示,AI将提升软件工程师效率,短期内每人产出倍增,但长远可能减少需求。他称当前许多公司超半数代码已由AI编写,未来“代理式编码”将成趋势。Altman建议程序员精通AI工具以保持竞争力。Anthropic CEO和Meta的Zuckerberg持类似观点,而Zoho创始人Sridhar Vembu认为AI擅消“偶然复杂性”,但创新性“本质复杂性”仍需人类。此言论引发科技界对AI取代人力与创新边界的讨论。
6、追觅扫地机器人进化,开启家庭清洁3D时代
追觅公司推出了一款具有划时代意义的扫地机器人。这款机器人不仅配备了仿生多关节机械手,还搭载了具身大模型“大脑”,实现了从2D到3D清洁的跨越。机械手能够夹起小障碍物并进行分类处理,还能自主更换清洁工具,完成家具缝隙等狭窄空间的清洁任务。其具身大模型融合了感知与决策能力,即使不联网也能高效运行。追觅通过技术创新,将扫地机器人升级为集清洁、整理、巡逻等功能于一体的家庭服务机器人,开启了家庭机器人的3.0时代。未来,扫地机器人有望成为智能家居的“移动大脑”,推动家庭智能化发展。
7、AI图片编辑大战:谷歌Gemini与马斯克Grok的较量
AI图片编辑功能成为科技圈的焦点。谷歌的Gemini 2.0凭借其强大的“动动嘴”PS功能引发热潮,用户通过简单的文本描述即可实现证件照换西装、改变发色等专业级效果。紧随其后,马斯克的Grok也连夜上线了图片编辑功能,同样支持通过文字指令修改图片,甚至在手机APP上也能体验。目前,Grok的图片编辑功能仍在灰度测试中,但已展现出不俗的效果。从谷歌到马斯克,AI大模型在图片编辑领域的竞争愈发激烈,传统图片编辑软件如Photoshop可能面临挑战。未来,图片编辑有望从复杂的操作转变为简单的交互,AI赋能的大模型将为用户带来更便捷的体验。
8、中国AI崛起,美国顶尖名校毕业生回流国内
美国顶尖高校如哈佛、斯坦福的中国毕业生纷纷向中国AI初创公司DeepSeek等投递简历,这一现象反映了中国AI行业的崛起对全球人才的吸引力。与此同时,美国众议院却以“国家安全”为由,要求斯坦福、卡内基梅隆等六所大学提交中国学生的详细信息,甚至考虑全面禁止中国公民获得留学签证。这种政策导致许多中国留学生重新考虑未来规划,选择回国发展。中国AI公司如DeepSeek凭借高薪和技术前景吸引了大量人才,而美国的严格审查和签证限制则让不少中国技术人才望而却步。随着中美科技竞争加剧,中国正成为全球AI人才的新高地。
9、AI“下毒”互联网:猎奇视频泛滥威胁用户体验
极客公园报道,AI生成猎奇视频正“污染”互联网,如“蜘蛛长颈鹿人”在Instagram获3.62亿观看。这些视频利用AI快速生成诡异内容,钻算法漏洞获取流量,造成用户精神不适。制作者通过批量生产追求暴利,如YouTuber Daniel Bitton用AI复制爆款赚百万美元。Meta甚至鼓励AI内容提升留存率,导致劣质内容挤占人类创作空间。文章呼吁更严格规范,保护用户免受“AI深渊”侵害。
10、AI创作梗图更搞笑,模因图灵测试被攻破
一项最新研究发现,大型语言模型(LLM)在创作梗图时展现出惊人的幽默感与创造力,甚至超越了人类创作者。研究中,纯AI创作的梗图在幽默性、创意性和分享性三个维度上的评分均高于人类组和人机协作组,表明AI已通过模因图灵测试。不过,人类创作者在最有趣的梗图中仍占据优势,展现了独特的创造力。研究还发现,人机协作能显著提高创意数量,但对质量提升有限。AI在梗图创作中可提供大量创意,但缺乏个性与深度,而人类创作者能融入独特经历和文化内涵,使作品更具感染力。
11、新型RL算法SWEET-RL让智能体学会协作推理
Meta FAIR和加州大学伯克利分校的研究团队开发了一种新型强化学习算法SWEET-RL,能够通过多轮训练让智能体学会协作推理。该研究构建了新的基准ColBench,包含后端编程协作和前端设计协作两个任务,用于评估智能体在多轮交互中的推理和泛化能力。SWEET-RL采用两阶段训练方法:第一阶段学习各轮次的优势函数,利用轨迹偏好对进行微调;第二阶段通过每轮次的优势优化智能体策略,引入训练时间信息以提升性能。实验表明,多轮协作显著提升了LLM智能体的成功率,SWEET-RL在ColBench上的表现优于其他多轮RL算法,与GPT-4o等SOTA模型相当。该研究为强化学习在复杂任务中的应用提供了新的思路。
12、蚂蚁、华为、阿里云联手推动AI医疗落地“大模型一体机”全栈解决方案
蚂蚁集团、华为、阿里云等近百家企业联合发布了“大模型一体机”全栈解决方案,助力医疗机构快速、安全、稳定地实现大模型落地。该方案通过私有化部署,将国产算力、医疗大模型和AI训推一体化,同时提供定制化应用配置,帮助医院业务系统、医疗诊断和患者服务实现升级。浙江省人民医院、北京市中医院等7家机构已首批接入。此外,蚂蚁与浙江卫健委合作的AI健康应用“安诊儿”已覆盖超1000家公立医院。蚂蚁还完成了“三端一体”战略布局,面向医疗机构、医生和患者提供全方位AI医疗解决方案。此次合作标志着AI医疗落地加速,为行业提供了新的探索方向。
13、中国福彩警示:AI预测彩票号码100%为骗局
中国福彩发文揭露“AI预测彩票号码百分百中奖”的骗局,指出不法分子以此诱导购彩者付费,实为诈骗。福彩强调,彩票如双色球有1772万+种组合,每次开奖为独立随机事件,无规律可循。AI虽擅分析历史数据,但因彩票结果无关联性,无法预测未来开奖。福彩提醒购彩者保持理性,勿信虚假“科学”承诺,避免上当受骗。
14、Browser Use获1700万美元种子轮融资,助力AI代理更高效浏览网页
Browser Use是一家致力于提升AI代理网页浏览效率的初创公司,其技术将网页元素转化为AI可理解的文本格式,解决了传统视觉系统易出错的问题。该公司在Y Combinator冬季批次中崭露头角,并因其技术在Butterfly Effect的Manus工具中的应用而受到广泛关注。Browser Use已获得1700万美元种子轮融资,由Felicis领投,旨在成为AI代理与动态网页交互的“基础层”。创始人强调,其技术能帮助AI代理更稳定、低成本地执行重复性任务,并已吸引众多公司寻求合作,以优化其网站对AI代理的兼容性。
15、数百位名人联名反对OpenAI和谷歌“自由利用”好莱坞版权材料
超过400位娱乐界人士签署联名信,反对OpenAI和谷歌提出的AI模型训练使用受版权保护内容的提议。信中指责这两家公司试图获得政府豁免,以“自由利用”创意产业的作品。联名信由本·斯蒂勒、马克·鲁法洛、奥布瑞·普拉扎等多位明星签署,回应了特朗普政府对AI行动计划的反馈征集。信中反驳了谷歌和OpenAI关于需要使用版权材料进行训练的论点,强调现有法律足以保护版权,并呼吁AI公司通过与版权所有者协商许可,而非寻求豁免。谷歌回应称支持现有的合理使用框架,认为当前版权法已允许AI创新。
16、多数AI研究者认为科技行业在“死胡同”上投入数十亿美元
一项由人工智能促进协会进行的调查显示,76%的AI研究者认为通过“扩大规模”现有AI方法实现通用人工智能(AGI)的可能性很低。该调查质疑了科技行业长期以来通过增加硬件来提升生成模型性能的做法。报告指出,随着OpenAI的GPT模型显示出改进放缓的迹象,以及中国初创公司DeepSeek以较低成本挑战西方大型聊天机器人,业界开始意识到单纯扩大规模的局限性。然而,尽管有研究者提出“测试时间计算”和“专家混合”等更高效的方法,微软等科技巨头仍计划在数据中心建设上投入巨资,表明“蛮力”扩大规模仍然是行业巨头的主要策略。