【DeepSeek一夜掀翻美股】
1月27日,就在中国即将迎来农历新年时,中国人工智能初创公司DeepSeek“现象级”的崛起,“掀翻”了美国科技股,并引发了市场对美国技术主导地位的质疑。
当天美股盘前,英伟达股价大跌超过12%,市值蒸发预计将超3000亿美元,这比AMD和英特尔的市值总和还要高。目前AMD市值约为2000亿美元,英特尔市值不到900亿美元。
此外,微软、谷歌、Meta和亚马逊股价跌幅在4%至6%,这令美股主要科技公司当天市值或共计蒸发上万亿美元。未来一周,包括Meta、微软、苹果在内的科技公司都将公布财报。
【DeepSeek爆火网友热议广东AI三杰】
梁文锋杨植麟何恺明都是广东学霸#1月27日,人工智能模型#DeepSeek#登上热搜,其创始人梁文锋也逐渐被人熟知。有网友注意到,除了梁文锋来自广东湛江,中国还有两位AI大佬也都是广东人:月之暗面、Kimi创始人杨植麟来自广东汕头,人工智能领域的杰出科学家何恺明来自广东广州。 (剪辑/张美伦) Sina Visitor System
【前DeepSeek天才少女从农村走向Top开发者:相信相信的力量 通过努力改善生活 】
北京时间1月27日中午,DeepSeek成功登上中国和美国苹果应用商店免费应用榜单第一位,引发广泛关注。该模型在AI圈爆火后,DeepSeek-V2的关键开发者之一罗福莉走进大众视野,被称为95后AI“天才少女”。此前,罗福莉在接受采访时表示,家庭条件并不好,但是家庭给了她勇气,让她相信相信的力量,一直通过努力改善生活状况。
【#英伟达老对手力挺DeepSeek#】
北京时间1月27日,苹果App Store美国区免费应用下载榜显示,中国大模型应用#DeepSeek# 超越ChatGPT,排名第一。DeepSeek引发对科技股估值的担忧,美股盘前,英伟达、台积电跌7.5%,ASML跌8.5%,博通跌近9%,微软、谷歌、亚马逊跌超3%,在日本东京股市,英伟达的主要供应商Advantest Corp的股价27日一度暴跌了8.6%。
就在1月25日(周六),英伟达的“老对手”AMD已经火速为DeepSeek“站台”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上,并借助SGLang进行了性能优化。此次集成将助力加速前沿人工智能应用与体验的开发。(封面新闻)
【#Deepseek宣布开源全新视觉多模态模型#】
1月28日凌晨,DeepSeek 宣布开源全新的视觉多模态模型 Janus-Pro-7B,其在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。
Janus-Pro 是先前工作 Janus 的进阶版本。具体来说,Janus-Pro 整合了优化的训练策略、扩展的训练数据,以及更大模型规模的扩展。通过这些改进,Janus-Pro 在多模态理解和文本到图像指令遵循能力方面取得了显著进展,同时还增强了文本到图像生成的稳定性。
据官方介绍,JanusFlow 引入了一种极简架构,它将自回归语言模型与校正流(一种最先进的生成模型方法)相集成。研究发现,校正流可以直接在大型语言模型框架内进行训练,无需复杂的架构调整。大量实验表明,JanusFlow 在各自领域内取得了与专用模型相当甚至更好的性能,同时在标准基准测试中显著优于现有的统一方法。这项工作代表着朝着更高效、更通用的视觉语言模型迈进了一步。(IT之家)
【#DeepSeek登顶苹果美区应用榜#,多岗位招新,实习生日薪最高上千元】
红星资本局1月27日消息,国产大模型DeepSeek登顶苹果中国和美国应用商店免费APP下载排行榜。公开资料显示,DeepSeek来自杭州深度求索人工智能基础技术研究有限公司(下称“深度求索公司”),该公司成立于2023年7月。往上追溯其股权结构,有幻方量化的身影。
红星资本局通过招聘网站注意到,深度求索公司的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深ui设计师等,均为14薪。其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。
【中国大模型DeeSeek反超GPT】
1月27日,国产AI DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
令市场惊讶的是,R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。在海外AI社区的研究者表示,R1收费比OpenAI o1便宜96.4%,同时提供类似的性能,建议已经订阅ChatGPT的开发者“放弃沉没成本”。(综合澎湃新闻、中国蓝新闻)
【“东方神秘力量” #爆火的国产AI大模型背后的年轻人#】
#DeepSeek# 2024年岁末,DeepSeek-V3大模型发布,迅速成为全球人工智能(AI)领域的焦点,刷屏科技圈,很多人化身“自来水”,在各大社交媒体、科技论坛上发帖讨论,不吝溢美之词。在全球范围内的行业基准测试中,DeepSeek-V3达到与Llama 3(开源大模型标杆,由扎克伯格的Meta公司开发)、GPT-4o(OpenAI大模型)相当的水平,闯入了多个AI大模型排行榜单前列。不管是AI圈,还是“吃瓜群众”,都在好奇,DeepSeek-V3大模型的背后,到底是一支什么样的团队?
DeepSeek团队规模并不大,不到140人,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,鲜有“海归”,而且工作时间都不长,不少还是在读博士。即便是团队的管理者,也非常年轻。“我们的核心技术岗位,基本以应届和毕业一两年的人为主。”深度求索创始人梁文锋此前向媒体表示,做一件长期的事,经验其实没那么重要,相比之下基础能力、创造性和热爱等更重要。因此,在组建DeepSeek团队时,他招人的原则是“看能力,而不是看经验”。他认为,或许目前世界排名前50的顶尖AI人才还不在中国,“但我们能自己打造这样的人。”而这些一边搞研发一边写论文的年轻人,也一次又一次带给他惊喜。
【DeepSeek团队正式发布两款多模态框架:Janus-Pro和JanusFlow】
据Safphere,DeepSeek团队正式发布两款多模态框架——Janus-Pro 和 JanusFlow。其中,Janus-Pro是一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能。
JanusFlow是一款通过生成流(Rectified Flow)与自回归语言模型融合实现统一的框架。
它不仅在理解任务中表现优异,还能生成高质量图像,展现了框架设计的极简与强大。
【#DeepSeek进军文生图领域#:发布多模态模型#JanusPro#】
北京时间1月28日凌晨,近期爆红的国产大模型DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。
DeepSeek方面表示,该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型,Janus-Pro优化了训练策略、扩展了训练数据,模型也更大。通过这些改进,Janus-Pro 在多模态理解和文本到图像的指令跟踪功能方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。
根据DeepSeek发布的测试结果,Janus-Pro在 GenEval 和 DPG-Bench 基准测试中击败了 Stable Diffusion 和 OpenAI 的 DALL-E 3。目前,Janus系列的4款模型已经开源。#DeepSeek称遭到大规模恶意攻击##DeepSeek模型谈英伟达股价暴跌#(新京报)
【DeepSeek:线上服务受到大规模恶意攻击,暂时限制部分注册】
1月28日消息,DeepSeek于服务状态页面公告称:近期DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录,感谢理解和支持。