大模型日报 2024-08-02

发布于：2024-08-08 ⋅ 阅读:(397) ⋅ 点赞:(0)

大模型日报

2024-08-02

大模型资讯

博思艾伦在国际空间站部署先进语言模型

摘要: 博思艾伦在国际空间站上的超级计算机上运行了一种生成式人工智能大型语言模型。这一举措标志着语言模型在太空应用方面的重大进展。

人工智能助力研发安全有效的新型抗生素对抗耐药细菌

摘要: 德克萨斯大学奥斯汀分校的研究人员利用人工智能，开发出安全且有效的新型抗生素，旨在应对耐药细菌的威胁。这一突破为人类抗生素治疗带来了新的希望。

长上下文大语言模型评估

摘要: 本文作者Yennie Jun于2024年7月探讨了大语言模型的上下文窗口——即一次能处理的文本量——如何以指数速度增长。

“温度计”技术防止AI模型对错误答案过于自信

摘要: “温度计”技术可以防止人工智能模型在给出错误答案时过于自信。人们使用大型语言模型进行各种任务，从翻译文章到识别金融欺诈。

研究显示大型语言模型存在左倾偏见

摘要: 一项对24个先进大型语言模型的全面分析揭示，这些模型普遍存在显著的左倾偏见。这一发现引发了对人工智能中立性和公平性的广泛讨论。

Protect AI收购SydeLabs以强化大型语言模型安全

摘要: 2024年7月31日，AI安全领域的领导者Protect AI宣布收购专注于大型语言模型红队测试的SydeLabs。这一举措旨在加强其在AI安全方面的能力。

Torchchat：加速Llama 3等大语言模型的灵活框架

摘要: Torchchat是一款灵活的框架，可以在笔记本、台式机和移动设备上加速Llama 3、3.1及其他大语言模型的运行。大语言模型的发展在生成式AI等多个领域产生了重大影响。

大数据集是脑行为机器学习测试的关键

摘要: 在设计机器学习模型时，研究人员首先训练模型识别数据模式，然后测试其有效性。大规模数据集对于测试脑行为机器学习模型的效果至关重要。

AI与机器学习新闻：2024年7月21日至28日

摘要: 本周新闻涵盖LLaMA 3.1、Mistral Large和OpenAI测试等最新进展。作者Salvatore Raieli分享了更多相关文章，并提供了一个包含每周更新的机器学习资源库的链接。

Lelapa AI推出针对非洲语言的大型语言模型InkubaLM

摘要: 初创公司Lelapa AI推出InkubaLM，这是一款从零开始训练的大型语言模型，使用了19亿个数据标记，覆盖了五种广泛使用的非洲语言，旨在促进非洲语言的技术发展。

大模型产品

Simply Draw：AI助力绘画学习

摘要: Simply Draw结合创新与艺术自由，提供分步骤课程和AI反馈，帮助各年龄段用户提升绘画技能，轻松学画。

Samantha: AI情感助手

摘要: 使用Samantha记录语音笔记和日记，组织思绪，提升心理健康。智能聊天和笔记功能，关怀备至。

Toby：实时视频通话翻译

摘要: Toby让你在任何视频通话中实时说其他语言。只需下载桌面应用，设置后即可最小延迟地进行多语言对话。

Kroto：快速创建专业指南视频

摘要: Kroto利用AI将屏幕录制转化为详细文章，配有精美GIF、缩放效果视频、缩略图和自定义品牌，附带自然语音解说。

Lingoedit 2.0: AI语言伴侣

摘要: Lingoedit 2.0简化翻译与编辑，提供AI驱动的内联编辑、可定制提示和用户界面优化，提升写作效率。

Creatr：100秒内将创意转为设计原型

摘要: 使用Creatr，快速创建、构建、协作和发布产品。简化产品设计，让每个人都能打造美观且可扩展的数字产品。

Not Diamond: 最后的智能聊天助手

摘要: Not Diamond自动调用最佳模型，并根据您的反馈实时改进，持续学习您的偏好，是您唯一需要的聊天助手。

PerceptPixel 2.0：智能AI图片CDN

摘要: PerceptPixel 2.0结合Canva和Cloudinary功能，提供自动优化、模板和生成式AI等功能，适合开发者和设计师。

Ohboiler：AI加速个性化写作模板

摘要: Ohboiler通过AI将重复写作转化为高效模板。只需输入关键信息，AI融合生成新内容，适用于博客、邮件和儿童故事等。

Hooper：AI篮球数据与精彩集锦

摘要: Hooper使用手机为篮球比赛生成数据和集锦，适用于练习、野球和联赛。记录并分享你的精彩瞬间。

大模型论文

视觉语言模型时代的广义OOD检测综述

摘要: 本文综述了视觉语言模型时代的广义OOD检测，探讨了AD、ND、OSR、OD等问题的演变和挑战，并展望了未来方向。

基于视觉语言模型的手写验证研究

摘要: 研究探讨了使用视觉语言模型进行手写验证，结果显示其解释性增强但准确率低于CNN模型，需进一步改进。

通过重复采样扩展推理计算规模

摘要: 研究通过增加生成样本数量扩展推理计算，并在多任务中观察到覆盖率随样本数量呈对数线性增长。

无训练方法缓解LVLM幻觉现象

摘要: 提出无训练算法，通过调整图像注意权重和减小文本偏差，减轻LVLM的文本惯性和幻觉现象。

ReplanVLM：基于视觉语言模型的机器人任务重规划

摘要: 本文提出ReplanVLM框架，通过内部和外部错误纠正机制，提升机器人任务规划的成功率和错误纠正能力。

开放词汇音视频语义分割方法研究

摘要: 本文提出了开放词汇音视频语义分割任务，并引入OV-AVSS框架，展示了其在新类别上的强大泛化能力。

自适应检索增强生成在对话系统中的应用

摘要: 本文研究对话系统中每轮响应是否需要外部知识增强，提出RAGate模型，通过人类判断实现自适应增强，提高响应质量和生成信心。

CEAR：从文献构建化学知识图谱的方法

摘要: 本文提出了一种结合ChEBI和大语言模型的方法，从8,000篇ChemRxiv文章中构建化学实体和角色的知识图谱。

Synth-Empathy: 高质量同理心数据生成

摘要: 提出Synth-Empathy，利用LLM生成高质量同理心数据，提升模型表现并实现多项基准的SoTA结果，探讨数据质量与数量的平衡。

大模型开源项目

RAGFlow: 深度文档理解引擎

摘要: RAGFlow是一个基于深度文档理解的开源检索增强生成引擎，使用Python语言编写，提升文档处理能力。

本文由 mdnice 多平台发布