开源复刻apple 数学笔记;纯C++实现了ChatGLM系列模型;腾讯混元文生图模型发布新版本并开源训练代码

发布于:2024-06-17 ⋅ 阅读:(14) ⋅ 点赞:(0)

✨ 1: AI Math Notes

AI Math Notes 是一个交互式绘图应用,可绘制并计算数学方程。

在这里插入图片描述

AI Math Notes 受到Apple在WWDC 2024上的“Math Notes”演启发,开发的一个互动式绘图应用程序,用户可以在画布上绘制数学方程。一旦方程被绘制完成,应用程序将使用多模态LLM(Large Language Model)来计算并显示结果在等号的右侧。该应用程序是使用Python编程语言开发的,采用Tkinter库来实现图形用户界面,使用PIL进行图像处理。

地址:https://github.com/ayushpai/AI-Math-Notes

✨ 2: ChatGLM.cpp

ChatGLM.cpp基于纯C++实现了ChatGLM系列模型,支持实时对话并提供多种量化和加速选项。

在这里插入图片描述

ChatGLM.cpp 是一种基于 C++ 的高效实现,用于执行包括 ChatGLM-6B、ChatGLM2-6B、ChatGLM3、GLM-4 以及其他大型语言模型(LLMs)的实时聊天和推断。该项目借鉴了 llama.cpp 的技术,通过使用 ggml 库实现了内存优化和高效的 CPU 推断,支持 int4/int8 量化、优化的 KV 缓存数据和并行计算。

地址:https://github.com/li-plus/chatglm.cpp

✨ 3: agentUniverse

agentUniverse是一个基于大语言模型构建多智能体应用的开发框架

在这里插入图片描述

agentUniverse 是一个基于大型语言模型的多智能体应用开发框架。它提供了构建单个智能体和多智能体协作机制的所有必要组件,允许开发者构建和自定义多智能体协作模式,以便轻松构建多智能体应用,并共享来自不同技术和业务领域的模式实践。

地址:https://github.com/alipay/agentUniverse

✨ 4: Hallo

通过音频输入来驱动人物图像,使其产生逼真的面部动画效果

在这里插入图片描述

Hallo 是一个由复旦大学和其他几所机构的研究人员开发的分层音频驱动下的人物图像动画合成系统。该系统通过音频输入来驱动人物图像,使其产生逼真的面部动画效果。具体来说,Hallo 能够处理面部的姿态、表情以及唇部的运动,从而生成与输入音频同步的逼真视频动画。

地址:https://github.com/fudan-generative-vision/hallo

✨ 5: HunyuanDiT

腾讯混元文生图模型发布1.1版本,同时发布了训练代码。

在这里插入图片描述

HunyuanDiT(混元DiT)是腾讯发布的一个多分辨率扩散Transformer,具备精细化中文理解能力。HunyuanDiT通过巧妙设计的变换器结构、文本编码器和位置编码,以及从零开始构建的数据管道,实现了对中文和英文文本的精细化理解与图像生成。该模型支持多回合的多模态对话,能够根据上下文生成和优化图像。

模型地址:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT-v1.1

地址:https://github.com/Tencent/HunyuanDiT



更多AI工具,参考国内AiBard123Github-AiBard123 公众号:每日AI新工具