3 个令人惊艳的 AI 开源工具,诞生了!

发布于:2024-07-09 ⋅ 阅读:(50) ⋅ 点赞:(0)

大家好,今天继续聊聊 AI 科技圈发生的那些事。分享几个最新好玩、实用的AI工具。更多最新技术,文末加入我们。

LivePortrait

LivePortrait:一款可以轻松让一幅肖像栩栩如生的工具

图片

它可以精准操控眼睛和嘴唇动作:

  • 让静态照片变为流畅动态视频,颠覆传统动画制作,处理多人物肖像无缝拼接,自然流畅。

  • 解决传统动画制作难题,高质量高效率,精确控制眼睛和嘴唇动作,微表情逼真。

  • 采用先进技术方法,生成速度快,支持多风格肖像,提供更多创意空间。

案例

图片

使用方法

1、克隆代码并准备环境

git clone https://github.com/KwaiVGI/LivePortrait
cd LivePortrait

# create env using conda
conda create -n LivePortrait python==3.9.18
conda activate LivePortrait
# install dependencies with pip
pip install -r requirements.txt

2、下载预训练权重

pretrained_weights
├── insightface
│   └── models
│       └── buffalo_l
│           ├── 2d106det.onnx
│           └── det_10g.onnx
└── liveportrait
    ├── base_models
    │   ├── appearance_feature_extractor.pth
    │   ├── motion_extractor.pth
    │   ├── spade_generator.pth
    │   └── warping_module.pth
    ├── landmark.onnx
    └── retargeting_models
        └── stitching_retargeting_module.pth

3、推理

python inference.py

图片

GraphRAG

图片

微软最近开源 GraphRAG,构建知识图谱增强大模型的问答、推理等能力

  • GraphRAG 通过构建实体知识图谱来增强大模型的搜索、问答、摘要、推理等能力,特别擅长处理大规模数据集。

  • GraphRAG 的核心包括构建实体知识图谱和生成社区摘要两个步骤,通过社区摘要提取数据集中相关信息,生成更全面和准确的答案。

  • GraphRAG 对 tokens 的需求很低,能够帮助开发者节省成本。在综合测试中表现优异,是目前最佳的RAG方法之一。

基于 Python 的开源将在https://aka.ms/graphrag上发布

Fish Speech

Fish Speech 完美支持中英日语言的开源TTS模型

  • 语音处理接近人类水平

  • 模型使用约十五万小时三语数据训练,对中文支持非常的完美。

  • 该项目由 fishaudio 开发,作为一个仅有亿级参数的模型,Fish Speech 设计高效轻量,可以在个人设备上轻松运行和微调,成为您的私人语音助手。

使用方法

Github:https://github.com/fishaudio/fish-speech

图片

资料获取和交流

技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。

成立了大模型算法技术交流群,相关资料、技术交流&答疑,均可加我们的交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。

方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2040,备注:来自CSDN + 技术交流

通俗易懂讲解大模型系列


网站公告

今日签到

点亮在社区的每一天
去签到