Champ:3D参数引导下的可控一致人像动画生成
Champ,一款通过3D参数技术引导,实现高度一致和可控的人像动画生成工具。
BrushNet:双分支扩散图像修复模型
BrushNet通过独创的双分支扩散技术,提供高效精准的图像修复解决方案,适用于各种图像处理场景。
Bili2text:轻松将Bilibili视频转文字
Bili2text提供一站式服务,从Bilibili视频到文本的转换快捷且高效,适合内容创作者和研究者使用。
Bark:多语言文本到音频的转换
Suno的Bark模型是一种革新的多语言文本到音频转换技术,能够生成逼真的语音和多样的音效。
AniPortrait:以音频驱动的真实肖像动画合成技术
AniPortrait,一个创新的音频驱动的肖像动画合成框架,能够生成高度逼真的动态图像。
2txt工具:图片转文字,快速而高效
2txt,一个快速、精确的图片到文字转换工具,基于Vercel AI SDK、Claude和Next.js技术构建。
Jigsaw Datasets:提升程序合成研究的实用工具
Jigsaw数据集为程序合成和大型语言模型的结合提供了一个宝贵的研究资源。通过深入分析和利用这些数据,研究人员可以推动这一领域的技术进步和理论发展。
GPTCache:减少LLM API成本,提速缓存系统
GPTCache是一个强大的工具,适用于任何需要频繁使用LLM的应用程序。它不仅可以帮助开发者节省成本,还能通过提高响应速度和可扩展性,提升用户体验。
闻达:一个大规模语言模型调用平台
闻达,一个为个人与中小企业设计的大规模语言模型调用平台,集成多种功能以支持高效的内容生成和知识管理。
MindFormers:一套全面的大模型训练和部署开发工具
MindSpore Transformers套件—一个全面的大模型训练和部署开发工具,支持业界主流的Transformer预训练模型与SOTA下游任务。
Code as Policies:面向体现控制的语言模型程序
Code as Policies,通过LLMs实现机器人行为策略的自动生成,提升机器人执行任务的准确性和效率。
Colossal-AI:降低AI大模型成本,提高易用性和扩展性
Colossal-AI 提供了一个强大而灵活的框架,用于构建、训练和部署大规模AI模型,特别适用于需要高效资源管理和并行处理能力的场景。