ComfyUI-Gemini：Gemini 1.5 Pro在ComfyUI中的全面集成

全新功能与高级应用，开启智能对话与多媒体处理新纪元

返回上一页

描述

ComfyUI-Gemini，在 ComfyUI 中使用 Gemini 1.5 Pro 进行高级对话管理和多模态交互，体验前所未有的智能对话与数据处理能力。

介绍

Gemini 1.5 Pro 已成功集成到 ComfyUI 中，这意味着用户现在不仅可以使用该模型生成提示词、描述图像，还能享受与其深入交流的乐趣。自2024年5月2日起，Gemini API 将开始收费，用户需在官方网站申请API密钥以继续使用服务。

home_open_ComfyUI_Gemini_1

主要功能

高级对话管理：支持系统指令设置，允许用户精细控制对话流程，实现更加智能的交互体验。
多模态交互能力：集成文本、图像以及文件读取功能，支持多种媒体类型的输入，包括视频和音频，上限为20GB。
扩展的输入限制：支持的输入token数量达到1048576，为用户提供了极大的灵活性。
严格的速率限制：每分钟最多两次请求，每日最多1000次，确保服务的稳定与高效。

新增功能

home_open_ComfyUI_Gemini_2

文件上传支持：现支持单个文件上传，包括图片、文本文件、PDF和音频文件，未来将扩展到多文件上传。
全面的训练和测试流程：提供了从预处理到自动打标，再到训练和测试的一条龙服务，特别适用于LoRa设备的数据处理。

使用方式

用户需要首先在 Gemini API 官网申请自己的 API 密钥。Gemini 1.5 Pro的使用分为隐式和显式两种API Key方式，推荐使用隐式API Key以增强安全性。用户也可以选择显式输入API Key，但需要注意不要将包含密钥的工作流共享。

安装指南

推荐通过 ComfyUI Manager 进行安装，也可以手动安装。手动安装步骤如下：

克隆存储库到本地。
进入项目目录，安装必要的依赖。
重启 ComfyUI 以应用安装。

类别

AI开源大模型 ChatGPT应用 AI开源套壳项目 AI业务助手

松鼠盒子AI是什么？

松鼠盒子AI是专业靠谱的AI人工智能工具评测推荐网站。已收录了国内外上千款AI工具、GPTs应用，涉及AI副业、AI编程、AI写作、AI问答、AI绘画、AI自媒体、AI开源项目等领域，可以通过类别和功能来搜索和过滤这些工具；同时也整理了ChatGPT、Stable Diffusion、Midjourney、Prompt Engineering、Sora等AI工具使用教程。

免责声明

本站内容整理自网络，所提供内容仅供学习使用，请勿做非法用途，不得以任何方式利用本网站提供内容直接或间接从事违反中国法律法规，以及社会公德的行为。若本站内容涉嫌侵犯他人知识产权或其他合法权益的内容，请及时联系立即删除；本站尊重并保护所有用户的个人隐私权。

AI工具教程

免费领取AI学习资料进AI副业交流群

AI工具教程

免费领取AI学习资料进AI副业交流群