如何使用OpenAI的Web UI API进行文本到图像生成

嗨，大家好！如果你对使用OpenAI的Web UI API进行文本到图像生成感到困惑，不用担心，我将为你提供一份详细的教程。在这个教程中，我将向你介绍如何设置API，构建请求，获取生成的图像以及如何修改一些重要的参数。让我们一起开始吧！

引言

首先，让我向你介绍OpenAI的Web UI API。这个API允许你使用文本描述来生成图像，这对于许多应用程序，如创意设计和内容生成，都非常有用。在本教程中，我将向你展示如何使用这个API，并通过一个例子来说明整个过程。

步骤 1：启用API

首先，你需要启用Web UI API。要做到这一点，你需要在运行Web UI时使用--api命令行参数。以下是在Windows上如何设置API的示例：

在你的 "webui-user.bat" 文件中，添加以下行：

set COMMANDLINE_ARGS=--api

这个命令将启用API，然后你可以通过URL http://127.0.0.1:7860/docs 来查看API的文档和可用功能。

步骤 2：构建请求

现在，让我们来构建一个请求，告诉API我们想要生成什么样的图像。你可以使用一个包含参数的Python字典来构建请求。以下是一个示例：

import requests

url = "http://127.0.0.1:7860"  # 这个URL需要匹配你的Web UI的URL

payload = {
    "prompt": "可爱的小狗",
    "steps": 5
}

在这个示例中，我们设置了两个参数：prompt是描述我们要生成的图像的文本，steps是生成的步数。你可以根据需要设置更多的参数，如果不设置，API将使用默认值。

步骤 3：发送请求

一旦你构建了请求，就可以将其发送给API。使用requests库来进行HTTP POST请求。以下是如何发送请求的示例：

response = requests.post(url=f'{url}/sdapi/v1/txt2img', json=payload)

在这个代码中，我们将请求发送到/sdapi/v1/txt2img端点，这个端点用于生成图像。确保URL与你的Web UI的URL匹配。

步骤 4：获取生成的图像

在API完成生成图像的任务后，它将响应返回到一个变量中，我们将其命名为response。响应中包含了三个条目："images"、"parameters"和"info"。我们需要从中提取图像。

首先，我们使用以下代码将响应解析为JSON格式，以便更容易地处理：

r = response.json()

然后，我们可以从"images"中获取生成的图像。这个图像实际上是一个包含随机字符的字符串，我们需要对其进行解码。以下是如何做到这一点的示例：

from PIL import Image
import io
import base64

for i in r['images']:
    image = Image.open(io.BytesIO(base64.b64decode(i.split(",", 1)[0])))

现在，image变量中包含了生成的图像，你可以使用Pillow库（PIL）来进一步处理它，例如保存图像到文件。

步骤 5：添加元数据到图像

有时候，你可能想要将一些额外的元数据添加到生成的图像中。为了做到这一点，你可以使用/sdapi/v1/png-info端点。以下是如何将元数据添加到图像的示例：

png_payload = {
    "image": "data:image/png;base64," + i
}
response2 = requests.post(url=f'{url}/sdapi/v1/png-info', json=png_payload)

然后，你可以使用response2.json().get("info")来获取添加到图像的元数据。

示例代码

下面是一个完整的示例代码，演示了如何使用OpenAI的Web UI API进行文本到图像生成，以及如何添加元数据到图像：

import requests
import io
import base64
from PIL import Image

url = "http://127.0.0.1:7860"

payload = {
    "prompt": "可爱的小狗",
    "steps": 5
}

response = requests.post(url=f'{url}/sdapi/v1/txt2img', json=payload)

r = response.json()

for i in r['images']:
    image = Image.open(io.BytesIO(base64.b64decode(i.split(",", 1)[0])))

    png_payload = {
        "image": "data:image/png;base64," + i
    }
    response2 = requests.post(url=f'{url}/sdapi/v1/png-info', json=png_payload)

    # 添加元数据到图像
    image.save('output.png', pnginfo=PngImagePlugin.PngInfo.add_text("parameters", response2.json().get("info")))

自定义设置和参数

如果你想要修改一些设置和参数，你可以使用override_settings。这个参数允许你覆盖Web UI的设置，例如CLIP跳过的层数。以下是如何使用override_settings的示例：

override_settings = {}
override_settings["filter_nsfw"] = True
override_settings["CLIP_stop_at_last_layers"] = 2

override_payload = {
    "override_settings": override_settings
}
payload.update(override_payload)

在这个示例中，我们将filter_nsfw设置为True，并将CLIP_stop_at_last_layers设置为2。然后，我们将这个override_settings添加到我们之前创建的payload中，以便在发送请求时应用这些设置。

持久性设置

有时候，你可能希望你的设置更加持久，而不仅仅是单个请求。你可以使用/sdapi/v1/options端点来实现这一点。以下是一个示例：

option_payload = {
    "sd_model_checkpoint": "Anything-V3.0-pruned.ckpt [2700c435]",
    "CLIP_stop_at_last_layers": 2
}

response = requests.post(url=f'{url}/sdapi/v1/options', json=option_payload)

在这个示例中，我们设置了模型检查点和CLIP跳过的层数，这些设置将持久保存，而不仅仅是单个请求。请注意，如果你要更改sd_model_checkpoint，则值应该与Web UI中显示的检查点名称相匹配。

结论

恭喜你！现在你已经学会了如何使用OpenAI的Web UI API进行文本到图像生成，以及如何自定义设置和参数。这个API为创意设计和内容生成提供了无限的可能性。希望这个教程对你有所帮助！

关键词

请注意：本教程中的示例和URL可能会根据最新信息发生变化，建议随时查阅OpenAI的官方文档以获取最新信息。

这就是关于使用OpenAI的Web UI API进行文本到图像生成的详细教程。如果你有任何问题或需要进一步的帮助，欢迎随时联系我们。祝你在创意设计和内容生成方面取得成功！

未经允许不得转载：大神网 » 如何使用OpenAI的Web UI API进行文本到图像生成