数据集方法
提示数据集方法
GPT Image Hub 公共提示数据集的方法,包括字段、出处、更新节奏和机器可读的分布。
数据集范围
公共数据集包含在 GPT Image Hub 库中可见的提示模板,用于发现、检索和重用。
- 每条记录都包含完整的提示文本和规范的 URL。
- 每个记录包括类别、标签、模型默认值、宽高比和属性字段。
- 可用时会提供翻译,以便客服人员可以映射本地化的提示意图。
格式和发现
该数据集以多种机器可读格式提供,可供搜索引擎、人工智能代理和数据管道使用。
- JSONL 是批量摄取的推荐格式。
- CSV 可用于电子表格和 BI 工具。
- JSON Schema 和清单描述了字段语义和分布。
出处和新鲜度
记录会在已知时公开源字段,并包含时间戳,以便代理可以评估新鲜度和出处。
- 清单包含 version、 generated_at、provenance 和 Same_as 字段。
- 数据集路由响应包括 ETag 和 Last-Modified 标头。
- 类别级分布允许较小的目标抓取。