Metodologia de conjunto de dados

Metodologia de conjunto de dados imediato

Metodologia para o conjunto de dados de prompt público GPT Image Hub, incluindo campos, proveniência, cadência de atualização e distribuições legíveis por máquina.

GPT Image HubAtualizado 2026-04-30

Escopo do conjunto de dados

O conjunto de dados público contém modelos de prompt que são visíveis na biblioteca GPT Image Hub e destinados à descoberta, recuperação e reutilização.

Cada registro inclui texto de prompt completo e URL canônico.
Cada registro inclui categoria, tags, padrões de modelo, proporção e campos de atribuição.
As traduções são incluídas quando disponíveis para que os agentes possam mapear a intenção de prompt localizada.

Formatos e descoberta

O conjunto de dados está disponível em vários formatos legíveis por máquina para mecanismos de pesquisa, agentes de IA e pipelines de dados.

JSONL é o formato recomendado para ingestão em massa.
CSV está disponível para planilhas e ferramentas de BI.
Um JSON Schema e um manifesto descrevem a semântica e as distribuições dos campos.

Proveniência e frescor

Os registros expõem os campos de origem quando conhecidos e incluem carimbos de data/hora para que os agentes possam avaliar a atualidade e a procedência.

O manifesto inclui os campos versão, generate_at, proveniência e same_as.
As respostas da rota do conjunto de dados incluem cabeçalhos ETag e Last-Modified.
Distribuições em nível de categoria permitem rastreamentos direcionados menores.