Metodologia de conjunto de dados
Metodologia de conjunto de dados imediato
Metodologia para o conjunto de dados de prompt público GPT Image Hub, incluindo campos, proveniência, cadência de atualização e distribuições legíveis por máquina.
Escopo do conjunto de dados
O conjunto de dados público contém modelos de prompt que são visíveis na biblioteca GPT Image Hub e destinados à descoberta, recuperação e reutilização.
- Cada registro inclui texto de prompt completo e URL canônico.
- Cada registro inclui categoria, tags, padrões de modelo, proporção e campos de atribuição.
- As traduções são incluídas quando disponíveis para que os agentes possam mapear a intenção de prompt localizada.
Formatos e descoberta
O conjunto de dados está disponível em vários formatos legíveis por máquina para mecanismos de pesquisa, agentes de IA e pipelines de dados.
- JSONL é o formato recomendado para ingestão em massa.
- CSV está disponível para planilhas e ferramentas de BI.
- Um JSON Schema e um manifesto descrevem a semântica e as distribuições dos campos.
Proveniência e frescor
Os registros expõem os campos de origem quando conhecidos e incluem carimbos de data/hora para que os agentes possam avaliar a atualidade e a procedência.
- O manifesto inclui os campos versão, generate_at, proveniência e same_as.
- As respostas da rota do conjunto de dados incluem cabeçalhos ETag e Last-Modified.
- Distribuições em nível de categoria permitem rastreamentos direcionados menores.