Metodología del conjunto de datos

Metodología de conjunto de datos rápidos

Metodología para el conjunto de datos de avisos públicos GPT Image Hub, incluidos campos, procedencia, cadencia de actualización y distribuciones legibles por máquina.

GPT Image HubActualizado 2026-04-30

Alcance del conjunto de datos

El conjunto de datos público contiene plantillas de mensajes que son visibles en la biblioteca GPT Image Hub y están destinadas al descubrimiento, la recuperación y la reutilización.

Cada registro incluye texto de aviso completo y URL canónico.
Cada registro incluye categorías, etiquetas, valores predeterminados del modelo, relación de aspecto y campos de atribución.
Las traducciones se incluyen cuando están disponibles para que los agentes puedan mapear la intención del mensaje localizado.

Formatos y descubrimiento

El conjunto de datos está disponible en múltiples formatos legibles por máquina para motores de búsqueda, agentes de inteligencia artificial y canales de datos.

JSONL es el formato recomendado para la ingesta masiva.
CSV está disponible para hojas de cálculo y herramientas de BI.
Un JSON Schema y un manifiesto describen la semántica y las distribuciones de los campos.

Procedencia y frescura

Los registros exponen los campos de origen cuando se conocen e incluyen marcas de tiempo para que los agentes puedan evaluar la frescura y la procedencia.

El manifiesto incluye los campos versión, generado_at, procedencia y mismo_as.
Las respuestas de ruta del conjunto de datos incluyen encabezados ETag y Last-Modified.
Las distribuciones a nivel de categoría permiten rastreos dirigidos más pequeños.