Metodología del conjunto de datos
Metodología de conjunto de datos rápidos
Metodología para el conjunto de datos de avisos públicos GPT Image Hub, incluidos campos, procedencia, cadencia de actualización y distribuciones legibles por máquina.
Alcance del conjunto de datos
El conjunto de datos público contiene plantillas de mensajes que son visibles en la biblioteca GPT Image Hub y están destinadas al descubrimiento, la recuperación y la reutilización.
- Cada registro incluye texto de aviso completo y URL canónico.
- Cada registro incluye categorías, etiquetas, valores predeterminados del modelo, relación de aspecto y campos de atribución.
- Las traducciones se incluyen cuando están disponibles para que los agentes puedan mapear la intención del mensaje localizado.
Formatos y descubrimiento
El conjunto de datos está disponible en múltiples formatos legibles por máquina para motores de búsqueda, agentes de inteligencia artificial y canales de datos.
- JSONL es el formato recomendado para la ingesta masiva.
- CSV está disponible para hojas de cálculo y herramientas de BI.
- Un JSON Schema y un manifiesto describen la semántica y las distribuciones de los campos.
Procedencia y frescura
Los registros exponen los campos de origen cuando se conocen e incluyen marcas de tiempo para que los agentes puedan evaluar la frescura y la procedencia.
- El manifiesto incluye los campos versión, generado_at, procedencia y mismo_as.
- Las respuestas de ruta del conjunto de datos incluyen encabezados ETag y Last-Modified.
- Las distribuciones a nivel de categoría permiten rastreos dirigidos más pequeños.