Metodologia zbioru danych
Metodologia szybkiego zbioru danych
Metodologia dla publicznego zestawu danych podpowiedzi GPT Image Hub, w tym pola, pochodzenie, częstotliwość aktualizacji i rozkłady do odczytu maszynowego.
Zakres zbioru danych
Publiczny zestaw danych zawiera szablony podpowiedzi, które są widoczne w bibliotece GPT Image Hub i przeznaczone do wykrywania, pobierania i ponownego użycia.
- Każdy rekord zawiera pełny tekst podpowiedzi i kanoniczny URL.
- Każdy rekord zawiera kategorię, znaczniki, ustawienia domyślne modelu, współczynnik proporcji i pola atrybucji.
- Tłumaczenia są uwzględniane, jeśli są dostępne, dzięki czemu agenci mogą mapować zlokalizowane zamiary podpowiedzi.
Formaty i odkrycie
Zbiór danych jest dostępny w wielu formatach do odczytu maszynowego dla wyszukiwarek, agentów AI i potoków danych.
- JSONL to zalecany format w przypadku przetwarzania zbiorczego.
- CSV jest dostępny dla arkuszy kalkulacyjnych i narzędzi BI.
- JSON Schema i manifest opisują semantykę i rozkłady pól.
Pochodzenie i świeżość
Rejestry ujawniają pola źródłowe, jeśli są znane, i zawierają znaczniki czasu, dzięki czemu agenci mogą ocenić świeżość i pochodzenie.
- Manifest zawiera pola wersja, wygenerowany_at, pochodzenie i same_as.
- Odpowiedzi na trasy zestawu danych obejmują nagłówki ETag i Last-Modified.
- Dystrybucje na poziomie kategorii umożliwiają mniejsze, ukierunkowane indeksowanie.