Методология набора данных
Подскажите методологию набора данных
Методология для общедоступного набора данных подсказок GPT Image Hub, включая поля, происхождение, частоту обновления и машиночитаемые дистрибутивы.
Область набора данных
Общедоступный набор данных содержит шаблоны подсказок, которые видны в библиотеке GPT Image Hub и предназначены для обнаружения, извлечения и повторного использования.
- Каждая запись включает полный текст подсказки и канонический URL.
- Каждая запись включает в себя категорию, теги, параметры модели по умолчанию, соотношение сторон и поля атрибуции.
- Переводы включаются, когда они доступны, чтобы агенты могли отображать локализованные подсказки.
Форматы и открытие
Набор данных доступен в нескольких машиночитаемых форматах для поисковых систем, агентов искусственного интеллекта и конвейеров данных.
- JSONL – рекомендуемый формат для массового приема.
- CSV доступен для электронных таблиц и инструментов BI.
- JSON Schema и манифест описывают семантику и распределение полей.
Происхождение и свежесть
Записи раскрывают исходные поля, если они известны, и включают временные метки, чтобы агенты могли оценить свежесть и происхождение.
- Манифест включает поля version,generated_at,venance и Same_as.
- Ответы на маршрут набора данных включают заголовки ETag и Last-Modified.
- Распределения на уровне категорий допускают меньшее целевое сканирование.