डेटासेट पद्धति
शीघ्र डेटासेट पद्धति
GPT Image Hub सार्वजनिक प्रॉम्प्ट डेटासेट के लिए पद्धति, जिसमें फ़ील्ड, उद्गम, अद्यतन ताल और मशीन-पठनीय वितरण शामिल हैं।
डेटासेट का दायरा
सार्वजनिक डेटासेट में शीघ्र टेम्पलेट होते हैं जो GPT Image Hub लाइब्रेरी में दिखाई देते हैं और खोज, पुनर्प्राप्ति और पुन: उपयोग के लिए अभिप्रेत हैं।
- प्रत्येक रिकॉर्ड में पूर्ण त्वरित पाठ और विहित URL शामिल है।
- प्रत्येक रिकॉर्ड में श्रेणी, टैग, मॉडल डिफ़ॉल्ट, पहलू अनुपात और एट्रिब्यूशन फ़ील्ड शामिल हैं।
- उपलब्ध होने पर अनुवाद शामिल किए जाते हैं ताकि एजेंट स्थानीयकृत त्वरित इरादे को मैप कर सकें।
प्रारूप और खोज
डेटासेट खोज इंजन, एआई एजेंटों और डेटा पाइपलाइनों के लिए कई मशीन-पठनीय प्रारूपों में उपलब्ध है।
- JSONL थोक अंतर्ग्रहण के लिए अनुशंसित प्रारूप है।
- CSV स्प्रेडशीट और बीआई टूल के लिए उपलब्ध है।
- एक JSON Schema और मेनिफ़ेस्ट फ़ील्ड शब्दार्थ और वितरण का वर्णन करता है।
उद्गम और ताजगी
रिकॉर्ड ज्ञात होने पर स्रोत फ़ील्ड को उजागर करते हैं और टाइमस्टैम्प शामिल करते हैं ताकि एजेंट ताजगी और उत्पत्ति का मूल्यांकन कर सकें।
- मेनिफेस्ट में संस्करण, जेनरेट_एट, उद्गम, और समान_अस फ़ील्ड शामिल हैं।
- डेटासेट रूट प्रतिक्रियाओं में ETag और Last-Modified हेडर शामिल हैं।
- श्रेणी-स्तरीय वितरण छोटे लक्षित क्रॉल की अनुमति देते हैं।