Phương pháp tập dữ liệu
Phương pháp tập dữ liệu nhanh chóng
Phương pháp dành cho tập dữ liệu nhắc nhở công khai GPT Image Hub, bao gồm các trường, xuất xứ, nhịp độ cập nhật và các bản phân phối có thể đọc được bằng máy.
Phạm vi tập dữ liệu
Tập dữ liệu công khai chứa các mẫu lời nhắc hiển thị trong thư viện GPT Image Hub và dùng để khám phá, truy xuất và tái sử dụng.
- Mỗi bản ghi bao gồm văn bản nhắc nhở đầy đủ và chính tắc URL.
- Mỗi bản ghi bao gồm danh mục, thẻ, giá trị mặc định của mô hình, tỷ lệ khung hình và các trường thuộc tính.
- Các bản dịch được bao gồm khi có sẵn để tổng đài viên có thể ánh xạ ý định nhắc nhở được bản địa hóa.
Định dạng và khám phá
Tập dữ liệu có sẵn ở nhiều định dạng mà máy có thể đọc được cho các công cụ tìm kiếm, tác nhân AI và đường dẫn dữ liệu.
- JSONL là định dạng được đề xuất để nhập hàng loạt.
- CSV có sẵn cho bảng tính và công cụ BI.
- JSON Schema và bảng kê khai mô tả ngữ nghĩa và phân phối của trường.
Xuất xứ và độ tươi
Bản ghi hiển thị các trường nguồn khi được biết và bao gồm dấu thời gian để các đại lý có thể đánh giá độ tươi và xuất xứ.
- Tệp kê khai bao gồm các trường phiên bản, posted_at, xuất xứ và Same_as.
- Phản hồi lộ trình tập dữ liệu bao gồm các tiêu đề ETag và Last-Modified.
- Phân phối cấp danh mục cho phép thu thập thông tin được nhắm mục tiêu nhỏ hơn.