プロジェクトの Cloud Object Storage への非常に大容量のオブジェクトを追加します
プロジェクトの Cloud Object Storage に一度にロードできるデータの量は、データをロードする場所によって異なります。 Watson Studio を使用してデータをロードする場合、制限は 5 GB です。 より大きなオブジェクトをプロジェクトの Cloud Object Storageに追加するには、以下のいずれかの方法を使用できます:
- Cloud Object Storage APIです
- FTP クライアント
- IBM Cloud Object Storage Python SDKです (FTP クライアントを使用することができない場合)
Cloud Object Storage API を使用して複数パーツに分割してデータをロードする
{: #api}Cloud Object Storage API を使用すると、最大 5 GB のデータ・オブジェクトを 1 回の PUT でロードすることができます。また、データを一連のパーツとしてオブジェクト・ストレージにロードすることで、最大 5 TB のオブジェクトをロードすることができます。これらのパーツは、任意の順序で並行して個別にロードすることができます。 すべてのパーツがロードされた後は、そのデータは Cloud Object Storage に単一オブジェクトとして表示されます。
ファイルは、以下の形式および MIME タイプで、複数パーツとしてロードできます。
- application/xml
- application/pdf
- text/plain; charset=utf-8
複数パーツでデータ・オブジェクトをロードするには、以下のようにします。
-
下の マルチパート・ロードを開始します:
curl -X "POST" "https://(endpoint)/(bucket-name)/(object-name)?uploads" -H "Authorization: bearer (token)"
bucket-name
およびtoken
の値は、 Watson Studio プロジェクトの General ページの Manage タブにあります。 エンドポイント値ための Watson Studio 上の IBM Cloud 中の「Manage」 をクリックしてください。 -
任意の順次パーツ番号とオブジェクトの UploadId を指定して、パーツをロードします。
curl -X "PUT" "https://(endpoint)/(bucket-name)/(object-name)?partNumber=(sequential-integer)&uploadId=(upload-id)" -H "Authorization: bearer (token)" -H "Content-Type: (content-type)"
content-type
は、application/xml
、application/pdf
、またはtext/plain; charset=utf-8
のいずれかになる可能性があります。 -
複数パーツのロードを実行します。
curl -X "POST" "https://(endpoint)/(bucket-name)/(object-name)?uploadId=(upload-id)" -H "Authorization: bearer (token)" -H "Content-Type: text/plain; charset=utf-8" -d \$'<CompleteMultipartUpload> <Part> <PartNumber>1</PartNumber> <ETag>(etag)</ETag> </Part> <Part> <PartNumber>2</PartNumber> <ETag>(etag)</ETag> </Part>
- ファイルを資産としてプロジェクトに追加します。 プロジェクトの Assets ページで、 Find and add data アイコンをクリックします。 次に、 Files ペインでアクション・メニューをクリックし、 Add as data setを選択します。
次のステップ
もっと見る
親トピック: プロジェクトへの接続の追加