ノートブックからのアクセス・ポイントを介した AWS 内のデータへのアクセス

最終更新: 2024年11月26日

Cloud Pak for Data as a Service では、AWS S3 バケット内に格納されているデータに、アクセス・ポイント経由でノートブックからアクセスできます。

Cloud Pak for Data as a Service の環境でノートブックを実行します。 S3 バケットに接続するためのインターネット対応アクセス・ポイントを作成します。

インターネット対応アクセス・ポイント経由での AWS S3 データへの接続

AWS S3 バケット内のデータには、任意の AWS リージョン内のインターネット対応アクセス・ポイント経由でアクセスできます。

インターネット対応アクセス・ポイント経由で S3 データにアクセスするには、次のようにします。

S3 バケット用のアクセス・ポイントを作成します。『Creating access points』を参照してください。

ネットワーク起点をInternetに設定します。
アクセス・ポイントが作成されたら、アクセス・ポイントの Amazon リソース・ネーム (Amazon resource name (ARN)) を書き留めます。例: ARN: arn:aws:s3:us-east-1:675068711478:accesspoint/cust-data-bucket-internet-ap。この ARN をノートブックに入力する必要があります。

ノートブックからの AWS S3 データへのアクセス

以下のサンプル・コード・スニペットは、アクセス・ポイントを使用してノートブックから AWS データにアクセスする方法を示しています。

import boto3
import pandas as pd

# use an access key and a secret that has access to the bucket
access_key="..."  
secret="..." 

s3_client = boto3.client('s3', aws_access_key_id=access_key, aws_secret_access_key=secret)

#the Amazon resource name (ARN) of the access point
arn = "..." 
# the file you want to retrieve
fileName="customers.csv"

response = s3_client.get_object(Bucket=arn, Key=fileName)
s3FileStream = response["Body"]
#for other file types, change the line below to use the appropriate read_() method from pandas
customerDF = pd.read_csv(s3FileStream)