ノートブックからのアクセス・ポイントを介した AWS 内のデータへのアクセス

最終更新: 2024年11月26日
ノートブックからのアクセス・ポイントを介した AWS 内のデータへのアクセス

Cloud Pak for Data as a Service では、AWS S3 バケット内に格納されているデータに、アクセス・ポイント経由でノートブックからアクセスできます。

Cloud Pak for Data as a Service の環境でノートブックを実行します。 S3 バケットに接続するためのインターネット対応アクセス・ポイントを作成します。

インターネット対応アクセス・ポイント経由での AWS S3 データへの接続

AWS S3 バケット内のデータには、任意の AWS リージョン内のインターネット対応アクセス・ポイント経由でアクセスできます。

インターネット対応アクセス・ポイント経由で S3 データにアクセスするには、次のようにします。

  1. S3 バケット用のアクセス・ポイントを作成します。 『Creating access points』を参照してください。

    ネットワーク起点をInternetに設定します。

  2. アクセス・ポイントが作成されたら、アクセス・ポイントの Amazon リソース・ネーム (Amazon resource name (ARN)) を書き留めます。 例: ARN: arn:aws:s3:us-east-1:675068711478:accesspoint/cust-data-bucket-internet-ap。この ARN をノートブックに入力する必要があります。

ノートブックからの AWS S3 データへのアクセス

以下のサンプル・コード・スニペットは、アクセス・ポイントを使用してノートブックから AWS データにアクセスする方法を示しています。

import boto3
import pandas as pd

# use an access key and a secret that has access to the bucket
access_key="..."  
secret="..." 

s3_client = boto3.client('s3', aws_access_key_id=access_key, aws_secret_access_key=secret)

#the Amazon resource name (ARN) of the access point
arn = "..." 
# the file you want to retrieve
fileName="customers.csv"

response = s3_client.get_object(Bucket=arn, Key=fileName)
s3FileStream = response["Body"]
#for other file types, change the line below to use the appropriate read_() method from pandas
customerDF = pd.read_csv(s3FileStream)

親トピック: ノートブックでのデータのロードとアクセス