0 / 0
Zurück zur englischen Version der Dokumentation

Zugriff auf Daten in AWS über Zugriffspunkte aus einem Notizbuch

Letzte Aktualisierung: 22. Nov. 2024
Zugriff auf Daten in AWS über Zugriffspunkte aus einem Notizbuch

In IBM watsonx können Sie über Zugriffspunkte aus einem Notebook auf Daten zugreifen, die in AWS S3 -Buckets gespeichert sind.

Führen Sie das Notebook in einer Umgebung in IBM watsonxaus. Erstellen Sie einen internetfähigen Zugriffspunkt, um eine Verbindung zum S3-Bucket herzustellen.

Verbindung zu AWS S3-Daten über internetfähigen Zugriffspunkt herstellen

Sie können über einen internetfähigen Zugriffspunkt in jeder AWS-Region auf Daten in einem AWS S3-Bucket zugreifen.

Gehen Sie wie folgt vor, um über einen internetfähigen Zugriffspunkt auf S3-Daten zuzugreifen:

  1. Erstellen Sie einen Zugriffspunkt für Ihr S3-Bucket. Siehe Erstellen von Zugriffspunkten.

    Legen Sie Internet als Netzursprung fest.

  2. Merken Sie sich nach der Erstellung des Zugriffspunkts dessen Amazon-Ressourcennamen (ARN). Beispiel: ARN: arn:aws:s3:us-east-1:675068711478:accesspoint/cust-data-bucket-internet-ap.Sie müssen den ARN in Ihr Notebook eingeben.

Über Ihr Notebook auf AWS S3-Daten zugreifen

Der folgende Beispielcodeausschnitt veranschaulicht, wie Sie von Ihrem Notebook über einen Zugriffspunkt auf AWS-Daten zugreifen können:

import boto3
import pandas as pd

# use an access key and a secret that has access to the bucket
access_key="..."  
secret="..." 

s3_client = boto3.client('s3', aws_access_key_id=access_key, aws_secret_access_key=secret)

#the Amazon resource name (ARN) of the access point
arn = "..." 
# the file you want to retrieve
fileName="customers.csv"

response = s3_client.get_object(Bucket=arn, Key=fileName)
s3FileStream = response["Body"]
#for other file types, change the line below to use the appropriate read_() method from pandas
customerDF = pd.read_csv(s3FileStream)

Übergeordnetes Thema: Daten in ein Notebook laden und darauf zugreifen