Dateisysteme

High-Level-APIs

PyFilesystem

arbeitet mit Dateien und Verzeichnissen in Archiven, in Storages, in der Cloud usw.

https://raster.shields.io/github/stars/pyfilesystem/pyfilesystem2 https://raster.shields.io/github/contributors/pyfilesystem/pyfilesystem2 https://raster.shields.io/github/commit-activity/y/pyfilesystem/pyfilesystem2 https://raster.shields.io/github/license/pyfilesystem/pyfilesystem2

Integrierte Dateisysteme:

  • AppFS für in Betriebssystemen vordefinierte Speicherorte, in denen Anwendungen Daten speichern können

  • FTPFS für die Arbeit mit FTP-Servern

  • MemoryFS für Caches, temporäre Datenspeicher, Unit-Tests usw., die im Arbeitsspeicher existieren

  • MountFS für ein virtuelles Dateisystem, das andere Dateisysteme einhängen kann

  • MultiFS für ein virtuelles Dateisystem, das andere Dateisysteme kombiniert

  • OSFS für das OS-Dateisystem

  • TarFS liest und schreibt komprimierte Tar-Archive

  • TempFS enthält temporäre Daten

  • ZipFS ließt und schreibt Zip-Dateien

Dateisysteme der PyFilesystem Organisation auf GitHub:

Dateisysteme von Drittentwicklern:

fsspec

Einheitliche Python-Schnittstelle für viele lokale, entfernte und eingebettete Dateisysteme und Byte-Storages. Wenn ihr in eurem Projekt z.B. bereits pandas, Intake, Dask oder DVC verwendet, ist fsspec bereits vorhanden.

https://raster.shields.io/github/stars/fsspec/filesystem_spec https://raster.shields.io/github/contributors/fsspec/filesystem_spec https://raster.shields.io/github/commit-activity/y/fsspec/filesystem_spec https://raster.shields.io/github/license/fsspec/filesystem_spec

Neben den integrierten Implementierungen gibt es auch viele Erweiterungen, z.B. für:

  • abfs für den Azure Blob-Service

  • adl für den Azure DataLake-Storage

  • alluxiofs für den verteilten Cache von Alluxio

  • boxfs für den Zugriff auf Box-Dateispeicher

  • dropbox für den Zugriff auf Dropbox-Freigaben

  • dvc für den Zugriff auf ein DVC-Repository als Dateisystem

  • gcsfs für Google Cloud Storage

  • gdrive für den Zugriff auf Google Drive und Freigaben

  • huggingface_hub für den Zugriff auf das Hugging Face Hub Dateisystem

  • lakefs für lakeFS Datalakes

  • ocifs für den Zugriff auf den Oracle Cloud Object Storage

  • ossfs für das Alibaba Cloud (Aliyun) Objektspeichersystem (OSS)

  • p9fs für 9P-Server

  • s3fs für Amazon S3 und andere kompatible Speicher.

  • wandbfs für den Zugriff auf Wandb-Daten

  • webdav4 für WebDAV

Siehe auch

Rclone ist ein Befehlszeilenprogramm zur Verwaltung von Dateien auf einem Cloud-Speicher. Es unterstützt mehr als 70 Cloud-Storages. Ein Beispiel für die Verwendung mit Python findet ihr in rclone.py.

Spezialisierte Bibliotheken

PyArrow

Apache Arrow Python Bindings für das Hadoop Distributed File System (HDFS) und weitere fsspec-kompatible Dateisysteme.

https://raster.shields.io/github/stars/apache/arrow https://raster.shields.io/github/contributors/apache/arrow https://raster.shields.io/github/commit-activity/y/apache/arrow https://raster.shields.io/github/license/apache/arrow
paramiko

Python–Implementierung des SSHv2-Protokolls, die sowohl Client- als auch Serverfunktionen bietet. Sie bildet die Grundlage für die High-Level-SSH-Bibliothek Fabric.

https://raster.shields.io/github/stars/paramiko/paramiko https://raster.shields.io/github/contributors/paramiko/paramiko https://raster.shields.io/github/commit-activity/y/paramiko/paramiko https://raster.shields.io/github/license/paramiko/paramiko
boto3

AWS SDK für Python erleichtert die Integration in Amazon S3, Amazon EC2, Amazon DynamoDB und andere.

https://raster.shields.io/github/stars/boto/boto3 https://raster.shields.io/github/contributors/boto/boto3 https://raster.shields.io/github/commit-activity/y/boto/boto3 https://raster.shields.io/github/license/boto/boto3
azure-storage-blob

Azure Storage Blobs client library für Python.

https://raster.shields.io/github/stars/Azure/azure-sdk-for-python https://raster.shields.io/github/contributors/Azure/azure-sdk-for-python https://raster.shields.io/github/commit-activity/y/Azure/azure-sdk-for-python https://raster.shields.io/github/license/Azure/azure-sdk-for-python
oss2

Python SDK für den Alibaba Cloud Object Storage.

https://raster.shields.io/github/stars/aliyun/aliyun-oss-python-sdk https://raster.shields.io/github/contributors/aliyun/aliyun-oss-python-sdk https://raster.shields.io/github/commit-activity/y/aliyun/aliyun-oss-python-sdk https://raster.shields.io/github/license/aliyun/aliyun-oss-python-sdk
minio

MinIO Python Client SDK für Amazon S3 kompatiblen Cloud-Speicher.

https://raster.shields.io/github/stars/minio/minio-py https://raster.shields.io/github/contributors/minio/minio-py https://raster.shields.io/github/commit-activity/y/minio/minio-py https://raster.shields.io/github/license/minio/minio-py
PyDrive2

Python Wrapper-Bibliothek des google-api-python-client, die viele gängige Google Drive API-Aufgaben vereinfacht.

https://raster.shields.io/github/stars/iterative/PyDrive2 https://raster.shields.io/github/contributors/iterative/PyDrive2 https://raster.shields.io/github/commit-activity/y/iterative/PyDrive2 https://raster.shields.io/github/license/iterative/PyDrive2
Qcloud COSv5 SDK

Python SDK für den Tencent Cloud Object Storage (COS).

https://raster.shields.io/github/stars/tencentyun/cos-python-sdk-v5 https://raster.shields.io/github/contributors/tencentyun/cos-python-sdk-v5 https://raster.shields.io/github/commit-activity/y/tencentyun/cos-python-sdk-v5 https://raster.shields.io/github/license/tencentyun/cos-python-sdk-v5
linode_api4

Python bindings für die Linode API v4.

https://raster.shields.io/github/stars/linode/linode_api4-python https://raster.shields.io/github/contributors/linode/linode_api4-python https://raster.shields.io/github/commit-activity/y/linode/linode_api4-python https://raster.shields.io/github/license/linode/linode_api4-python
airfs

bringt Standard-Python-I/O zu verschiedenen Storages (wie Alibaba Cloud OSS, Amazon Web Services S3, GitHub, Microsoft Azure Blobs Storage und Files Storage, OpenStack Swift/Object Store.

https://raster.shields.io/github/stars/JGoutin/airfs https://raster.shields.io/github/contributors/JGoutin/airfs https://raster.shields.io/github/commit-activity/y/JGoutin/airfs https://raster.shields.io/github/license/JGoutin/airfs
yandex-s3

Asyncio-kompatibles SDK für Yandex Object Storage.

https://raster.shields.io/github/stars/mrslow/yandex-s3 https://raster.shields.io/github/contributors/mrslow/yandex-s3 https://raster.shields.io/github/commit-activity/y/mrslow/yandex-s3 https://raster.shields.io/github/license/mrslow/yandex-s3

Ruhende Projekte

PyDrive

Python Wrapper-Bibliothek des google-api-python-client, die viele gängige Google Drive API-Aufgaben vereinfacht.

https://raster.shields.io/github/stars/googlearchive/PyDrive https://raster.shields.io/github/contributors/googlearchive/PyDrive https://raster.shields.io/github/commit-activity/y/googlearchive/PyDrive https://raster.shields.io/github/license/googlearchive/PyDrive
digital-ocean-spaces

Python-Client für Digital Ocean Spaces mit einer eingebauten Shell.

https://raster.shields.io/github/stars/ChariotDev/digital-ocean-spaces https://raster.shields.io/github/contributors/ChariotDev/digital-ocean-spaces https://raster.shields.io/github/commit-activity/y/ChariotDev/digital-ocean-spaces https://raster.shields.io/github/license/ChariotDev/digital-ocean-spaces