.. SPDX-FileCopyrightText: 2021 Veit Schiele .. .. SPDX-License-Identifier: BSD-3-Clause Daten lesen, speichern und bereitstellen ======================================== Einen Überblick zu öffentlichen Repositories mit Forschungsdaten erhaltet ihr z.B. in :doc:`opendata`. Neben spezifischen Python-Bibliotheken zum Zugriff auf :doc:`/data-processing/file-systems` und :doc:`/data-processing/geodata` stellen wir euch :doc:`serialisation-formats/index` und drei Werkzeuge genauer vor: * :doc:`/data-processing/pandas-io` * :doc:`/data-processing/httpx/index` * :doc:`/data-processing/intake/index` .. tip:: `cusy Seminar: Daten lesen, schreiben und bereitstellen mit Python `_ .. seealso:: `Scrapy `_ Framework zum Extrahieren von Daten aus Websites als JSON-, CSV- oder XML-Dateien. `Pattern `_ Python-Modul zum Data Mining, Verarbeitung natürlicher Sprache, ML und Netzwerkanalyse `Web Scraping Reference `_ Übersicht zu Web Scraping mit Python Zum Speichern von relationalen Daten, Python-Objekten und Geodaten stellen wir euch :doc:`postgresql/index`, :doc:`postgresql/sqlalchemy` und :doc:`postgresql/postgis/index` vor. Als nächstes zeigen wir euch, wie ihr die Daten über ein :doc:`apis/index` bereitstellt. Mit :doc:`DVC <../productive/dvc/index>` stellen wir euch ein Werkzeug vor, das euch Datenprovenienz erlaubt. Damit vollzieht ihr die Herkunft und den Entstehungsweg von Daten nach. Im Anschluß lernt ihr im nächsten Kapitel noch einige Good Practices und hilfreiche Python-Pakete zum :doc:`Bereinigen und Validieren von Daten <../clean-prep/index>` kennen. .. toctree:: :hidden: :titlesonly: :maxdepth: 0 opendata pandas-io serialisation-formats/index intake/index httpx/index file-systems geodata postgresql/index nosql/index apis/index glossary