{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# iPython Profiler\n", "\n", "IPython bietet Zugriff auf eine breite Palette von Funktionen um die Zeiten zu messen und Profile zu erstellen. Hier werden die folgenden magischen IPython-Befehle erläutert:\n", "\n", "| Befehl | Beschreibung |\n", "| -------------- | --------------------------------------------------------------------------------- |\n", "| `%time` | Zeit für die Ausführung einer einzelnen Anweisung |\n", "| `%timeit` | Durchschnittliche Zeit für die wiederholte Ausführung einer einzelnen Anweisung |\n", "| `%prun` | Code mit dem Profiler ausführen |\n", "| `%lprun` | Code mit dem zeilenweisen Profiler ausführen |\n", "| `%memit` | Messen der Speichernutzung einer einzelnen Anweisung |\n", "| `%mprun` | Führt den Code mit dem zeilenweisen Memory-Profiler aus |\n", "\n", "Die letzten vier Befehle sind nicht in IPython selbst, sondern in den Modulen [line_profiler](https://github.com/pyutils/line_profiler) und [memory_profiler](https://github.com/pythonprofilers/memory_profiler) enthalten.\n", "\n", "
\n", "\n", "**Siehe auch**\n", "\n", "* [Penn Machine Learning Benchmarks](https://github.com/EpistasisLab/pmlb)\n", "
" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## `%timeit` und `%time`\n", "\n", "Wir haben die `%timeit`Zeilen- und `%%timeit`-Zellmagie bereits in der Einführung der magischen Funktionen in IPython Magic Commands gesehen. Sie können für Zeitmessungen bei der wiederholten Ausführung von Code-Schnipseln verwendet werden:" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "1.42 µs ± 222 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)\n" ] } ], "source": [ "%timeit sum(range(100))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Beachtet, dass `%timeit` die Ausführung mehrfach in einer Schleife (`loops`) ausführt. Wenn mit `-n` nicht die Anzahl der Schleifen festgelegt wird, passt `%timeit` die Anzahl automatisch so an, dass ein ausreichende Messgenauigkeit erreicht wird:" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "503 ms ± 83.6 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)\n" ] } ], "source": [ "%%timeit\n", "\n", "total = 0\n", "\n", "for i in range(1000):\n", " for j in range(1000):\n", " total += i * (-1) ** j" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Manchmal ist das Wiederholen einer Operation nicht die beste Option, z.B. wenn wir eine Liste haben, die wir sortieren möchten. Hier werden wir möglicherweise durch eine wiederholte Operation in die Irre geführt. Das Sortieren einer vorsortierten Liste ist viel schneller als das Sortieren einer unsortierten Liste, sodass die Wiederholung das Ergebnis verzerrt:" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "478 µs ± 19.1 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)\n" ] } ], "source": [ "import random\n", "\n", "\n", "L = [random.random() for i in range(100000)]\n", "\n", "%timeit L.sort()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Dann ist die `%time`-Funktion möglicherweise die bessere Wahl. Auch bei länger laufenden Befehlen, wenn kurze systembedingte Verzögerungen das Ergebnis wahrscheinlich kaum beeinflussen, dürfte `%time` die bessere Wahl sein:" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "CPU times: user 18.8 ms, sys: 0 ns, total: 18.8 ms\n", "Wall time: 18.7 ms\n" ] } ], "source": [ "import random\n", "\n", "\n", "L = [random.random() for i in range(100000)]\n", "\n", "%time L.sort()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Sortieren einer bereits sortierten Liste:" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "CPU times: user 1.13 ms, sys: 0 ns, total: 1.13 ms\n", "Wall time: 1.14 ms\n" ] } ], "source": [ "%time L.sort ()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Beachtet, wie viel schneller die vorsortierte Liste zu sortieren ist, aber beachtet auch, wie viel länger das Timing mit `%time` gegenüber `%timeit` dauert, sogar für die vorsortierte Liste. Dies ist auf die Tatsache zurückzuführen, dass `%timeit` einige clevere Dinge unternimmt, um zu verhindern, dass Systemaufrufe die Zeitmessung stören. So wird beispielsweise die *Garbage Collection* nicht mehr verwendeter Python-Objekte verhindert, die sich andernfalls auf die Zeitmessung auswirken könnten. Aus diesem Grund sind die `%timeit`-Ergebnisse normalerweise merklich schneller als die `%time`-Ergebnisse." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Profilerstellung für Skripte: `%prun`\n", "\n", "Ein Programm besteht aus vielen einzelnen Anweisungen, und manchmal ist es wichtiger, diese Anweisungen im Kontext zu messen, als sie selbst zu messen. Python enthält einen integrierten [Code-Profiler](https://docs.python.org/3/library/profile.html). IPython bietet jedoch eine wesentlich bequemere Möglichkeit, diesen Profiler in Form der Magic-Funktion zu verwenden: `%prun`.\n", "\n", "Als Beispiel definieren wir eine einfache Funktion, die einige Berechnungen durchführt:" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [], "source": [ "def sum_of_lists(N):\n", " total = 0\n", " for i in range(5):\n", " L = [j ^ (j >> i) for j in range(N)]\n", " total += sum(L)\n", " return total" ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ " " ] } ], "source": [ "%prun sum_of_lists(1000000)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Im Notebook sieht die Ausgabe ungefähr so aus:\n", "\n", "```\n", "14 function calls in 9.597 seconds\n", "\n", " Ordered by: internal time\n", "\n", " ncalls tottime percall cumtime percall filename:lineno(function)\n", " 5 8.121 1.624 8.121 1.624 :4()\n", " 5 0.747 0.149 0.747 0.149 {built-in method builtins.sum}\n", " 1 0.665 0.665 9.533 9.533 :1(sum_of_lists)\n", " 1 0.065 0.065 9.597 9.597 :1()\n", " 1 0.000 0.000 9.597 9.597 {built-in method builtins.exec}\n", " 1 0.000 0.000 0.000 0.000 {method 'disable' of '_lsprof.Profiler' objects}\n", "```" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Das Ergebnis ist eine Tabelle, die sortiert nach Gesamtzeit für jeden Funktionsaufruf die Ausführungsdauer angibt. In diesem Fall wird die meiste Zeit mit *List Comprehension* innerhalb von `sum_of_lists` verbraucht. Dies gibt uns Anhaltspunkte, an welcher Stelle wir die Effizienz des Algorithmus verbessern könnten." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Zeilenweise Profilerstellung: `%lprun`\n", "\n", "Die Profilerstellung von `%prun` ist nützlich, aber manchmal ist ein zeilenweiser Profilreport aufschlussreicher. Dies ist nicht in Python oder IPython integriert, aber mit [line_profiler](https://github.com/rkern/line_profiler) steht ein Paket zur Verfügung, das dies ermöglicht. Diese kann in eurem Kernel bereitgestellt werden mit\n", "\n", "```\n", "$ spack env activate python-311\n", "$ spack install py-line-profiler\n", "```\n", "\n", "Alternativ könnt ihr `line-profiler` auch mit anderen Paketmanagern installieren, z.B.\n", "\n", "```\n", "$ uv add line_profiler\n", "```\n", "\n", "Falls ihr Python 3.7.x verwendet und die Fehlermeldung bekommt `error: command 'clang' failed with exit status 1`, bleibt aktuell nur, `Cython` zusammen mit den Ressourcen aus dem Git-Repository zu installieren:\n", "\n", "```\n", "$ uv add Cython git+https://github.com/rkern/line_profiler.git#egg=line_profiler\n", "```\n", "\n", "Nun könnt ihr IPython mit der `line_profiler`-Erweiterung laden:" ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [], "source": [ "%load_ext line_profiler" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Der `%lprun`-Befehl führt eine zeilenweise Profilerstellung für jede Funktion durch. In diesem Fall muss explizit angegeben werden, welche Funktionen für die Profilerstellung interessant sind:" ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [], "source": [ "%lprun -f sum_of_lists sum_of_lists(5000)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Das Ergebnis sieht ungefähr so aus:\n", "\n", "```\n", "Timer unit: 1e-06 s\n", "\n", "Total time: 0.015145 s\n", "File: \n", "Function: sum_of_lists at line 1\n", "\n", "Line # Hits Time Per Hit % Time Line Contents\n", "==============================================================\n", " 1 def sum_of_lists(N):\n", " 2 1 1.0 1.0 0.0 total = 0\n", " 3 6 11.0 1.8 0.1 for i in range(5):\n", " 4 5 14804.0 2960.8 97.7 L = [j ^ (j >> i) for j in range(N)]\n", " 5 5 329.0 65.8 2.2 total += sum(L)\n", " 6 1 0.0 0.0 0.0 return total\n", "```" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Die Zeit wird in Mikrosekunden angegeben und wir können sehen, in welcher Zeile die Funktion die meiste Zeit verbringt. Eventuell können wir das Skript dann so ändern, dass die Effizienz der Funktion gesteigert werden kann.\n", "\n", "Weitere Informationen zu `%lprun` sowie die verfügbaren Optionen findet ihr in der IPython-Hilfefunktion `%lprun?`." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Speicherprofil erstellen: `%memit` und `%mprun`\n", "\n", "Ein weiterer Aspekt der Profilerstellung ist die Speichermenge, die eine Operation verwendet. Dies kann mit einer anderen IPython-Erweiterung ausgewertet werden, dem `memory_profiler`. Diese kann in eurem Kernel bereitgestellt werden mit\n", "\n", "```\n", "$ spack env activate python-374\n", "$ spack install py-memory-profiler ^python@3.7.4%gcc@9.1.0\n", "```\n", "\n", "Alternativ könnt ihr `memory-profiler` auch mit anderen Paketmanagern installieren, z.B.\n", "\n", "```\n", "$ uv add memory_profiler\n", "```" ] }, { "cell_type": "code", "execution_count": 10, "metadata": {}, "outputs": [], "source": [ "%load_ext memory_profiler" ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "peak memory: 136.37 MiB, increment: 69.42 MiB\n" ] } ], "source": [ "%memit sum_of_lists(1000000)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Wir sehen, dass diese Funktion ungefähr 100 MB Speicher belegt.\n", "\n", "Für eine zeilenweise Beschreibung der Speichernutzung können wir die `%mprun`-Magie verwenden. Leider funktioniert diese Magie nur für Funktionen, die in separaten Modulen definiert sind, und nicht für das Notebook selbst. Daher erstellen wir zunächst mit der `%%file`-Magie ein einfaches Modul mit dem Namen `mprun_demo.py`, das unsere `sum_of_lists`-Funktion enthält." ] }, { "cell_type": "code", "execution_count": 12, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Writing mprun_demo.py\n" ] } ], "source": [ "%%file mprun_demo.py\n", "from memory_profiler import profile\n", "\n", "\n", "@profile\n", "def my_func():\n", " a = [1] * (10**6)\n", " b = [2] * (2 * 10**7)\n", " del b\n", " return a" ] }, { "cell_type": "code", "execution_count": 13, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Filename: /srv/jupyter/jupyter-tutorial-de/docs/performance/mprun_demo.py\n", "\n", "Line # Mem usage Increment Line Contents\n", "================================================\n", " 3 67.3 MiB 67.3 MiB @profile\n", " 4 def my_func():\n", " 5 74.8 MiB 7.5 MiB a = [1] * (10 ** 6)\n", " 6 227.4 MiB 152.6 MiB b = [2] * (2 * 10 ** 7)\n", " 7 74.9 MiB 0.0 MiB del b\n", " 8 74.9 MiB 0.0 MiB return a\n", "\n", "\n", "\n" ] } ], "source": [ "from mprun_demo import my_func\n", "\n", "\n", "%mprun -f my_func my_func()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Hier zeigt die `Increment`-Spalte, wie stark sich jede Zeile auf den gesamten Speicherverbrauch auswirkt: Beachtet, dass wir beim Berechnen von `b` etwa 160 MB Speicher zusätzlich benötigen; dieser wird aber durch das Löschen von `b` nicht wieder freigegeben.\n", "\n", "Weitere Informationen zu `%memit` und `%mprun` sowie deren Optionen findet ihr in der IPython-Hilfe mit `%memit?`." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## pyheatmagic\n", "\n", "[pyheatmagic](https://github.com/csurfer/pyheatmagic) ist eine Erweiterung, die den IPython-Magic-Befehl `%%heat` zum Anzeigen von Python-Code als Heatmap mit [Py-Heat](https://github.com/csurfer/pyheat) erlaubt.\n", "\n", "Sie lässt sich einfach im Kernel installieren mit\n", "\n", "```\n", "$ uv add py-heat-magic\n", "Installing py-heat-magic…\n", "…```" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Laden der Extension in IPython" ] }, { "cell_type": "code", "execution_count": 14, "metadata": {}, "outputs": [], "source": [ "%load_ext heat" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Anzeigen der Heatmap" ] }, { "cell_type": "code", "execution_count": 15, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ " " ] }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "%%heat\n", "def powfun(a, b):\n", " \"\"\"Method to raise a to power b using pow() function.\"\"\"\n", " return pow(a, b)\n", "\n", "\n", "def powop(a, b):\n", " \"\"\"Method to raise a to power b using ** operator.\"\"\"\n", " return a**b\n", "\n", "\n", "def powmodexp(a, b):\n", " \"\"\"Method to raise a to power b using modular exponentiation.\"\"\"\n", " base = a\n", " res = 1\n", " while b > 0:\n", " if b & 1:\n", " res *= base\n", " base *= base\n", " b >>= 1\n", " return res\n", "\n", "\n", "def main():\n", " \"\"\"Test function.\"\"\"\n", " a, b = 2377757, 773\n", " pow_function = powfun(a, b)\n", " pow_operator = powop(a, b)\n", " pow_modular_exponentiation = powmodexp(a, b)\n", "\n", "\n", "if __name__ == \"__main__\":\n", " main()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Alternativ kann die Heatmap auch als Datei gespeichert werden, z.B. mit\n", "```\n", "%%heat -o pow-heatmap.png\n", "```" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3.11 Kernel", "language": "python", "name": "python311" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.11.4" }, "latex_envs": { "LaTeX_envs_menu_present": true, "autoclose": false, "autocomplete": true, "bibliofile": "biblio.bib", "cite_by": "apalike", "current_citInitial": 1, "eqLabelWithNumbers": true, "eqNumInitial": 1, "hotkeys": { "equation": "Ctrl-E", "itemize": "Ctrl-I" }, "labels_anchors": false, "latex_user_defs": false, "report_style_numbering": false, "user_envs_cfg": false }, "varInspector": { "cols": { "lenName": 16, "lenType": 16, "lenVar": 40 }, "kernels_config": { "python": { "delete_cmd_postfix": "", "delete_cmd_prefix": "del ", "library": "var_list.py", "varRefreshCmd": "print(var_dic_list())" }, "r": { "delete_cmd_postfix": ") ", "delete_cmd_prefix": "rm(", "library": "var_list.r", "varRefreshCmd": "cat(var_dic_list()) " } }, "types_to_exclude": [ "module", "function", "builtin_function_or_method", "instance", "_Feature" ], "window_display": false }, "widgets": { "application/vnd.jupyter.widget-state+json": { "state": {}, "version_major": 2, "version_minor": 0 } } }, "nbformat": 4, "nbformat_minor": 2 }