# Python Grundlagen

Ziel dieser Übung ist es die folgenden Grundlagen zu Python und Jupyter zu vermitteln:
 - [Code kommentieren](#commenting)
 - [Deklaration von Variablen](#variablen)
 - [Arithmetische Operationen](#arithmetik)
 - [Namenskonventionen](#naming)
 - [Listen, Sets, Tuple, Dictionaries](#datatypes)
 - [If-Else Abfragen](#ifelse)
 - [While Schleife](#whileloop)
 - [For Schleife](#forloop)
 - [Range Operator](#range)
 - [Definition eigener Funktionen](#functions)
 - [Lambdas](#lambdas)
 - [Grundlagen in Pandas](#pandas)

Dieses Material wird im Rahmen der Lehrveranstaltung _Informationssysteme und Datenanalyse_ von der
Forschungsgruppe [Datenbanken und Informationssysteme](https://tu.berlin/dima) (DIMA) der TU Berlin zur Verfügung gestellt.


<a id="commenting"></a>
## Code kommentieren

In [None]:
# Dies ist ein einzeiliger Kommentar
print("hello world")  # Zeichen nach dem "#" Symbol werden vom Python Interpreter ignoriert

In [None]:
"""
Ein Kommentar 
über
mehrere 
Zeilen.
"""

print("hello world")

<a id="variablen"></a>
## Deklaration von Variablen

Variablen können beliebige Werte annehmen. Typ oder Größe müssen nicht vorher definiert werden.
Python differenziert zwischen Groß- und Kleinschreibung und benötigt, anders als bei Java oder C, kein Semikolon am Ende eines Befehls.

Die Variable, die den Wert annehmen soll, steht auf der linken Seite. Der neue Wert der Variable steht auf der rechten Seite.

In [None]:
x = 3  # integer
y = 3.0  # floating point number
z = "Hello"  # ein string definiert mit ""
# ein string, in der Variablen Z definiert mit ""
Z = "World!"

print(x, type(x))
print(y, type(y))
print(z, type(z))
print(Z, type(Z))

# der Type einer Variablen kann auch nachträglich geändert werden
Z = 23.5
print(Z, type(Z))

In [None]:
# bool Werte werden mit False oder True deklariert
f = False
t = True

print(f, type(f))
print(t, type(t))

<a id="arithmetik"></a>
## Arithmetische Operationen

In [None]:
i = 5
j = 3
print("Summe : ", i + j)
print("Differenz : ", i - j)
print("Produkt : ", i * j)
print("Potenz : ", i**j)
print("Modulo : ", i % j)
print("Floor Division : ", i // j)
print("Float Division : ", i / j)
result = i / j
type(result)

<a id="naming"></a>
## Namenskonventionen

Ein gängiger Guide zu korrektem Code Style sind die Vorgaben von PEP8:
https://www.python.org/dev/peps/pep-0008/

Variablen und Funktionen sollten folgende Konvention beachten: <br>
snake_case <br>
lower_case_with_underscore

Allerdings wird auch **camelCase** häufiger gesehen.



In [None]:
# snake_case
mein_string = "hallo123"
mein_zweiter_string = "hallo345"
# camelCase
meinDritterString = "hallo567"

print(mein_string)
print(mein_zweiter_string)
print(meinDritterString)

<a id="datatypes"></a>
## Listen, Sets, Tuple, Dictionaries
**Listen** <br> sind Sammlungen von Elementen und behalten die Reihenfolge bei. Listen haben eine variable Größe.

In [None]:
meine_liste = [87, 43, 1, 4, 321, 5, 2, 21, 1, 32, 1, 43]
print(meine_liste, type(meine_liste))

# Einfügen von einem Element in eine Liste
meine_liste.append(43)
print(meine_liste, type(meine_liste))

# Zusammenführen von zwei Listen
meine_liste.extend([34, 21, 74, 146])
print(meine_liste, type(meine_liste))

**Sets** <br> sind unsortiere, duplikat-freie Sammlungen von Elementen.

In [None]:
mein_set = {87, 43, 1, 4, 321, 5, 2, 21, 1, 32, 1, 43}
print(mein_set, type(mein_set))

# hinzüfügen eines Elementes
mein_set.add(56)
print(mein_set, type(mein_set))

# entfernen
mein_set.remove(321)
print(mein_set, type(mein_set))

# zusammenführen von zwei Sets
mein_set.update({32, 653, 12, 723, 145})
print(mein_set, type(mein_set))

**Tuple** <br>
sind wie Listen, die nicht verändert werden können

In [None]:
mein_tuple = (1, 5, 1, 4)
print(mein_tuple, type(mein_tuple))
# erstes Element
print(mein_tuple[0])
# letztes Element
print(mein_tuple[len(mein_tuple) - 1])

**Dictionaries (aka Maps)** <br>
sind Key/Value Paare. Keys sind einzigartig in einem dict. Values können mehrmals vorkommen.

In [None]:
woerter = {"house": "Haus", "cat": "Katze", "black": "schwarz"}

print(woerter["house"])

woerter["river"] = "Fluss"
woerter["cat"] = "Veraenderte Katze"
# es können auch Keys verändert werden
woerter["new_house"] = woerter.pop("house")

print(woerter)

<a id="ifelse"></a>
## If-Else Abfragen
In Python werden Blöcke mit Einrückungen definiert. Eine Einrückung besteht aus 4 Leerzeichen.
In C oder Java werden Blöcke in { } gekennzeichnet.
Hinweis: Python IDEs lösen in der Regel Tab automatisch in 4 Leerzeichen auf.

In [None]:
a = 3 + 18
b = 4**2

if a > b:
    print("a groesser b")
    print("a > b")
elif a < b:
    print("a kleiner b")
    print("a < b")
else:
    print("a gleich b")
    print("a == b")

In [None]:
elemente = [1, 34, 442, 6, 12]

if 1 in elemente:
    print(str(1) + " ist in der Liste")
    if 34 in elemente:
        print(str(34) + " ist auch in der Liste")
else:
    print("Element nicht gefunden")

<a id="whileloop"></a>
## While Schleife

In [None]:
i = 0
words = ["katze", "fenster", "haus"]

while i < len(words):
    print(words[i])
    i = i + 1

<a id="forloop"></a>
## For Schleife

In [None]:
words = ["katze", "fenster", "haus"]
for w in words:
    print(w, len(w))

<a id="range"></a>
## Range Operator

In [None]:
for i in range(15):
    print(i)

In [None]:
for i in range(2, 8):
    print(i)

In [None]:
for i in range(100, 20, -5):
    print(i)

<a id="functions"></a>
## Definition eigener Funktionen

In [None]:
# Iterative Methode ohne Ausgabe
def fib(n):
    n1, n2 = 0, 1
    count = 0

    # Validiere die Eingaben
    if n <= 0:
        print("Falsche Eingabe!")
    elif n == 1:
        print("Fibonacci bis", n, ":")
        print(n1)
    else:
        print("Fibonacci:")
        while count < n:
            print(n1)
            nth = n1 + n2
            # update Werte
            n1 = n2
            n2 = nth
            count += 1


print(fib(14))

In [None]:
# Rekursive Methode mit Ausgabe
def fib(n):
    if n < 0:
        print("Falsche Eingabe!")
    # Erste Zahl ist 0
    elif n == 1:
        return 0
    # Zweite Zahl ist 1
    elif n == 2:
        return 1
    else:
        return fib(n - 1) + fib(n - 2)


print(fib(14))

In [None]:
# Methode mit mehreren Eingabeparametern
def summe(a, b, c, d):
    return a + b + c + d


summe(2, 2, 15, 10)

In [None]:
# Der Typ von Funktionsparameters und Rückgabewerten kann über Type Annotations definiert werden
# Diese werden jedoch nicht vom Python Interpreter überprüft und dienen nur der Lesbarkeit
def summe_typed(a: int, b: float) -> float:
    return a + b


summe_typed(2, 2.0)

<a id="lambdas"></a>
## Lambdas
Lambdas sind kleine anonyme Funktionen mit nur einem Ausdruck

In [None]:
# Lambda mit einem Parameter
l1 = lambda a: a + 10
print(l1(23))

In [None]:
# Lambda mit mehreren Parametern
l2 = lambda a, b: a * b
print(l2(15, 6))

<a id="pandas"></a>
## Grundlagen in Pandas
Hier ist eine kurze Einführung in Pandas:
https://pandas.pydata.org/pandas-docs/stable/index.html

In [None]:
# dependencies importieren
import pandas as pd
import numpy as np

pd.__version__

In [None]:
# dataframe erzeugen mit numpy array
dates = pd.date_range("20130101", periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list("ABCD"))
print(df)

In [None]:
# dataframe mit einem dict erzeugen
df = pd.DataFrame(
    {
        "A": 1.0,
        "B": pd.Timestamp("20130102"),
        "C": pd.Series(1, index=list(range(4)), dtype="float32"),
        "D": np.array([3] * 4, dtype="int32"),
        "E": pd.Categorical(["test", "train", "test", "train"]),
        "F": "foo",
    }
)
print(df)

In [None]:
# ersten drei Zeilen anzeigen
print(df.head(3))

In [None]:
# letzten zwei Zeilen anzeigen
print(df.tail(2))

In [None]:
# Statistiken numerischer Felder
df.describe()

In [None]:
# Projektion auf den Statistiken
df.describe()["A"]

In [None]:
# Selektion
df[df["A"] > 0]

In [None]:
# Selektion nach Index und Update der Spalte
df.loc[:, "D"] = np.array([5] * len(df), dtype=np.int32)
print(df)

In [None]:
# Funktionen anwenden

# Liste von Tuplen
matrix = [
    (22, 34, 23),
    (33, 31, 11),
    (44, 16, 21),
    (55, 32, 22),
    (66, 33, 27),
    (77, 35, 11),
]

# DataFrame object erzeugen
df = pd.DataFrame(matrix, columns=list("xyz"), index=list("abcdef"))
print(df)

# jetzt quadrieren wir alle elemente in z
df["z"] = df["z"].apply(lambda x: x * 2)
print(df)

In [None]:
# nur Zeile b und c quadrieren
# Liste von Tuplen
matrix = [
    (22, 34, 23),
    (33, 31, 11),
    (44, 16, 21),
    (55, 32, 22),
    (66, 33, 27),
    (77, 35, 11),
]

# DataFrame object erzeugen
df = pd.DataFrame(matrix, columns=list("xyz"), index=list("abcdef"))
df = df.apply(lambda x: x**2 if x.name in ["b", "c"] else x, axis=1)
print(df)