Pandas: Adding/Modifying Columns¶

Example 1: Lowercasing A Column Of Strings ¶

Email addresses are case-insensitive, by law
The dataset has them mixed

import pandas as pd

persons = pd.DataFrame({
    'firstname': ['Joerg',                  'Johanna',           'Caro',              'Philipp'          ],
    'lastname':  ['Faschingbauer',          'Faschingbauer',     'Faschingbauer',     'Lichtenberger'    ],

    'email':     ['JF@faschingbauer.co.at', 'Johanna@email.com', 'Caro@email.com',    'PHILIPP@email.com'],

    'age':       [56,                       27,                  25,                  37                 ],
})

persons['email']

  JF@faschingbauer.co.at
       Johanna@email.com
          Caro@email.com
       PHILIPP@email.com
Name: email, dtype: object

Example 1: Modifying The `email` Column ¶

Pull out email
email = persons['email']

Lowercase that, using vectorized string methods of Series

email.str.lower()

  jf@faschingbauer.co.at
       johanna@email.com
          caro@email.com
       philipp@email.com
Name: email, dtype: object

lower_email = email.str.lower()

Assign back into persons DataFrame

persons['email'] = lower_email

persons

	firstname	lastname	email	age
0	Joerg	Faschingbauer	jf@faschingbauer.co.at	56
1	Johanna	Faschingbauer	johanna@email.com	27
2	Caro	Faschingbauer	caro@email.com	25
3	Philipp	Lichtenberger	philipp@email.com	37

In short

persons['email'] = persons['email'].str.lower()

Example 2: Adding A `normalized_email` Column ¶

import pandas as pd

persons = pd.DataFrame({
    'firstname': ['Guido',      'Joerg',                  'Johanna',        'Caro',              'Philipp'],
    'lastname':  ['Rentner',    'Faschingbauer',          'Faschingbauer',  'Faschingbauer',     'Lichtenberger'],
    'email':     ['jf@old.com', 'JF@faschingbauer.co.at', 'Caro@email.com', 'Johanna@email.com', 'PHILIPP@email.com'],
    'age':       [69,           56,                       27,               25,                  37],
})

It’s as simple as assigning a column that does not yet exist

persons['normalized_email'] = persons['email'].str.lower()

What If No Prebuilt Functionality Exists? `apply()` To The Rescue!¶

Simple example: Python’s built-in len() function: one parameter, and return value
s = 'Hello' len(s)
5

Apply that on a Series; e.g. firstname

fn = persons['firstname']
fn

    Guido
    Joerg
  Johanna
     Caro
  Philipp
Name: firstname, dtype: object

Length of each firstname

fn.apply(len)

  5
  5
  7
  4
  7
Name: firstname, dtype: int64

`apply()` -ing Custom Functions ¶

Write single-parameter function (just like len())

def is_palindrome(s):
    s = s.lower()
    return s == s[::-1]

persons

	firstname	lastname	email	age	normalized_email
0	Guido	Rentner	jf@old.com	69	jf@old.com
1	Joerg	Faschingbauer	JF@faschingbauer.co.at	56	jf@faschingbauer.co.at
2	Johanna	Faschingbauer	Caro@email.com	27	caro@email.com
3	Caro	Faschingbauer	Johanna@email.com	25	johanna@email.com
4	Philipp	Lichtenberger	PHILIPP@email.com	37	philipp@email.com

Apply it

persons['lastname'].apply(is_palindrome)

   True
  False
  False
  False
  False
Name: lastname, dtype: bool

Navigation

Pandas: Adding/Modifying Columns¶

Example 1: Lowercasing A Column Of Strings ¶

Example 1: Modifying The `email` Column ¶

Example 2: Adding A `normalized_email` Column ¶

What If No Prebuilt Functionality Exists? `apply()` To The Rescue!¶

`apply()` -ing Custom Functions ¶

Links ¶

Pandas: Adding/Modifying Columns¶

Example 1: Lowercasing A Column Of Strings¶

Example 1: Modifying The email Column¶

Example 2: Adding A normalized_email Column¶

What If No Prebuilt Functionality Exists? apply() To The Rescue!¶

apply() -ing Custom Functions¶

Links¶

Example 1: Lowercasing A Column Of Strings ¶

Example 1: Modifying The `email` Column ¶

Example 2: Adding A `normalized_email` Column ¶

What If No Prebuilt Functionality Exists? `apply()` To The Rescue!¶

`apply()` -ing Custom Functions ¶

Links ¶