Pandas - это мощная библиотека для Python, специально разработанная для анализа и обработки данных. Она отличается быстродействием и позволяет эффективно исследовать данные.

Эта серия статей направлена на предоставление практических примеров применения pandas.

Быстрый старт с IPython Notebook

Для максимальной продуктивности советую попробовать выполнить это в интерактиве. Начнем с установки ipython через pip:

sudo pip3 install jupyter pandas matplotlib

После установки можно легко запустить сессию ipython, набрав в терминале:

jupyter notebook

Браузер откроет сервер jupyter, откуда мы можем создать новый notebook на Python 3.

Создаём notebook

Сначала запускаем код из ячейки.

In [1]:
import pandas as pd

print("Hi! This is a cell. Press the ▶ button above to run it")
Hi! This is a cell. Press the ▶ button above to run it

Вы также можете использовать сочетание клавиш Ctrl+Enter, чтобы исполнять код в ячейке.

Одним из ключевых преимуществ IPython Notebook является функция автодополнения.

Попробуйте сделать следующее: после ввода read_csv( в ячейке, нажимайте Shift+Tab 4 раза медленно. Наблюдайте за результатом.

In [ ]:
pd.read_csv(

Результат после двух повторений:

Автоподсказка

Теперь попробуем автодополнение. Введите "pd.r" и посмотрите на предложенные варианты.

In [ ]:
pd.r

Ожидать стоит следующего:

Автодополнение

Написание кода

Процесс написания кода в ячейках вполне интуитивен и естественен.

In [2]:
def print_10_nums():
    for i in range(10):
        print(i, end=' ')
In [3]:
print_10_nums()
0 1 2 3 4 5 6 7 8 9 

Магические функции

IPython предлагает множество магических функций. В качестве примера давайте сравним выполнение sum() при помощи генератора списка и через итератор с использованием магической функции %time.

In [4]:
%time sum([x for x in range(100000)])
CPU times: user 20 ms, sys: 0 ns, total: 20 ms
Wall time: 18.5 ms
Out[4]:
4999950000
In [5]:
%time sum(x for x in range(100000))
CPU times: user 8 ms, sys: 0 ns, total: 8 ms
Wall time: 8.34 ms
Out[5]:
4999950000

Вопросы для самопроверки:

  1. Какой командой запускается сервер Jupyter после установки пакетов?
  2. Какие клавиши следует нажать, чтобы выполнить код в ячейке Jupyter Notebook без использования кнопки ▶?
  3. Какая функция автодополнения доступна в IPython Notebook?
  4. Какую магическую функцию можно использовать для измерения времени выполнения кода?