'PANDAS'에 해당되는 글 2건

  1. 2019.06.05 Pandas, 실수형인 두 column으로 heatmap 그리기
  2. 2019.04.17 jupyter notebook에서 dataframe
iris_df = pd.DataFrame(iris.data, columns = iris.feature_names)
iris_df.columns = ["sepal_length", "sepal_width", "petal_length", "petal_width"]
iris_df.head(5)

df = iris_df[["sepal_length", "sepal_width"]]
display(df.head(5))
df = round(df)
df2 = df.groupby(["sepal_length", "sepal_width"]).size()
df3= df2.unstack()
display(df3)

# Set up the matplotlib figure
f, ax = plt.subplots(figsize=(5, 5))

# Generate a custom diverging colormap
cmap = sns.diverging_palette(100, 10, as_cmap=True)

# Draw the heatmap with the mask and correct aspect ratio
sns.heatmap(df3, cmap=cmap, center=0,
            square=True, linewidths=.5, cbar_kws={"shrink": .5})

Posted by poterius
,

dataframe이 notebook cell의 마지막에 있으면 내용을 예쁘게 table로 보여주는데, 

loop안에 있을 경우 table이 보이지 않는다. 

print(df)하면 내용은 보이기는 하나 예쁜 table이 아니고.. 

이경우 IPython.display를 사용한다.

 

from sklearn.datasets import load_iris
import pandas as pd
from IPython.display import display, HTML

iris = datasets.load_iris()

data = pd.DataFrame(data= np.c_[iris['data'], iris['target']],
                     columns= iris['feature_names'] + ['target'])
target = data['target'].unique()
target
for t in target:
    display(data[data['target'] == t].head(2))

Posted by poterius
,