Google Analytics の データを CSVに export し、Pandas に取り込みをしていたのですが、一部データの変換に少し手間取ったので、対象データの変換方法を記載します。


%表記のデータを、少数点表記に変換する

100% を 1 に、98.5% を 0.985 に変換します。

参考

変換方法

以下、項目をString型に変換し、% rstrip して、float 型に変換した結果を 100 で割ります。

df['col'] = df['col'].str.rstrip('%').astype('float') / 100.0


HH:MM:SS 形式のデータを、秒表記に変換する

ページの滞在時間 00:10:30 630変換します。

参考

変換方法

to_timedelta使用すると、秒表記に変換できます。

df['Average Interaction Time'] = pd.to_timedelta(df['Average Interaction Time'])
                                   .astype('timedelta64[s]')
                                   .astype(int)

以上です。

コメント