Google Analytics の データを CSVに export し、Pandas に取り込みをしていたのですが、一部データの変換に少し手間取ったので、対象データの変換方法を記載します。
%
表記のデータを、少数点表記に変換する
100% を 1 に、98.5% を 0.985 に変換します。
参考
変換方法
以下、項目をString型に変換し、%
を rstrip して、float 型に変換した結果を 100 で割ります。
df['col'] = df['col'].str.rstrip('%').astype('float') / 100.0
HH:MM:SS
形式のデータを、秒表記に変換する
ページの滞在時間 00:10:30
を 630
に変換します。
参考
- date - Pandas - Convert HH:MM:SS.F string to seconds - Caveat : HH sometimes goes over 24H - Stack Overflow
- Time Deltas — pandas 0.22.0 documentation
変換方法
to_timedelta
を使用すると、秒表記に変換できます。
df['Average Interaction Time'] = pd.to_timedelta(df['Average Interaction Time'])
.astype('timedelta64[s]')
.astype(int)
以上です。
コメント