IT Python 機械学習

【機械学習】前処理 欠損値(NULL)処理

機械学習をする際、データの制御に時間を要することがあります。ここでは欠損値(Null値)のPythonでの制御方法を紹介していきたいと思います。

 

ここで紹介すること

① 全ての値が欠損値(NULL)である列を削除

② 全ての値が欠損値(NULL)である行を削除

③ 欠損値(NULL)がある行の削除

④ 欠損値(NULL)がある列を削除

 

使用環境

Google Colaboratory

 

必要ライブラリの読み込み

データ加工に必要なライブラリを読み込みます。

 

① 全ての値が欠損値(NULL)である行を削除

行を選択する場合は、axis=0 とします。

 

② 全ての値が欠損値(NULL)である列を削除

列を選択する場合は、axis=1 とします。

 

③ 欠損値(NULL)がある行の削除

 

④ 欠損値(NULL)がある列を削除

 

おわりに

いかがでしたでしょうか? 機械学習では、データの前処理で総時間の7割を使うと言われています。

データの制御に時間を費やさないこともデータサイエンティストにとって大事な技術と言えます。

その他にも前処理をするやりかたを紹介していますのでほかのページも見ていただければと思います。

-IT, Python, 機械学習

© 2025 ロスジェネ世代の平社員