---
name: データ分析
description: キュウリの平均価格データとJAXA Earth APIで取得した衛星データ（Daily)の分析（相関分析，ラグ相関分析，回帰分析など）を行 う際に使用するスキル
---
# データ分析・可視化スキル
## 目的
csvデータと衛星データを分析することで平均価格に影響を与える要因を見つける．

## 使用ライブラリ
- jaxa.earth.je, pandas, numpy, matplotlib, scikit-learn, scipy, pandasなど

## 分析手順
1. pandasを使って/home/pi/workspace/dataset/2025年キュウリ平均価格.csvを読み込む
   - "全国平均価格"の値に欠損がある場合は前後の値で線形補完を行う
2. /home/pi/workspace/dataset/daily_dataset_list.csvを読み込みランダムに2つのデータセットを選択する
3. JAXA Earth APIを使って2025年1月～12月の衛星データを読み込む
   - ppu=40を使用する
   - 緯度経度[<畑の緯度経度>]を中心に周辺のデータを取得する
   - 欠損がある場合は前後のデータで線形補完を試みる
   - Dailyデータは月ごとに分割しながら取得すること（サーバ負荷軽減のため）
   - 取得したデータは/home/pi/workspace/datasetフォルダにデータセットIDをファイル名としてキャッシュする
    （同じデータセットにアクセスする場合はサーバではなくキャッシュから読み込みサーバ負荷を減らす）
4. 取得したデータをmatplotlibで可視化する
   - 日本語フォントは使用しないこと
   - 可視化した画像はjpgファイルとして保存する
5. 2025年キュウリ平均価格.csvから読み込んだ平均価格と２種類の衛星データで相関分析，ラグ相関分析，単回帰分析，重回帰分析を行 う
6. 分析結果をレポートにまとめてファイルに出力する
7. 分析に用いたPythonスクリプトもファイルに出力する
