4th Annual WDSC Progress Report 2

Arai Seminar of the Applied Econometrics

Sep 27th, 2022

Kasuga, Kin, Sugahara

コンテストのレギュレーション

  • Mizuho Mipotからの提供データをメインとして扱う
  • 発表会、授賞式11月26日(土)
  • 発表10分、質疑応答5分
  • データ分析の目的や方法、結果を説明するスライドをPPTもしくはPDFで提出 
    11月13日(日) 23:59まで
  • 本学学生で入手できるデータも扱えるが、提供データがメイン
  • 出典や入手元を明記

データ

  • データを見た上でMMC(クレジットカードの取引データ)に焦点を当てることに
    • Mizuhoがアクワイアリングを担当する加盟店からのデータかと思われる
変数名 内容 単位
TRDT_yyyymm 取引年月 yyyymm
PREFNM 都道府県名 -
JYUSYO 市区町村名 -
mipot_GYO_L 業種1 -
mipot_M 業種2 -
RATIO_CIF 取引人数の構成比 -
avg_kingak 平均取引額 (円)
var_kingak 取引額の分散 -

処理

  • CSVファイルをVS CodeにてShift-JIS形式で開く
  • 開いたファイルをUTF-8形式で保存
  • 保存されたファイルをR Studioに読み込み

実行コマンド

library(dplyr)
MMC_new <- filter(MMC_kekka, PREFNM == "東京都")
MMC_new1 <- filter(MMC_new, JYUSYO == "品川区")
MMC_new2 <- filter(MMC_new1, mipot_GYO_L == "コンビニ")
MMC_new2$TRDT_yyyymm = as.Date(MMC_new2$TRDT_yyyymm)
MMC_new2 <- ts(MMC_new2, start = 201506, end = 201808, frequency = 12)
ggplot(MMC_new2[-1,]$RATIO_CIF) #外れ値で[-1,]処理


品川区で「コンビニ」がクレカ決済総額を占める比率の時系列推移
2015年6月から2018年8月まで

Thank You