タイトルって難しい。

学力も体力もない人間の雑記帳。

Rで東京メトロオープンデータを触ってみる その1

台風・・・いや温帯低気圧ですね。こんなときといえば電車が遅れますね。
さて、昨年登録だけして結局いじらなかったオープンデータのAPIがありますので現状はどうなのか確認してみました。

本当ならば、Pythonとかでやればいいのですが、手軽さとデータハンドリングの楽さ、あとこのブログは基本的にPythonの記事など需要がなさそうな気がしてならないので、みんなだいすきなRでやりました。

library(jsonlite)
library(dplyr)
traindata <- fromJSON("https://api.tokyometroapp.jp/api/v2/datapoints?rdf:type=odpt:Train&acl:consumerKey=[key]")

traindata <- traindata[4:17]
names(traindata) <- c("date", "valid", "frequency", "railway", "sameAs", "trainNumber", "trainType", "delay", "startingStation", "terminalStation", "fromStation", "toStation", "railDirection", "trainOwner")
delay <- filter(traindata, delay > 0)

流れとしては、json形式のデータを得る→加工する→遅れとる電車だけ抽出 って感じです。
元の得られるデータではちょっと列名がアレだったので、列名については書き直しました。
結果については記載したいところですが、ただでさえ規約に触れそうなギリギリラインなので控えておきますね。ただ、得られたデータでは、toStation(電車が今向かっている先)が欠損値になっていたりして謎が深まるばかり…。

続く?!