タイトルって難しい。

学力も体力もない人間の雑記帳。

第50回R勉強会@東京(Tokyo.R)にてLTとしてお話してきました #TokyoR

平成27年(2015年)9月6日に開催された、第50回R勉強会@東京のLT枠でお話してきました。

発表内容

Japan.Rの宣伝(9割)、最近注目しているおもしろデータの話(1割)という感じです。
Japan.Rの話をメインにしていたために、残りのデータの話は結構スーッと流すような感じの構成にしていました(タイトルはその1割がメインっぽく見えるんですけどね)。

Japan.Rについて

12/5に開催します。副主催らしいです。
内容は、単純に手伝ってくれる人を募集していますよっていうことと、公の場でどこでやりますという会場のことと、あとは日付の覚え方の3点でした。
特に日付、これ大事。

一応こちらでも書きますが、覚え方は...

1 一人でも
2 二人でも
5 Go!
です(12/5)。

データの話について

ここ最近、東京メトロオープンデータを扱おうかなとか考えていた矢先に、そういえばもっと細かい情報が得られるJR東日本アプリあるじゃんって思ったのがきっかけでした。
でも、当然ながら(?)、情報は非公開なものなんですよね。有料でも全然構わないので公開して欲しいです。

やったこととしては地道に記録して、可視化って感じです。批判も来るだろうと想定していましたが、そもそも混雑度のデータが大して多くもないし、ホントはとりたかったけども時間的な制約で車内の温度も取れませんでしたし…汗。
車内温度とかを組み込んでモデルとか落としこんだら、もう少しおもしろいことができたかもですね。あ、その前に1日分くらいは記録させたかったですが。

おまけ

「非リアの僕がリア充に勝つ話」というタイトルは印象に残って欲しいのでつけました。あんまり深い意味はないですね。

他の方の発表

久々に導入セッションからいました。
あとStanの話やMIC・TICの話(今回、初めて聞いたのですが、すごく面白かったです)、Shinyよりも更にすごいshadowy、RStudio講座など、今回も盛りだくさんの内容でした。

懇親会

いつもどおり、会場と某中華料理店でした。
あんまりここでは書けない話が多かったです。

その他

0時までに家に帰りました。

分析で好みの娘をぶっこ抜いてから半年以上経ったので確かめてみる

どうもみなさんこんにちは。最近、自分自身の無能さ故に打ちひしがれている僕です。今日は終戦記念日ですね。
あと、今年もコミケには行かないっぽいです。このままコミケ行くことなく人生を終えそうな気がしています(今まで行ったことがない)。
それはそうと、ふと色々思い返してみると、とあるネタをかましたのに肝心の結果について、触れていなかったので、やってみます。

概要

今年(平成27年 2015年)の1月17日に行われた第45回R勉強会@Tokyo(Tokyo.R)で発表した内容についてです。
記事は以下にあります。

個人的には、卒論書き終わった勢いでやったのですごく懐かしいです。
あと、偉大なる先輩から入試の勉強しろと怒られたのも懐かしいです。

確かめたいこと・やること

発表から半年以上経ったので、実際に推薦されたキャラが僕にとって推しなのかどうなのかをひたすら書きます。ただそれだけです。
なにも分析とかしません。

推薦されたキャラ

島村卯月
渋谷凛
本田未央
三村かな子
新田美波
諸星きらり

正直なところ現在の心境

島村卯月
かわいい、愛でたい(推し)
渋谷凛
発表時も一番推してたキャラ。正妻。やっぱええぞぉ〜^(推し)
本田未央
正直に言いますと、6話と7話のあれで心底嫌いになりました(推せない)
三村かな子
ちょwwwwお菓子自重wwww(推せない)
新田美波
エロい・・・(推せない)
諸星きらり
身長高い人は・・・(推せない)

そもそもなぜこうなったのか

身長が高い(180cm超え)女性キャラは問答無用でスルーしている僕になぜこんな推薦がされたのか。ありえんわーとか解せぬとか色々思っていたら教師データにおいてこんな致命的なミスが判明しました。

名前 身長 年齢 B W H
南ことり 259 16 80 58 80

こりゃあだめですね。259cmの人とか進撃の巨人です。
正しい身長は159cmです。
ちなみに、上から80-58-80は覚えていて当然のような数字です。
覚え方は、ことりちゃんの顔文字(・8・)に8がありますので、まずBとHはその10倍の80です。
次に間に挟まれたWはことりの「こ」から「5」と連想し、次に8をつけて58です。
言うまでもなく、無理矢理です。

修正してやってみる

name result
1 島村卯月 OK
2 渋谷凛 OK
3 本田未央 OK
4 赤城みりあ OK
5 アナスタシア NG
6 緒方智絵里 NG
7 神崎蘭子 NG
8 城ヶ崎莉嘉 NG
9 多田李衣菜 NG
10 新田美波 OK
11 双葉杏 NG
12 前川みく NG
13 三村かな子 OK
14 諸星きらり OK

・・・泣いていいっすか。

おまけ

とある大学の授業*1で使われていたそうです。
ありがとうございます。

最近はようやく新生活に慣れてきたので、アニメキャラやスクフェスのデータを用いた分析について再開したいと思います。
よろしくお願いします。

*1:初等多変量解析という授業らしい

iPhone5sがこわれたお話

最近、物が壊れることが多いです。ついてないです。

事件は現場で起きた

いつも通り、研究室の自分の机にあるLightningケーブルに繋いで充電していた時のこと。
普段はマナーモードにしているため、充電開始時にはバイブがなるのですが、そのバイブが連打という状態。
最初はケーブルが破損しただけだろうと考えていました(7月28日午後10時)。

家に帰って、家のケーブルで確かめてみたところ、同様の現象。しかも、ほとんど認識すらされません。嫌な予感がしました。
念のため、他のケーブルに変えたりしましたが、調子は変わらず。また、iPadに繋いで確かめてみましたが、正常。これはまずいなと思い始めました(7月28日午後10時半)。

コネクタの掃除

コネクタは傷つけない程度にならば清掃が可能です。まず、エアーダスターで埃をぶっ飛ばしました。

ELECOM エアダスター ECO 逆さ使用OK ノンフロンタイプ 3本セット AD-ECOMT

ELECOM エアダスター ECO 逆さ使用OK ノンフロンタイプ 3本セット AD-ECOMT

多少は埃が取れ、あとは大丈夫だろうと思って繋ぎ直してみましたが・・・ダメ。
ここから半泣きの状態です(7月28日午後11時半)。

Genius Barとバックアップ

AppleCare+に加入しているので、ある程度まではAppleが保証してくれます(過去に経験済み)。
じゃあとりあえず明日Genius Barに持って行こうと予約・・・。
しかし、夏休みからでしょうか。一番キャパがでかい銀座で最短3日後の昼。表参道はわずかに早く、2日後の晩。即予約しました(7月29日午前0時半)。
この際に、一番重要なのは、おそらくこの状態だと修理に出されるか交換されるかだろうということであり、それゆえに必要なのはバックアップでした。
しかし、コネクタが死んでいる状態でどうやって取るのか。非常に困りました(7月2 9日午前0時40分)。

救いの手 Wi-Fi同期

Wi-Fi同期という機能がiTunesiPhoneにはあります。その名の通り、Wi-Fi経由で同期するというものです。以前は使用していたのですが、ケーブルで繋いだ方が高速だったので一旦切っていました。
しかし、コネクタがほぼ死んでる状態下で、なんとしても復活せねばなりません。一瞬(と言っても1分くらい)PCとiPhoneがケーブルで繋がった瞬間を狙って、Wi-Fi同期の設定をオンからの適用。これで勝ちました。
Wi-Fi同期でバックアップを取り、そしてスクフェスとトイズドライブとミニ四駆のアプリは引き継ぎのセットアップを実行。
写真は、一瞬繋がった隙にMacの写真アプリが読み込みをしてくれたのでバックアップは完了。連絡先などはiCloudで保存。もともとバックアップもとってあるので、これで万全な状態となりました(7月29日午前4時)。

Genius Barのキャンセル待ち

Genius Barはキャンセルが出ます。確認した段階で、翌日の昼に1枠ありました。勝ちました(7月29日午前7時)。

流れが変わったな?

何故か充電も同期もできるようになりました(7月29日午後9時)。
翌日確認しても無事でした。意味がわからん。

Genius Bar

Apple Storeに行った結果、交換していただきました。助かりました。

教訓

おしまい。

Steve Jobs (English Edition)

Steve Jobs (English Edition)

おまけ

#iTunes ストレージが死んでしまった&対処

事件は突然に

4月頭くらいに、大学入学時(4年前)に買った17インチのノートPCが起動しなくなりました。
Sandy BridgeCore i7Radeon、OS(Windows8.1)・システム用SSD(C:¥)、データ用SSD(D:¥)が搭載されているというなんとも豪華なマシンであり、動画編集など負荷がかかる作業向けに使用していました。
当初は、ただ単にC:¥が死んだだけだろうと思い、またChocolateyでソフトを一括インストールさせたらいいやと楽観視していたのですが、そう甘くはありませんでした。
D:¥をUSB経由でMacBookに繋いでみたところ、D:¥が読み込めない・・・。嫌な予感がしました。

犯人はヤツ

「D:¥が死んでいて、それに巻き込まれて起動しなくなった・・・?」
まさかの事態が起きたのです。恐る恐るC:¥だけをつないだ状態で起動すると、Windowsのロゴとログインの画面が・・・。私が今まで貯めこんできた音楽データ(約30GB)と、動画編集用のプロジェクトファイルもろもろが消え失せ、悲しみのどん底へ。

思い返してみると、CrystalDiskInfoではC:¥はちゃんと情報が表示されていたのに、D:¥は全然何も表示されませんでした。4年前に限定10個のセールで買ったK☆△g□t○nのSSDだったのですが、今思えば返品交換しておけばよかったなと思います。
ちなみにC:¥はcrucial製のSSDです。

とりあえず音楽は復活させよう

Windowsは素晴らしいOSです。おそらく生きていて一度も使ったことないという人はこの世にはいないでしょう。
こんなフリーソフトがあり、こいつを使うとiPhoneに残留している音楽データを救出することが出来ました。

救われました。見事に全曲復活しました。

消え失せたプレイリストも復活させよう

上記のフリーソフトを使用してもプレイリストは復活しません。
仕方ないので、もう一度作りなおそうと思っていたら、ちょうど最近始まったiCloud ミュージックライブラリを使用したことによりまさかの復活。
プレイリストについては、ミュージックライブラリの連携を解除しても生き残ります。
他のブログで書かれているDRM関連云々の話はここでは関係ありません。

教訓

SSDのメーカーは良く考えよう!バックアップはきちんと取ろう!

Qiita密かにやっています&近況

どうでもいい話ですが、最近技術的なメモはQiitaに記録しています。 といってもそこまで投稿は多くないです。

wonder_zone - Qiita

最近、クラウド音楽サービスにドはまりしていまして、AWAとLINE MUSICは毎日聞いています。
どちらもそこまで曲数が変わらないような印象を持っていますが、AWAの方がわずかながら使いやすいかなーと。

あとは、実はSwiftはじめました。諸般の事情でって感じです。
まだ演算子とか基本的なことしかわからないですが、ちょっと変態的だなあという印象を抱いています。

こんな感じで相変わらず生きています。

プログラミング生放送勉強会 第33回@株式会社DMM.comラボ(恵比寿)にてLTしてきました #pronama

プログラミング生放送勉強会 第33回@株式会社DMM.comラボ(恵比寿)にてLTとして発表してきました。
タイトルは「JKがJKのツイートを分析してほんとにJKかどうかを判断する」というものです。所属が変わって一発目の発表がこんなタイトルになるとはまさか自分でも思ってもいませんでした…(汗)

簡単に内容・背景等について説明していきたいと思います。
スライドでは、いろいろこじつけとかもありましたが、本来は、ツイート時間に着目した生活リズム・生活スタイルの分析を行おうと考えていました。
その第一歩として、まずはツイート時間をヒストグラムっぽく表してみようというのが今回の発表でした。もしかしたら、まだまだ続くかもね。
結果的には、ネタ(?)っぽくなりましたが、人を笑わせるのは個人的には嫌いではないので、結果オーライかと思います。

本勉強会は、統計・分析系ではなく、IT・開発系ですが、自分にとっては、若干違う部門でも新たな知見を得られる機会だとして参加していました。
私にとって一番印象に残ったのは、Azure の Iaas 機能についての解説で、AWSとの比較を交えつつ説明してくださったのがよかったかなと思います。
Azureといえば、機械学習の界隈ですと、AzureMLが出てきたりして、最近は精力的にサービスを出しているものだと思っていた反面、(AWSも全然使わないですが)使わずじまいで終わることが多かったかなと思います。せっかく、DreamSparkのライセンスがあるのにね。

また、みゆっきくんの生放送をささえる技術は、彼のx年間の放送関連の技術の集大成と思える内容でしたし、Unityについては前回同様、開発の面白さが伝わってきました。
最後に、DMMさんのロボット・Palmi(私はずっと、パル美と呼んでますが)のデモがとっても面白くて、その時はツボってしまいましたね。

こんな感じでとっても楽しい勉強会でよかったです。また機会があれば参加したいと思います。

Rで東京メトロオープンデータを触ってみる その1

台風・・・いや温帯低気圧ですね。こんなときといえば電車が遅れますね。
さて、昨年登録だけして結局いじらなかったオープンデータのAPIがありますので現状はどうなのか確認してみました。

本当ならば、Pythonとかでやればいいのですが、手軽さとデータハンドリングの楽さ、あとこのブログは基本的にPythonの記事など需要がなさそうな気がしてならないので、みんなだいすきなRでやりました。

library(jsonlite)
library(dplyr)
traindata <- fromJSON("https://api.tokyometroapp.jp/api/v2/datapoints?rdf:type=odpt:Train&acl:consumerKey=[key]")

traindata <- traindata[4:17]
names(traindata) <- c("date", "valid", "frequency", "railway", "sameAs", "trainNumber", "trainType", "delay", "startingStation", "terminalStation", "fromStation", "toStation", "railDirection", "trainOwner")
delay <- filter(traindata, delay > 0)

流れとしては、json形式のデータを得る→加工する→遅れとる電車だけ抽出 って感じです。
元の得られるデータではちょっと列名がアレだったので、列名については書き直しました。
結果については記載したいところですが、ただでさえ規約に触れそうなギリギリラインなので控えておきますね。ただ、得られたデータでは、toStation(電車が今向かっている先)が欠損値になっていたりして謎が深まるばかり…。

続く?!