パースしたデータを集計してみよう
「今回は集計だね。前回はデータを扱いやすい形式に並べたから、それを元に集計していこう」
「はい、どんな感じにやるんですか?」
「集計のやり方は色々とあるけど、僕がよくやってるやり方を教えるね。プログラムでやってもいいけど、Excelの関数が便利だからそれを主に使うね」
「はい」
「じゃぁ、まずは前回のデータに含まれるジャンル別の個数を数えてみよう。ジャンルはこんな感じで分類されているからそれが含まれる数を数えてみよう」
■ジャンル一覧■
101異世界恋愛
102現実世界恋愛
201ハイファンタジー
202ローファンタジー
301純文学
302ヒューマンドラマ
303歴史
304推理
305ホラー
306アクション
307コメディー
401VRゲーム
402宇宙
403空想科学
404パニック
9901童話
9902詩
9903エッセイ
9904リプレイ
9999その他
9801ノンジャンル
「そしてその横にこの関数を打ち込んででドラッグすると集計されるよ。これを見ると、ジャンル別の個数が見れるね」
※検索値には個数を数えたい値、検索範囲に数えたいものがある範囲を指定します。
「おー、すごいです。countifってどんな関数なんです?」
「条件にあったセルの個数をカウントするよ。結構便利だから覚えとくといいね。他にもね似たような関数があるから一緒に紹介するね」
■COUNTIFS 複数の条件に一致した個数をカウントする。
使用例:文字数範囲,投稿日範囲
=COUNTIFS(文字数列,">="&下限文字数,文字数列,"<"&上限文字数)
実例”=COUNTIFS(K:K,">="&BA3,K:K,"<"&BA4)”
■SUMIF 条件に一致した値だけ合計する関数
使用例:ジャンルごとのポイント数
=SUMIF(条件範囲,条件値,合計範囲)
■MAXIFS 条件に一致した最大値を取得する関数(複数条件指定可)
使用例:ジャンル別の最大ポイント数
=MAXIF(最大範囲,条件範囲,条件値)
■MINIFS 条件に一致した最小値を取得する関数(複数条件指定可)
使用例:ジャンル別の最小ポイント数
=MINIFŞ(最小範囲,条件範囲,条件値)
「ということで、これで集計も終わりだね。いろいろな関数があるから使ってみてね」
参考:EXCEL 集計を関数極めよう!様々な集計関数まとめ
https://excelkamiwaza.com/syuukei.html
・SUM関数
・PRODUCT関数
・CountA関数
・SUMIF関数
・COUNTIF関数
・SUMIFS関数
・COUNTIFS関数
「最後はその集計結果をグラフ化したりしてみよう」
「なんだかあっというまですね」
「まぁ、一番面倒なのがデータの集め方とパースだからなね。集計はそこまでハードルは高くないよ
便利な関数がいっぱいあるからね。ここでは説明していないけど平均、中央値、分散などもあるから」
「統計も勉強した方がいいんですね」
「まぁ本格的にやるならば、優位性や検定くらいは知っておいた方がいいかもね。まぁそのあたりはなれてきた等でいいかも」
「ちょっとずつ頑張りたいです」
「うん、そのいきだね」
■ 補足 ■
まぁ色々と説明しましたが、ピボットテーブルを使うともう少し簡単にできたりしますね。
セルを選択して、挿入ーピボットテーブル
OKを推すとこんな画面になります。
ここでジャンル別、お相手にポイントを選ぶと合計、最小、最大なんか簡単にできちゃうね。一瞬だよ。関数すら必要ないね。
ピボットテーブルを使いこなせたら結構便利なので試してみるといいかも。
アクセスにデータを格納して、リレーションを作ってもいいかもね。
クエリたたけばデータがでるようにしても便利だよね。
まぁ勉強すると色々とできることが増えるから是非勉強してみてね!
参考:簡単に複雑な集計ができるピボットテーブルの基本
https://www.forguncy.com/blog/20171110_pivottable
他にも重複削除もよく使うかも
参考:意外に便利!?重複データの簡単な削除方法
http://blog.jmiri.net/?p=1949




