ソフトウェアを作る仕事は、とても人間臭い
という話を、2回目の記事で書きました。
今回はこの「人間臭い」という点について、具体的にお話してみたいと思います。
あらためて、ソフトウェアって何だっけ?
という点をお話していこうと思うのですが、その前に、ソフトウェアがうまく活用されていることって「四則演算」じゃないでしようか?
「単純だけど量が多い」と人手でやるのはとても大変さ作業になります。
買い物をしたときにもらうレシート。これを元に
家計簿つける
作業を人手でやるとなると、存外やることがあります。
まず、
目を見開いてレシートの構造を把握
して、明細行と合計行を見つけないといけません。レシートってよくみるとその構造は結構違っているものです。
その作業の難関は、レシートの文字がが小さい!ので、わたしのような50を超えたたおっさんには見るだけでとてもつらい。
そして最大の難関は、文字のかすれなどで明細行や合計金額の一部が欠けている、などの情報の欠落です。
これらの難関を乗り越えて、必要な情報だけを取捨選択して紙の家計簿に転記すれば家計簿の初版の出来上がりです。
※この最後の難関を突破できるのは、人間だけです!
家計簿(初版)
5/17
とんかつ 1,200円
合計 1,200円
5/18
人参 300円
じゃがいも 250円
シチューの素 200円
合計 750円
5/19
ボールペン 100円
花束 3,000円
合計 3,100円
それぞれのレシートを家計簿に転記するだけなら四則演算は必要ないですが、家計簿ですから
一か月分をまとめて見たいな
と思いますよね。
ここで四則演算の登場です。
まずは、一か月分の明細の合計金額を算出して見ましょう。
家計簿には一か月分、50レシート分が記録されています。
ここで、上記のような、レシートの形式のままの記録だと、一か月分の合計を出すだけでも、実はちょいと大変です。
これまた目を見開いて家計簿の構造を把握して、
「合計」と書いてある行だけを見つけて、合計の金額にだけ赤鉛筆で丸印をつけます。
簡単そうに見えますが、50レシートもあれば、複数ページにまたがっているでしょうから、結構これだけでも面倒です。
まあとはいえ、50箇所に丸印をつけたら、あとは、ソロバンはじいて一か月の合計金額を計算(足し算)します。
一か月の支出の合計金額を見てみたら、あれ?本当は、もう少し残るはずだったのに、なぜだっけ?なんてことありますよね。
わたしは毎月不思議でなりません。財布に入っていたはずのお金がどんどん消えていくので、毎月同じ結末のミステリードラマを観ているようなものです。
ということで、使い道を細かく把握する必要に駆られます。
「食費」とか「交際費」のように「分類」して、その分類毎にまとめて翌月の出費を抑えるポイントを把握
したいなんて思いますよね。
こうなると、まずは明細ごとに「分類」を追記することになります。
家計簿(第二版、分類付記版)
5/17
とんかつ 1,200円 外食
合計 1,200円
5/18
人参 300円 食費
じゃがいも 250円 食費
シチューの素 200円 食費
合計 750円
5/19
ボールペン 100円 雑費
花束 3,000円 交際費
合計 3,100円
さらっと、「分類」を追記してみましたが、実はこの「分類」が大きな問題です。
最近はこの「分類」をAIがやります、なんてこと言う人がいそうですが、それは「嘘ではないけれど本当でもない」です。
何をどう分類したいか、どのように自分の支出をとらえ、支出を抑えたいか、という
分類の「目的」とか「目標」を設定するのは「人間」
にしかできない作業です。
もっと言えば、その人「個人」にしかできない作業です。企業に置き換えれば、その「企業」にしかできない作業です。
で、この「分類」方法を決めることができて初めて、家計簿に「分類」を追記していくことができます。
家計簿をつけて一か月後に分類を付記しても、その時点ですべての「分類」はでてきてないと思います。なぜなら支出のパターンが出尽くしていないからです。
例えば、このひと月の間に結婚式がなかったら、慶弔費、なんて分類、思いつかないかもしれません。そうなると、何年後かに初めて気づく「分類」なんてのもあるかもしれません。
閑話休題、
「うちにはビッグデータがあるから、それを活用しよう」
と言われたら、まず何をしますか?
まずは、その大量のデータが
本当の意味でのビッグデータなのか、その中身を眺めてみる
ことです。
持っているデータが
家計簿(初版)なのか
家計簿(第二版、分類付記版)なのか
によって「活用」できる幅が全く異なります。
家計簿(初版)では、全体の支出の傾向や月別の支出の傾向などを把握することができそうですが、これ以上の把握は「このままの状態では難しそう」ですね。これでは「大量なデータ」ではあるけれども「ビッグデータ」と言うには足らないように思います。
家計簿(第二版、分類付記版)では、初版に加えて、分類別月別の支出傾向など、複数の条件を掛け合わせた傾向を把握することができそうです。これなら家計簿(初版)と比べると「ビッグデータ」に近いデータであると言えそうです。
まずは、
持っているデータを眺めてみる
ことが必要です。
話を元に戻して、「分類」別の集計をしようと思いますが、この続きは、「ピーくん」に倣って、「次回」のブログに回したいと思います。
※「ピーくん」は「医療BI奮戦記」を執筆しているひとのことです