データのようで、データにならないジレンマ

カード会社の明細、銀行のデータ、だいぶ取り込みができるようになりました。

■ ■ 発売中 ■ ■
決算書のつくり方
kindle版 

なぜ社長は決算書に興味がないのか?
Kindle版

全角、半角、英数混在

CSVで取り込めるデータは増えてきました。
直接、あるいはExcel等で加工して取り込めば、入力の手間は大幅に減らせます。

入力して終わりなら、全角、半角、英数混在、なんでもOKです。
会計ソフトなどで試算表や決算書は作れます。
会計で重要なのは、日付、科目、金額です。
税務を考えなければ、摘要はどうでもいいです。

でも、それで終わり?

会計データを活かすなら

会計データを活かすためには、摘要も重要な要素になります。
摘要がまちまちだと、Excelは別データと捉えます。
例えば冒頭のカード明細は、フィルタをかけるとこうなります。

あまぞんでいくら使ったんだ?

このカード会社の情報では、「あまぞん」はばらばら。
集計するためには、あまぞんのすべてチェックが必要です。
人間は同じと判断できますが、パソコンはそうはいきません。

銀行データを比べてみました

CSVデータを比べてみました。
信用金庫、都市銀行、地方銀行です。

(信用金庫)

 全角、漢字あり、桁揃えのため金額を含め一定数になるまでスペースが埋め込まれている
 そのためセル幅が以上に幅広になってます

(都市銀行、地方銀行)

 半角、カタカナ、英数あり

<共通>
 拗音(「みょう」などにある小さい「ょ」)、促音(「ネット」などにある小さい「ッ」)はなし。
 カード明細にはあり

データとはなにか?

振込手数料、フリコミテスウリョウ、フリコミテスウリヨウ、はすべて別のものになります。

振込手数料はいくらかかったんだ?

あまり調べないと思いますが、集計には手間がかかります。
そうすると摘要欄にあるものはただの入力値、データにはなりません。
データはあくまでも、「集計(計算)」「検索」「並べ替え」を通じて意思決定に使えるものでなければならないからです。

これらをデータとして活用するなら、会計データにするかどうかに関係なく、まず「データ」にしなければなりません。

どうやってデータにするか?

まず、いずれにしても会計ソフトなどに取り込む前に、表記ゆれは揃えたほうがいいです。
会計ソフト内では、打ち直しなどのとてつもない作業になってしまいます。

Excel(CSV)の状態なら加工がしやすいので、この段階で直しましょう。

方法としては、
・関数などを使って直す
・VBAプログラムなどで直す が考えられます。

関数で修正をするならば、次のものを上手に使うと便利だと思います。

<カタカナ、英数>
・半角のものを全角にする → JIS関数
・全角のものを半角にする → ASC関数

<英字>
・小文字を大文字に → UPPER関数
・大文字を小文字に → LOWER関数

<あるものをあるものに>
・置き換え → Ctrl+h
 日本語を英語に、ひらがなをカタカナにというように、置き換えるときに使います

ただ、それでも力技にはなってしまいます。
データとして使いたいと思うのですが、多様な表記を持つ日本語は悩ましいです。
こういうときにデータとしては、英数は力があるなーと思います。
もう少し研究、考えます。

ーーー

【編集後記】

昨日は銀座で会食。その後クラブへ。
さすが銀座。ホステスさんの会話力には脱帽でした。