【第4回】とても便利な地方公共団体コード


仕事研究学業で各市区町村別のデータを調査することがあると思います。そして、全国市区町村データを比較しようとする際に、少し混乱するのが市区町村名です。例えば、市区町村別にデータを集計しようとすると、本来別々の都道府県自治体なのですが、市区町村名で集計をしようとすると、重複した自治体名で集計してしまうことがあります。その結果、集計結果が不正確になることがあります。地方公共団体コードの話に入る前に、重複する自治体名は具体的にどのくらいあるのということからお話いたします。

重複する自治体名はこんなにある

下の表は同じ漢字を利用する自治体名リストです。たとえば、池田町という自治体名は北海道、福井県、長野県、岐阜県と4つの道県にあることがわかります。

また、政令市名ですと区名で重複するものがあります。

このように市区町村名を漢字表記をすると重複するものがあります。これらの重複する自治体名が存在するデータを扱う際に、地方公共団体コードを利用すると重複する自治体名を意識することなくデータ処理を行うことができます。

大きな「ケ」と小さな「ヶ」を使う自治体名

また、日本の自治体名に大きな「ケ」と小さな「ヶ」が利用されていものがあります。

【小さいヶ】
023078 青森県 外ヶ浜町 アオモリケン ソトガハママチ
023213 青森県 鰺ヶ沢町 アオモリケン アジガサワマチ 鯵ヶ沢町
024112 青森県 六ヶ所村 アオモリケン ロッカショムラ
043028 宮城県 七ヶ宿町 ミヤギケン シチカシュクマチ
044041 宮城県 七ヶ浜町 ミヤギケン シチガハママチ
112411 埼玉県 鶴ヶ島市 サイタマケン ツルガシマシ
134023 東京都 青ヶ島村 トウキョウト アオガシマムラ
142077 神奈川県 茅ヶ崎市 カナガワケン チガサキシ
202100 長野県 駒ヶ根市 ナガノケン コマガネシ
413275 佐賀県 吉野ヶ里町 サガケン ヨシノガリチョウ
454435 宮崎県 五ヶ瀬町 ミヤザキケン ゴカセチョウ

【大きいケ】
033812 岩手県 金ケ崎町 イワテケン カネガサキチョウ
082082 茨城県 龍ケ崎市 イバラキケン リュウガサキシ
122246 千葉県 鎌ケ谷市 チバケン カマガヤシ
122297 千葉県 袖ケ浦市 チバケン ソデガウラシ
213624 岐阜県 関ケ原町 ギフケン セキガハラチョウ

大きな「ケ」と小さな「ヶ」という些細な違いなのですが、データの中には大きな「ケ」と小さな「ヶ」が逆に入っているものあります。「ケ」と「ヶ」の使い方を間違えると、地名を基準にしてデータ統合をしようとすると、データ結合ができないことがあります。

実際に、総務省が公表しているデータで大きい「ケ」と小さな「ヶ」が入れ違っているものがあります。具体的には総務省選挙管理委員会が公表している平成29年衆院選千葉県比例のデータです。


【出典】http://www.soumu.go.jp/senkyo/senkyo_s/data/shugiin48/shikuchouson_12.html

このような重複する自治体名や「ケ」と「ヶ」といった文字遣いが異なることでデータ運用の際に不都合が生じないように利用できるものが地方公共団体コードです。

地方公共団体コードってなんだ?

地方公共団体コードというのは総務省が公表している都道府県、市区町村、広域事務組合等に割り当てた5桁、6桁の番号です。


【出典】http://www.soumu.go.jp/denshijiti/code.html

この地方公共団体コードを利用すると重複する市区町村名等があっても、別々の市区町村として扱うことができるのでデータ集計等がしやすくなります。団体コードの部分をみるとわかるように、各自治体には別々の6桁の数値が割り当てられています。
 

地方公共団体コードはあまり使われていない

このように都道府県別市区町村のデータ集計等をする際には便利な地方公共団体コードなのですが、実際にはあまり利用されていない感じを受けます。というのも各都道府県が公表する統計データが複数の都道府県をまたがって利用することを意識していないのではないかと思われるからです。今後、各都道府県が公表する統計データは他の都道府県とデータ結合等がなされることを念頭に置いてデータ作成がなされることを望みます。すなわち、市区町村名を記す統計データ等には地方公共団体コードを割り当てた形式でデータ公開するということです。

また、総務省が公表する国政選挙等の市区町村別得票数データを閲覧すると市区町村名のみが掲載されており、地方公共団体コードは割り振られてはいません。中央省庁、地方公共団体が公開する市区町村が記載されているデータには地方公共団体コードが割り振られた上で公開されると多くのデータ統合等、データの利活用がしやすいというメリットを個人、法人等が享受することができます。

まとめ

日本には市区町村名には重複する自治体名が多数あります。これら重複する自治体名は集計、データ結合等をする際に障害になる場合があります。それら障害を避けるために、市区町村名には地方公共団体コードを割り振ると、データ処理がしやすくなります。今後、統計データ等に市区町村名が存在する場合には地方公共団体コードを付加したデータで公開されることを望みます。

次回は地方公共団体コードと神Excel、Excel方眼用紙が組み合わさると、どれほどデータ処理に手間がかかるかについて述べていきたいと思います。


渡邉秀成

調査屋
1999年から公的機関、民間企業のデータベース整備、 各国政治家発言、企業経営者発言、 東日本大震災SNS、各国選挙SNS投稿、株式情報、有価証券報告書等のテキストデータ解析を行う。 国内の有権者投票行動調査は下記から。 https://datastats-election.info/

渡邉秀成の記事一覧