オープンガバメント通信(第3回)「代表的な成果としてのオープンデータ」


第三回
「オープンガバメントの代表的な成果としてのオープンデータ」

オバマ政権下で始まったオープンガバメント。その成果として、特に注目を集めたのは、「data.gov」の開設に見られるオープンデータの取り組みの進展である。

「data.gov」(https://www.data.gov/)にアクセスすると、トップページには、「Search over 231,222 datasets」という表示を目にすることが出来る。この数値は最新のものが表示されるため、この記事を読んで実際にアクセスすると、おそらくこの「231,222」よりも大きな数値が表示されることになるだろうが、この数値は同サイトに登録されているデータセットの数である。「over」が前についていることからもうかがえるように、実際にはさらに多くのデータセットが登録されている。

トランプ大統領就任時に、このサイトは閉鎖されるのではないかと日本の識者とされる人の中でも懸念が表されたこともあったが、サイトが閉鎖されるどころか、トランプ大統領就任時は約19万のデータセットであったところ現在は約23万のデータセットの公開となっている。大統領が変わっても着実にその取り組みは継続されているのである。これは、アメリカでは、政府の活動を通して保有されることになった情報やデータは国民のものであるという理解が共有されており、政権が変わってもそれは揺るがないからである。

比較までに、日本政府が開設している同様のサイトである「data.go.jp」(http://www.data.go.jp/data/dataset)にアクセスしてみると、「20,194 件のデータセットが見つかりました」と表示される。この数値も適宜更新されているので、今後も増加していくはずだが、アメリカと比較すると、10分の1程度しかないことが分かる。

アメリカの「data.gov」には、連邦政府が保有するデータセットの他に、州政府や都市が保有するデータセットも登録されている一方で、日本の場合には主に中央省庁の保有するデータセットが登録されているという差もあるために、単純な比較は出来ない。しかし、公開されているデータセットの量には差があるのは確かだ。

「data.gov」や「data.go.jp」に登録・公開されているデータセットについては、基本的に商用も含めて自由に利用可能である。よって、そのデータセットを活用して新たなビジネスを構想したり、既存のビジネスに新たな価値を与えたりすることが行われている。

少し古い情報になるが、2014年にニューヨーク大学の研究所がオープンデータを活用する企業などの事例を集めた「オープンデータ500」(http://www.opendata500.com/us/list/)というサイトを開設した。これを見ると、既存の大企業がデータを活用する事例に交じって、新たに利用可能になったデータに着目して立ち上げられた企業が数多く見受けられる。

対して、日本では、オープンデータの活用と言うと、社会的課題の解決のための利用ということに重きが置かれがちで、日本での活用事例を紹介した「オープンデータ100」に掲載されている事例でも、その種の社会的課題の解決のためにデータが利用された事例が多く見受けられる。

「data.gov」などで公開されているのが、いわゆるオープンデータである。オープンデータの定義については、確定しているとする人々と緩やかに捉えて必ずしも確定的に扱わない人々がおり、時に激しく対立することもある。両方の立場で共通していそうなのは、Open Data Instituteによる定義である「Open data is data that anyone can access, use or share.」(https://theodi.org/what-is-open-data)といったところであろう。誰でもアクセスし、利用し共有することが可能なデータということだが、この他に、オンライン上での提供、オープンライセンスでの公開、機械判読可能なデータ形式での公開といった事項を定義に含む向きもある。特にデータ形式の部分で、立場の違いが先鋭化するところである。

参考までに、昨年、日本政府で決定された「オープンデータ基本指針」(https://cio.go.jp/sites/default/files/uploads/documents/data_shishin.pdf)では、オープンデータは次のように定義されている。

国、地方公共団体及び事業者が保有する官民データのうち、国民誰もがインターネット等を通じて容易に利用(加工、編集、再配布等)できるよう、次のいずれの項目にも該当する形で公開されたデータをオープンデータと定義する。
① 営利目的、非営利目的を問わず二次利用可能なルールが適用されたもの
② 機械判読に適したもの
③ 無償で利用できるもの

機械判読に適したものという観点につき、特に日本の公共機関が公開するデータ形式として最も一般的であるPDFは適切ではないという意見も根強い。実際に、PDFはデータ処理という点で扱いにくいのも事実であるが、それに加えて、オープンデータの推進を強く唱導するバーナーズ=リーが「五つ星スキーム」(http://5stardata.info/ja/)を提唱しており、その一番レベルの低い形式としてPDFが位置付けられてしまっている点も大きく影響している。

ここで、見落とされがちなことであるが、アメリカの「data.gov」において公開されているデータについて、その形式を見ると、一番多いのはHTMLで、次にPDFとなっていることである。日本の「data.go.jp」ではこの順が逆になっていることから、日本ではPDFでの公開が多く、オープンデータの取り組みが実は進んでいないと断じられてしまうこともある。しかし、アメリカでもPDFでの公開が多いのである。

そもそも、本当に必要なデータであれば、PDFで公開されていたとしても、手間をかけて使いやすい形式に変換することはいとわない。実際に、筆者は「オープンデータ100」にも取り上げられている「マイ広報紙」の運営に関与しているが、このサービスでは自治体が公開している広報紙の記事データについてPDFで取得し、あらためて人手を介してデータ形式の変換を行った上で、記事をWeb上に展開している。そして、自治体の広報紙の記事のデータを統一的に管理することで、そのデータを他の事業者に提供するといった事業展開を図っている。先ごろ、その記事データのヤフーへの提供も開始している。

参照:「「Yahoo! MAP」アプリへの配信開始について

日本では、「オープンデータ100」の掲載事例が35しかなく、この他に政府が把握していないオープンデータ活用事例を合わせても、そう多くはないだろうが、アメリカでは盛んにデータの活用が図られている。その中には、上記の「マイ広報紙」の事例のように、政府が提供したデータを再整理して別の主体に提供するというビジネスもある。数多くのデータセットが公開されることにより、データにまつわるエコシステムが形成されているのである。
正確な経済波及効果は不明であるが、オープンデータの取り組みにより、年数千億円程度の効果が一国で見込まれるとされている。

参照:GLOCOM「オープンデータの経済効果」
(http://www.innovation-nippon.jp/?p=308)

オープンガバメントの三原則が透明(Transparency)、参加(Participation)、協働(Collaboration)であり、さらに民主党のオバマ大統領が始めたことも相まって、ともするとオープンガバメントやオープンデータというと政府活動の透明性の向上や市民参加の拡充といった観点に目が集まりがちであるが、それらの取り組みはビジネス分野への波及も想定されたものであったことは改めて確認しておく必要があるのである。

・オープンガバメント通信(第1回)

・オープンガバメント通信(第2回)

・オープンガバメント通信(第3回)


本田正美
本田正美


東京大学法学部卒、東京大学大学院学際情報学府博士課程単位取得退学。島根大学戦略的研究推進センター特任助教を経て、現在、東京工業大学環境・社会理工学院研究員、東京大学大学院情報学環セキュア情報化社会研究寄附講座客員研究員。専門は、社会情報学・行政学。電子政府に関する研究を中心に、情報社会における行政・市民・議会の関係のあり方について研究を行っている。

本田正美の記事一覧