国会議案データベースの見方・使い方

2022.07.15
img

7月1日、スマートニュース メディア研究所は「国会議案データベース」をリリースしました。

スマートニュース、国会議案データベースを無償提供 議案の提出者や政党ごとの賛否などを一覧可能に 衆参で過去20年以上のデータを集約

国会議案データベース(GitHub)
衆議院 https://github.com/smartnews-smri/house-of-representatives
参議院 https://github.com/smartnews-smri/house-of-councillors

国会議案データベース・閲覧用ページ
衆議院 https://smartnews-smri.github.io/house-of-representatives/
参議院 https://smartnews-smri.github.io/house-of-councillors/

衆議院・参議院のウェブサイトで公開されている法律案、予算案といった国会の議案をデータベース化し、機械可読な(=プログラムを使って読み込みが容易な)形式で公開するものです。また、あわせて閲覧や検索用のページを用意しています。
本稿ではデータベース公開の背景やデータの見方などを解説します。

荻原和樹
スマートニュース メディア研究所 シニアアソシエイト
1987年神奈川県生まれ。東洋経済新報社を経て2021年2月より現職。専門はデータ可視化、データ報道。共著に『プロ直伝 伝わるデータ・ビジュアル術』(技術評論社)。

データベース公開の背景

衆議院や参議院のウェブサイトでは、国会審議にまつわる様々な情報が公開されています。その中でも特に私たちの生活に影響を及ぼすのが議案です。法律案、予算案から条約の締結、内閣不信任決議案に至るまで、国会における重要事項の多くが議案としてデータにに残り、審議の過程を閲覧することができます。

一方で、公式ウェブサイトでは審議された議案を国会の回次(第208回国会など)別に掲載しており、個別の議案を探すためにはまずその議案が審議された国会回次を突き止める必要があります。加えて、議案の審議状況や賛成会派といった様々な情報を集計することができません。

なお法案については国立国会図書館の「日本法令索引」から検索が可能ですが、法案以外の議案(議決案など)は検索ができず、また各項目別にデータを集計することはできません。検索や集計の難しさのためか、日々の報道でも議案の進捗が継続的に注目されることは多くありません。

そこで、参議院議員選挙の直前であったこともあり、スマートニュース メディア研究所では国会議案をデータベース化して公開することにしました。国会の回次や個別のページに分かれている議案をすべてクローリング(プログラムで自動的にデータを取得すること。スクレイピングとも呼びます)し、CSV / JSONファイル形式でGitHub(データやソースコードを共有できるウェブサービス)で公開しました。なおデータの取得にあたっては、取得元のウェブサイトに大きな負荷を与えないように、一定の間隔を空けながらクローリングを行なっています。

広く世界中の方々にデータを利用していただき、新しい発見や分析をしていただくことが目標であるため、二次利用について費用や許可などは不要です。商用・非商用を問わず、出典を明記いただければ誰でも使うことができます。

データの見方・使い方

実際に、どのようなデータが掲載されているか見てみましょう。衆議院と参議院では同じ議案が審議されることも多く、データの大半が重複していますが、ここでは個別の議案に関して詳細な項目が網羅されている衆議院のデータを見てみます。衆議院の議案データ閲覧ページはこちらです。

まずは「集計情報」を見てみます。こちらでは、いくつかの項目を大まかに集計したグラフを掲載しています。

審議状況は「成立」「未了」といった議案ごとの進捗状況を確認できます。これを見ると、全体(重複を除くと約6,500件)のおよそ1/2が成立、1/3が未了(=廃案)となっています。本稿では詳しいデータの分析は行いませんが、提出会派や議案の種類によって成立するかどうかに大きな違いが現れるかもしれません。

次に委員会のグラフです。データファイルで「衆議院付託年月日/衆議院付託委員会」の列から委員会名を抜き出して集計しています。なお件数が最も多い決算行政監視委員会は、歳入歳出など決算に関する議案を審査する委員会です。

続いて議案提出者を見ます。その名の通り議案を提出した議員や委員長の名前が掲載されています。掲載の多い順に表示すると「内閣」が圧倒的となっていますが、これは法律案の中にも内閣が立法するもの(内閣立法)と国会議員が立法するもの(議員立法)があることに加え、予算や条約といった法案以外の議案は内閣から提出されるためです。

最後に政党別の賛否を見ます。これは各議案に対する政党(会派)別の賛成と反対を集計したものです。ただしデータ上では、無所属議員と政党所属の議員が統一会派を結成することがあるため、そのようなケースでは政党のみ抜き出すようにしています。たとえば「自由民主党・無所属の会」という会派があれば「自由民主党」に集約しています。

参議院の議員、会派、質問主意書

参議院については、参院選が7月10日と直近に迫っていたこともあり、議員・会派(政党)・質問主意書についてもデータベース化を行いました。

特に質問主意書は1947年の第1回国会から網羅されており、総数も6800を超えます。ちなみに第1回国会の提出番号1番の質問主意書は市来乙彦議員による「食生活安定に関する質問主意書」です。その他にも学制改革、鉄道(国鉄)の赤字防止など、戦後社会の状況を伺わせるテーマの質問が並んでいます。

こちらは参議院にて提出された質問主意書の数をグラフにしたものです。推移を見ると、1950〜60年代にかけて極めて低調だった質問主意書の件数は2006年あたりから急増し、最多となる2015年においては403件に上っています(次に多いのは2011年の399件)。このあたりも、増加に寄与した提出者やキーワードを詳細に分析したら興味深い結果が現れるかもしれません。

 

データの更新について

GitHub Actionsを使い、1日に1回データを更新するようにしています。GitHub ActionsとはGitHub上で定期的にプログラムを実行できるシステムであり、たとえば本プロジェクトのように一定の間隔でデータを更新するオープンデータ・プロジェクトに利用することができます。ただし、データ更新は実験的に行なっているものであり、スマートニュースとして更新頻度などの保証はしないこと、予告なく更新仕様の変更や更新停止がありえることにご注意ください。Commit logを読む際に「data-updater」と表記があれば、それが自動更新です。

また、下記「年5月20日」のような誤記と思われるデータがある場合、手動で修正することがあります。

以上、国会議案データベースの制作背景やデータの使い方などを解説しました。筆者(荻原)としては、こうした基礎的なデータを収集・整理し、全国の報道機関や研究者などに公開することによって、政治における投票や政党支持・不支持といった意思決定が今よりも行いやすくなればと考えています。ぜひご活用いただければ幸いです。