利用者:Sigeto

事業所母集団データベース[編集]

事業所母集団データベース(じぎょうしょぼしゅうだんデータベース)は、日本政府が作成・運用する統計ビジネスレジスター英語版である[1] [2]統計法に基づいて整備されており、総務省統計局ではその管理のための部署を置いている[3]経済センサス経済構造実態調査などの調査結果に、行政記録情報および事業所・企業への照会[4] などによる最新情報を加えて、日本国内に存在するすべての事業所と企業の情報を随時更新する。公営の事業所も対象である。運用開始は2002年。2008年以降、政府統計共同利用システムの一部として稼働している。行政機関地方公共団体独立行政法人などは、このシステムを通じてデータの提供を受け、企業・事業所に関する統計の作成や、それらを対象とする調査の抽出枠として利用できる[5]

歴史[編集]

統計局(当時は総務庁所属)では、1990年代までに、全数調査である事業所統計調査(後に事業所・企業統計調査、経済センサスの前身)の結果を用いて事業所対象調査のサンプリングのための名簿を作成してきた。その効率的な維持管理と利用の高度化を図るため、1994年9月から1996年1月まで「事業所情報データベースに関する研究会」を開催。その成果に基づいて1996年11月5日に統計局長・統計センター所長による「事業所・企業情報データベース構築に関する基本方針」を決定した[6](pp276-278)

1999年4月27日の閣議で「国の行政組織等の減量、効率化等に関する基本計画」が決定され、事業所・企業名簿情報データベースによって既往調査歴をふくめ母集団情報を一元的に管理し、各機関がおこなう統計調査の対象の重複を避けることになった[7]。これに前後して、統計局では、商業統計調査法人企業統計調査工業統計調査などと事業所・企業統計調査結果との照合作業をおこなうなど、データベース構築の準備を進めていた[6](p277)

事業所・企業データベースは、2002年6月に運用を開始。事業所・企業統計調査、商業統計調査、工業統計調査、法人企業統計調査、帝国データバンク有価証券報告書などを基本的な情報源とする。これに加え、日本政府が実施するすべての統計調査(事業所・企業を対象とするもの)から、被調査履歴と最小限の属性情報を収録する。データベース内部はいくつかのテーブルにわかれているが、これらの間を共通の事業所コードで連携する構造である。[6](pp278-279)

2005年の「統計調査等業務の業務・システムの見直し方針」[8] およびそれに基づいて2006年に決定された「統計調査等業務の業務・システム最適化計画」[9] により、「各省庁共同利用型システム」を開発し、その一部として事業所・企業データベースを収めることになった[10]。これが政府統計共同利用システムであり、2008年4月1日に稼働開始した。

2007年に全部改正された統計法[11] は、2条で「事業所に関する情報の集合物であって、それらの情報を電子計算機を用いて検索することができるように体系的に構成したもの」を事業所母集団データベースと定義し、27条でその整備を謳った。これにしたがい「事業所母集団データベース」との名称が標準となっているが、「事業所・企業データベース」との表記も残っている[12]。また単に「ビジネスレジスター」と呼ばれていることもある[13](p11)。なお、法務省が提供する統計法の英訳[14] では「Establishment Frame Database」となっている。

改正統計法公布後の2009年3月に閣議決定された「公的統計の整備に関する基本的な計画」[13](pp11,12,42) では、行政情報等を活用して事業所母集団データベースの精度を高めることを掲げた。また統計調査のための母集団情報としての利用だけでなく、それ自体による統計作成を可能とすることも視野に入れている。この計画に基づき、総務庁統計局では2013年までにデータベースの拡張をおこなった。新しい事業所母集団データベースでは、従来と同様に、数年に一度の事業所全数調査(経済センサス)を基本的な情報源としながら、主要な統計調査からの情報と、労働保険法人登記商業登記EDINETなどの行政記録情報と事業所への照会によって迅速な更新をおこなう。また、7月1日現在の事業所・企業名簿である「年次フレーム」を毎年作成し、母集団情報として提供するようになった。[15]

出典[編集]

  1. ^ 事業所母集団データベース (ビジネスレジスター)”. 総務省. 2023年6月4日閲覧。
  2. ^ 櫻本健・濱本真一・西林勝吾『日本の公的統計・統計調査』(第3版)立教大学社会情報教育研究センター、2023年。ISBN 9784866937748 
  3. ^ 総務省組織令(平成12年政令第246号、2024年4月25日最終改正) - e-Gov法令検索 (112条)。
  4. ^ 事業所・企業への照会”. 総務省統計局. 2024年5月28日閲覧。
  5. ^ 事業所母集団データベースの提供”. 総務省統計局. 2023年6月12日閲覧。
  6. ^ a b c 総務省統計局・総務省統計センター『統計実務変遷史:総務庁時代を中心として (昭和59年7月1日~平成15年3月31日)』総務省統計局・統計センター、2003年。ISBN 4822328147NCID BA61449934 
  7. ^ 国の行政組織等の減量、効率化等に関する基本的計画[平成11年4月27日 閣議決定](抄)(統計関連事項)”. 「公的統計の整備に関する基本的な計画」策定までの統計行政改善への取組. 総務省. 2024年5月28日閲覧。
  8. ^ 統計調査等業務の業務・システムの見直し方針(各府省情報化統括責任者 (CIO)連絡会議幹事会決定、各府省統計主管課長等会議了解)” (PDF). 統計調査等業務の業務・システム最適化と政府統計共同利用システム. 総務省統計局 (2005年4月8日). 2024年5月28日閲覧。
  9. ^ 統計調査等業務の業務・システム最適化計画(各府省情報化統括責任者 (CIO) 連絡会議決定)”. 統計調査等業務の業務・システム最適化と政府統計共同利用システム. 総務省統計局 (2006年3月31日). 2024年5月28日閲覧。
  10. ^ 各府省共同利用型システム機能要件” (PDF). 統計調査等業務の業務・システム最適化計画. 総務省統計局. 2024年5月28日閲覧。
  11. ^ 統計法(平成19年法律第53号) - e-Gov法令検索
  12. ^ 政府統計共同利用システムの概要 (参考資料1)”. 総務省統計局 (2008年). 2024年5月28日閲覧。
  13. ^ a b 公的統計の整備に関する基本的な計画(平成21年3月13日閣議決定)” (PDF). 統計制度の企画・立案等. 総務省 (2009年3月13日). 2024年5月29日閲覧。
  14. ^ Statistics Act (2007 Act No. 53)”. Japanese Law Translation Database System. Ministry of Justice (2015年). 2024年5月30日閲覧。
  15. ^ 髙橋雅夫「新しい事業所母集団データベースの開発: ビジネスレジスターの更改」『統計研究彙報』第70巻、総務省統計研修所、2013年、1-18頁、ISSN 13489976id.ndl.go.jp/bib/024821630 

関連項目[編集]

外部リンク[編集]




行政史[編集]

  • 総理府史編纂委員会・内閣官房『総理府史』内閣総理大臣官房、2000年。 NCID BA53940755 
  • 行政管理庁行政管理二十五年史編集委員会『行政管理庁二十五年史』行政管理庁、1973年。 NCID BN01404452  → (市販本) 行政管理庁『行政管理庁二十五年史』第一法規、1973年。 NCID BN06557621 
  • 行政管理庁統計基準局『刊行物目録』行政管理庁統計基準局〈統計基準局史資料 1〉、1967年。 NCID BA69804519 
  • 日本統計研究所『日本統計制度再建史 統計委員会史稿 記述篇』行政管理庁統計基準局、1962年。doi:10.11501/9548229NCID BN12374342 
  • 日本統計研究所『日本統計制度再建史 統計委員会史稿 資料篇(I)』行政管理庁統計基準局、1962年。doi:10.11501/9548230NCID BN12374342 
  • 日本統計研究所『日本統計制度再建史 統計委員会史稿 資料篇(II)』行政管理庁統計基準局、1962年。doi:10.11501/9548231NCID BN12374342 
  • 日本統計研究所『日本統計制度再建史 統計委員会史稿 資料篇(III)』行政管理庁統計基準局、1962年。doi:10.11501/9548232NCID BN12374342 
  • 日本統計研究所『日本統計制度再建史 統計委員会史稿 資料篇(年表・補遺)』行政管理庁統計基準局、1962年。 NCID BN12374342 
  • 統計基準年報
  • 総務省統計局・総務省統計センター『統計実務変遷史 総務庁時代を中心として (昭和59年7月1日~平成15年3月31日)』[総務省統計局・統計センター]、2003年。 NCID BA61449934  p. 31 コンピュータ導入
  • 国土交通省総合政策局情報管理部『国土交通省統計関係法令集』2001年。 NCID BA56728666 

統計基準[編集]

  • 総務庁統計局/総務省統計局『国勢調査調査結果の利用案内: ユーザーズ・ガイド』1996-2015。 NCID BN14969704  →大都市圏、都市圏、周辺市町村

毎月勤労統計調査[編集]

全国調査年報令和元年版に2019年誤差率あり。 目標精度は500人以上の記載なし。→しかし地方調査年報R1-3ではいずれも消えてない

特別調査報告によれば、毎勤特別(基本)調査区を抽出して、全数調査(R3以降は「基本」なし)

国勢調査[編集]

[1] 国勢調査に見る個人情報利用のメリットとリスク https://xtech.nikkei.com/it/article/COLUMN/20061109/253139/

[2] 国勢調査の実施に関する有識者懇談会報告 (2006) 総務省統計局 https://www.stat.go.jp/info/kenkyu/kokusei/pdf/report.pdf

[3] 国勢調査の実施に関する有識者懇談会(第1回)2006-02-24 資料4「平成17年国勢調査の実施上の問題と課題」 https://www.stat.go.jp/info/kenkyu/kokusei/pdf/problems.pdf

「続・酷勢調査 仙台市 調査員の負担は減ったけれど… 郵送提出誘導で回収率低下心配 統計の信頼性懸念 市「催促に努める」」『河北新報』、2010年10月17日、河北新報データベース 面名:M106X0 記事ID:K20101017M106X0020。

「90年前の第1回国勢調査 記入済み調査票見つかる 世帯主「安政」生まれ 市内の旧家 当時伝える」『河北新報』、2010年10月17日、河北新報データベース 面名:EB0XX0 記事ID:K20101017EB0XX0010。

「国勢調査概要 中学で教えて (石沢 忠次 71歳)」『河北新報』、2005年10月5日、河北新報データベース 面名:OP0XX0 記事ID:K20051005OP0XX0020。

「調査票の配布 お手上げ状態」『河北新報』、2005年9月28日、河北新報データベース 面名:OP0XX0 記事ID:K20050928OP0XX0040。

基幹統計調査[編集]

地方統計機構[編集]

菊地進「地方統計機構と統計の利活用」『研究所報』第40号、法政大学日本統計研究所、2010年9月、1-31頁、ISSN 03852148NAID 40018772654 

http://www.hosei.ac.jp/toukei_data/shuppan/shuppanlist1.html#k40

https://www.hosei.ac.jp/toukei_data/shuppan/g_shoho40_kikuchi.pdf 菊地進「地方統計機構と統計の利活用」 → https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-18330042/ 地域経済活性化と統計の役割に関する研究

調査票情報[編集]

調査票情報(ちょうさひょうじょうほう)とは、統計調査において、調査対象者から回収した調査票に記載された情報、およびそれを転記したものをいう。個票データミクロデータ、あるいはマイクロデータ (micro data) ともいう。回答用紙に回答者自身が手書きしたもの、それが別用紙に転記されたもの、電子ファイルに入力されたもの、印刷物、それらを複写したマイクロフィルムなど、媒体はさまざまである。誤りや異常値の修正、自由回答内容の符号化、欠測値の補完、暗号化などの加工を加えたり、一部の情報を削除したりしたものもふくむが、個別の回答者に属する情報を区別できない状態にまで加工したもの(たとえば集計表)はふくまない。集計表などのいわゆるマクロデータとは異なり、個体を区別した分析をおこなえる点に利点がある。反面、個体を同定してしまえる可能性を持つ点で、個人情報漏洩やプライバシー侵害のリスクがあり、とりあつかいに注意を要する。

日本の公的統計制度では、統計法の適用を受ける統計調査(基幹統計調査または一般統計調査)によって収集した情報のうち、将来の活用に向けて電子化し、長期保管しているものに限定して「調査票情報」と呼んでいることがある。

調査票情報と集計表[編集]

統計調査では、対象者から収集した情報について、つぎのようなかたちで処理を加えていくことになる[1]

  • A: 記入済みの調査票そのものやそのコピー
  • B: それを転記した表や機械可読電子ファイル
  • C: そこから識別子情報(住所・氏名・各種番号など、調査対象を特定できる情報)を消去したもの
  • D: Cに匿名化措置を施したもの
  • E: 集計した結果を示す集計表
  • F: Eに匿名化措置を施したもの

AからDまでは、調査対象それぞれについての情報を個別にならべたものになっている。こういうものが調査票情報である。

これに対して、EとFは、たとえば××市居住の●●歳の女性で職業が○○の者がx人、といったところまでしかわからない表である。調査対象者個別の情報でないから、調査票情報ではない。ただしEでは、たとえば●●歳の者が××市に1人しかいない場合、その個体の情報が特定されてしまう。これを避けるために、表のなかで数のすくない部分を非表示にするかたちでの匿名化をおこなったものがFである。外部に公表されるのがこのFであり、これがしばしば「統計」と呼ばれる。

公的統計における調査票情報[編集]

従来の統計行政には、調査票情報を保持して再利用するという発想はなかった。調査票 (A) やそれを転記した電子ファイル (B, C, D) は保管期限がきたら消去してしまう[1]。その後に残すのは集計表EとFだが、対外的に公表されるのはFだけである。Eは行政内部では使用することがある。

しかしこれではいろいろと不都合が生じる。まず、EやFの情報では、新しいやりかたで古いデータを集計しなおすことが不可能である。集計にミスが見つかったのでやり直したいという場合にも、同様のことになる。再集計のためには、すくなくともDの情報を置いておかなければならない。さらに、集計以前の段階でのミスや不正の疑いがあるといった場合には、大元の調査票にさかのぼってチェックしたいところであるから、Aの情報をのこしておくことがのぞましい。

また、情報処理技術が発展して高性能なコンピュータが普及し、研究者や研究機関が独自に統計分析をおこなうことが一般的になってきたため、公的統計データを二次分析したいという要求が高まってくる。集計表では大した分析ができないので、個体を区別して分析できるデータが欲しい。政府の側でも、そうして研究が進めばより効果の高い政策を立案する根拠となるので、それを推進したいという考えが出てくる。さすがにAやBは出せないので、CあるいはDの情報について、一定の条件を満たす研究者や研究機関に一定の条件の下で使用を許す二次データ利用制度が作られるようになってくる。

日本の公的統計制度における調査票情報[編集]

日本では、2007年の統計法改正の際、調査票情報のあつかいについての規定が設けられた。同法第2条の定義によれば、調査票情報とは、「統計調査によって集められた情報のうち、文書、図画又は電磁的記録(電子的方式、磁気的方式その他人の知覚によっては認識することができない方式で作られた記録をいう。)に記録されているもの」である。この条文の定義では、上記のA-Dはすべて該当することになる。ただし、実際の運用においては、調査・集計がひととおり終了した段階において、将来活用するために保管するデータを指して「調査票情報」といっている。このデータは、多くの場合、上記のCに該当する。

匿名化問題[編集]

データ中のある個体について、現実世界に存在する特定の個体と同一であることが判明した場合、その個体は識別された、という。識別された個体については、データ中に記録された値は、その現実の個体に対応するのがあきらかだということであり、その中には、その個体にとっての秘密がふくまれていることがある。したがって、調査における回答者の権利保護のためには、個体が識別される可能性を判定し、識別可能性の高いデータについてはそのとりあつかいを厳重にしなければならない。

  • 識別子の問題

縦断面統計の作成過程。

レジスターベースの統計。

  • 母集団一意レコード

特定の産業の独占企業。 山中四郎?

  • 標本一意レコード

母集団のほとんど全員が結託している場合(星野)[2]


[4] 統計審議会1995-03「統計行政の新中・長期構想: 諮問第242号の答申」 https://id.ndl.go.jp/bib/000002407157 →デジタル化作業中 →原版? https://www.soumu.go.jp/main_content/000391231.pdf

統計調査によって集められた情報(調査票情報と言います。)は、本来その目的である統計作成以外の目的のために利用・提供してはならないものですが(第40条)、統計の研究や教育など公益に資するために使用される場合に限り、二次的に利用することが可能です。二次的な利用方法として、その利用目的等に応じて、調査票情報の提供(第33条、第33条の2)、オーダーメイド集計(第34条)、匿名データの提供(第36条)があります。  詳細については、「公的統計調査の調査票情報等の学術研究等への活用」についてのページを御覧ください。

注釈[編集]

出典[編集]

  1. ^ a b 森 博美「情報資産としての統計と政府統計データアーカイブ」『統計学』第94号、経済統計学会、2008年3月、15-25頁、ISSN 03873900NAID 1520853834284417536識別子"1520853834284417536"は正しくありません。 
  2. ^ 星野 伸明「エビデンスに基づいた匿名化」『日本統計学会誌』第46巻第1号、一般社団法人 日本統計学会、2016年、1-42頁、CRID 1390282679414015104doi:10.11329/jjssj.46.1ISSN 03895602