「官報検索!」のサービス不具合の経緯→官報PDFの画像化が原因

2014年3月10日から、官報無料検索サービスkanpoo.jpの検索に不具合が発生しています。
官報検索サービスご利用の皆様にはご迷惑をおかけして申し訳ありません。

結論を先に言うと、情報元であるPDFが画像化されて文字情報がなくなってしまった事が原因です。

現在、政府に改善要請を行い、返答を待っている状況です。(2014年3月27日時点)

官報のPDFが画像化された

2014年3月10日から、官報のPDFの本文から文字情報が削除されて画像化されました。

官報検索!では、PDFの本文内の文字情報をインデックス化して検索サービスを提供してたので、検索サービスを提供ができなくなってしまいました。
(本紙・号外の目次、政府調達情報のみ文字情報があるので、その部分の検索のみ。)

これをきっかけに、利用者から不具合に関するお問い合わせが殺到したので、経緯説明のページを作成〜公開しました。

政府情報のオープンデータを推進している経済産業省に連絡をしたところ、「内閣官房 情報通信技術(IT)総合戦略室」に意見投稿してみては?との事だったので、要請をしてみる事にしました。

ここに意見投稿されると関係する各官庁で情報がシェアされて、必要に応じて対応をしてくれるらしいす。正式な返答は約1ヶ月にページ上で公開される。との事。


最近の官報の動向

  • 公開範囲が拡大
    • 1ヶ月公開限定から、過去分も公開されるようになった。
    • 平成15〜の官報が公開された。
  • PDF本文を画像
    • PDFの本文から文字情報を削除。PDFを画像化。

3年前の「インターネット官報の無料公開」についての協議が反映された?

平成23年3月(2011.3)に公開された
【情報通信技術利活用のための規制・制度改革に関する専門調査会 報告書】

【24項:インターネット官報の無料公開】P99〜P100 で、現状の官報に対して、

  • 官報検索の無料化
  • 個人情報(?)の保護

が話し合われた模様。この、「個人情報保護」が今回の画像化対策である可能性は高い。


↓下記、協議内容の抜粋

内閣府

  • 電子版の官報については、掲載されている破産者等の個人情報が、一部サイトにおいて容易に検索できることに対し、破産者や弁護士会から改善を求める意見があり、公開期間拡大に当たっては、更に多くの情報の二次・三次利用の可能性が高まることから、個人情報の取扱いを含め情報提供の方法について整理する必要がある。(平成 21 年以降、インターネット上のルールに従い、グーグル等の汎用検索エンジンに対して、掲載されている個人情報が、検索対象外となるよう設定しているところである。)
  • また、公開期間拡大に向けては、データの再整備、公開用配信機器の新規調達等の作業が想定される。
  • これらのことから、上記の整理を行い、公開期間の拡大範囲を明確にした上で、公開期間拡大に向け具体的スケジュールを立案することとしたい。

(当該項目に対する基本的考え方)

  • 官報は、「国の広報紙」「国の公告紙」であり、国民に広く知ってもらうという趣旨からすれば、官報に記載されている情報は、国民が容易に閲覧できる状態にあることが望ましい。
  • 官報の電子版については、内閣府から官報の編集、印刷及び普及事務を委託されている国立印刷局が独自事業として、『インターネット版「官報」』と『官報情報検索サービス』の 2 種類のサービスを提供している。
  • 『インターネット版「官報」』については、国立印刷局が、30 日間分の官報掲載内容をインターネットによりPDFファイル形式で無料配信しており、無料公開期間の拡大を検討する必要がある。
  • 『官報情報検索サービス』については、国立印刷局が、昭和 22 年 5 月 3 日から当日発行分までの官報について、日付単位、キーワードでの記事単位検索が可能なサービスを有料で実施しており、同サービスの無料化について検討する必要がある。
  • なお、上記の検討に当たっては、個人情報の取扱いを含めた情報提供の方法のほか、財源負担等の問題についても検討する必要がある。

(対処方法)

  • 内閣府は、『インターネット版「官報」』について、現在の公開期間である 30 日間を拡大する方向で印刷局と協議し、検討する。<平成 23 年度中に検討、結論>
  • 内閣府は、『官報情報検索サービス』の無料化について、印刷局と協議し、検討する。<平成 23 年度中に検討、結論>