
事業の目的
本事業の目的は、当センターが提供している「政治資金収支報告書検索システム」の使いやすさを向上させることにあります。具体的には、以下のような改善を行うことを目指しています。
(1) 新しいOCRシステムの開発
従来のシステムではチェックボックスの読み取り精度が安定せず、収支報告書の表紙のOCRができていませんでした。そこで、生成AIを用いた新しいOCRシステムを開発し、表紙も含めた全文のテキストデータ化と全文検索ができるようにすることを目指しています。
(2) データベース構造の見直し
OCRシステムの改善に合わせて、データベースの構造も見直します。収支報告書と政治団体・政治家、寄付者と寄付先などのデータを紐付けやすくするとともに、従来は検索方式が分かれていた2022年度以前・以後の収支報告書をまとめて検索できるようにします。
(3) 検索システムUIの改善
検索システムをさらに使いやすくするため、検索方式や条件の絞り込み、検索結果表示画面を改良します。
これまでの活動
現在行っている作業は以下の通りです。
(1) 生成AIを使用したOCRシステムの開発
生成AIを使用したOCRシステムの精度を高めるため、政治資金収支報告書と照らし合わせてプロンプトの改善や読み取り形式の検討などを行っています。
(2) データベース構造案の検討
データベースに必要な項目や情報を列挙し、どのような構造であれば使いやすいかを考えながらデータベース構造案を検討しています。
(3) 検索システムUI案の検討
データベース構造案と照らし合わせながら、検索システムのUIを検討しています。具体的には、検索条件の絞り込み方法や検索結果表示画面の必要項目を検討しています。

