スポンサーリンク

選挙公報をテキスト化すると音声読み上げや検索に対応できるのでやってみた件

選挙公報のテキスト化とは?

現在、選挙において公的に参考になるものが「選挙公報」と言われるものです。

これらは元々選挙管理委員会が紙で配布するものでしたが、近年では選管のHPでも掲載される事が増えています。

しかし現状の選挙公報は、選管に「写真製版」の形で納入されています。

写真なので、そこに書かれている文字は、画像としての文字であり、テキストとして処理することが出来ません。

つまり現在、選挙公報の情報は「文字情報」としては、この世に「ほぼ」存在しないのです

ここでは、テキスト化することの重要性、しかし何故それが実行されないのか、ではどうしたらいいのかを説明します。


 

選挙公報がテキストではない事のデメリット

現在WEBで公開されている選挙公報には、テキスト情報がありません。そのため、具体的には記のような問題が発生します。

  1. 視覚障害者に必要な音声読み上げに対応できない
  2. テキストでの検索結果に表示されない
  3. テキストを使った分析や比較が難しい

視覚障害者に必要な音声読み上げに対応できない

通常の行政のWEBサイトに求められるアクセスビリティ=障害のある人でも不公平なく情報を得られなくてはならない、という大きな原則と仕様要求に反しています。

テキストでの検索結果に表示されない

選挙情報を収集する時に、キーワードに対してヒットする確率が極めて低くなります。つまり「◯◯市 選挙公報」と直接的な単語で検索する以外、見つけることが出来ません。

果たしてどの程度の人が「選挙公報」という単語を知っていて、かつそれを検索キーワードとして使うでしょうか?。

まして、その地域の課題を念頭に検索した場合、つまり「◯◯市 待機児童」などと検索した場合、それがヒットする確率はゼロになります。

テキストを使った分析や比較が難しい

更に、第三者が複数の候補の政策を比較・研究する場合も、テキスト情報がなければ手間が増えてしまいます。

これらはまた、全体を通して「官民データ連携推進基本法(官デ法)」という法律とも衝突します。

官デ法は2016年施行の新しい法律で、「行政が持つ情報を、二次利用可能な形で公開すること」を求めたものです。ここで言う「二次利用可能な形」とは、すなわちテキスト情報として公開しなさいということです。

これらの事からも、選挙公報のテキスト化には公的な必然性があると言えます。しかしそれが実現されていないのは、何故でしょう。

なぜ、選挙公報はテキスト化されないのか??

選挙公報をテキスト化する場合に当たっては、いくつかの問題が存在します。それが選挙公報のテキスト化が進まない理由です。

選管はテキスト化をする役目を担えない!

まず、なんと、選挙管理委員会は、テキスト化の業務をすることが出来ません!

公職選挙法169条で「掲載文またはその写しを原文のまま掲載しなければならない」と決められているからです。原文のまま、つまり一切の加工が出来ないのです。

そのため写真製版として持ち込まれた選挙公報のテキスト化や音声化は、NPOや有志の市民が行う他ないのです。

これに対する方策としては、写真製版のデータとセットで、テキストデータを納入させれば良いとも思うのですが、現状、そうした方法は取られていません。

候補者によって体裁がバラバラ

次に待ち構えるのは、選挙公報の書き方や体裁が、候補者によってバラバラな事です。

選挙公報は縦横のサイズさえ合っていれば、その中のデザインには規定がありません。人によって文字サイズも使い方が異なります。

自由に使えるメリットとして、確かに一番言いたい事を大きく書き、優先の落ちる事は文字を小さくする、という見せ方が可能になります。

しかしそれを単純にテキスト化すると、どれも並列になってしまって、重要度の違いが分かりません

大きな文字を使い、特定の政策に絞って訴求する候補。小さい文字を使い、政策の多さや網羅性を訴求する候補。しかしテキスト化してしまうと、どちらの候補の一行も、同じ一行にしかならないのです。

そうなると、複数の候補者を比較しようとした時に不都合が出てきてしまいます。

これに対する効果的な解決策は編み出されていませんが、例えば、最低限の要素を固めて分解する事は可能です。


 

選挙公報の内容を分解すると?

  • 候補者のプロフィール>出身・学歴・職歴、議員歴、社会的役職等
  • 所信表明・自己アピール
  • キャッチコピー
  • 見出し
  • 選挙公約(メインコンテンツ)>政策のジャンル、個別政策
  • 推薦人・政党
  • 事務所・連絡先情報、WENサイト、SNSアカウント等

ざっと、こんな所でしょうか。

キャッチコピーや見出しは、自由に使える選挙公報のデザインの中で、で大きな意味を持っています。ここは、分けて整理した方がいいと考えます。

例えばWEBでは、見出しのレベルとして、レベル1(最大)〜レベル6(最小)が規定されています。それを機械(検索エンジンやWEBブラウザ)が読み取り、重要度の違いを理解します。

同様に、自由なレイアウトの選挙公報ではそこまでの厳密化は困難としても、キャッチコピーや見出しを三段階程度に分けることは可能です。キャッチコピーメイン、キャッチコピーサブ、大見出し等です。
※小見出し程度以下のものは、拾っていくとキリがないので纏めて本文扱いでいいかなと、いろいろな公報を見て思っています。

イラストはどう扱うか?

さらに続く関門です。それは、イラストや図版があった場合。

これらはテキスト化するのが難しく、例えば似顔絵や写真のように、そもそもテキスト化が無理な場合もあります。

ありますが、これも例えばWEBですと、図版が表示できなかった場合に備えて「代替文字(altタグ)」という設定があります。
「◯◯が◯◯している写真」という感じで、説明用のテキストを含められます。

これはまた、視覚障害者に対する音声読み上げサービスでも利用されます。行政のWEBサイトでは、必須として求められている設定です。

ですから原則論としては、どんな図版であっても最低限、何が書かれているかの説明だけは必要かなと思います。

選挙公報のテキスト化の事例

過去に、選挙公報のテキスト化や、音声化にはいくつか事例がありますので、ざっくり紹介しておきます。

行政側での対応事例

前述の通り、選管自身は、選挙公報のテキスト化に「手を染める」ことが出来ません。そのため一部の自治体では、民間と連携や委託をすることで、音声読み上げ等に対応しています。

ネットで検索した所、選挙公報を人間が読み上げたものをCDに記録し、希望者に郵送するサービスが多いようです。

しかしこの方法には、読み上げの録音、CD作成、梱包、郵送というコストの問題があります。

それ以前に、そもそもテキストデータがサイトに掲載されていれば、音声読み上げソフトを使ってユーザー側で再生できます。一度テキスト化をしてしまえば、後のコストはかかりません。

つまり、写真製版された選挙公報からテキストを書き起こす事は、色々な意味で、前段階として必要な工程と言えます。
それを選管が出来ないのであれば、民間側でやるしかありません。


民間側での対応事例

選挙公報のテキスト化に関する過去の事例として、2017年の都議会選と衆院選において、yahooが実施した「聞こえる選挙」というサービスがあります。

これは議員の基本的な情報や政党のマニフェストに加え、選挙公報のテキスト化と音声読み上げを搭載した、視覚障がい者向けのWEBサイトです。

但し、選挙公報に対応したのは都議会選のみ。国政選挙である衆院選では見送られています。これは出馬者が259人対1180人と、4.5倍以上の差があることと、国政では一部の自治体で選挙公報がHPに掲載されていないためと思われます(依頼すれば紙の公報を入手できるとは思いますが)。

更に、国政や、全国最大規模を誇る地方選挙である東京都議会選以外では、対応実績がなく、継続した事業であるとは言いにくい所があります。

※詳細は下記をご参照下さい。

衆院選で「聞こえる選挙」。ヤフーが視覚障がい者向けのサイトを開設

聞こえる選挙|Yahoo! JAPAN 東京都議選特設サイト

聞こえる選挙|Yahoo! JAPAN 第48回衆議院議員総選挙特設サイト

という事で、選挙公報のテキスト化をやります

当サイトでは毎回、期日前投票所マップで対応した選挙について、選管が公開している選挙公報のPDFへリンクを送り、サムネイルとして紙面のイメージ画像を掲載してきた実績があります。

そこで今後について、PDFへのリンクと紙面イメージの掲載に加え、選挙公報のテキストデータもセットで用意をすることにします。

方法としては、候補が多いとその文字情報だけでページが埋まってしまうので、別途にページを作って掲載したいと考えます。

掲載する場所ですが、ひとまずサイト内にページを作るものの、純粋に文字情報が並ぶページになってしまうため、サイトごと場所を分けた方がいいかなと思っています。

ここは検討中なので、決まり次第また。


関連ページ

市川市長選挙の選挙公報のデータをテキスト情報にしました

 

この記事が気に入ったら最新ニュース情報を、
いいねしてチェックしよう!
スポンサーリンク