私訳タイトル : マルチエンジンの学習環境を使用したOCRエラーの低コストな訂正

原文
Low Cost Correction of OCR Errors Using Learning in a Multi-Engine Environment


拙い私訳

人間の仕事を利用することで、OCRエンジンの出力を訂正するための低コスト方式を提案する。その方法は、誤りを推定するニューラルネットワークを利用する。ニューラルネットワークはground-truth dataからあらゆる単語の誤り確率を評価するために学習する。誤り推定は複数のOCRエンジンの出力から計算した特徴を使う。確率的誤り推定の出力は、複数の単語を人間が点検し、どちらかを決定するのに利用している。誤り推定は、人間の訂正プロセスの効率性を改善するために通じている単語エラーROCのもとで、部分最適化をするために訓練される。コストの大幅な削減は、訂正プロセス中に似たような単語と結びつけてクラスタリングしていくことで達成される。また、どのようにして、アクティブラーニング技術が誤り推定の効率性の改善促進に利用されるのかを示す。

キーワード:OCR訂正、多数のエンジン、機械学習クラスタリング、アクティブラーニング