OCRに関する知見・経験を話せます
■ 具体的な経験の内容
通帳の文字認識モデルの開発を行なっていました。
具体的な開発内容としては
- A4サイズの通帳のコピー画像から、通帳の記帳部分を認識するモデルの開発
- 認識して取り出した記帳部分の文字認識を行うモデルの開発
開発はpython、chainer、opencv、numbaを使用。
画像の前処理(記帳部分の認識など)の高速化を行なった他、
chainerで構築したモデルの精度と実行速度のトレードオフを考慮したモデルを構築した。
■ 実績や成果
与信審査の際に通帳写しをお客さんに提出いただいて財務状況を確認していた。
データの方が都合が良いため、ベトナムの作業員に外注し、通帳写しを手打ちでデータ化していた。
将来的な拡大によるデータ化にかかる時間と人件費の増大の懸念、そしてデータが蓄積されていたことから通帳に特化したOCRシステムの開発を行なった。
■ そのときの課題、その課題をどう乗り越えたか
開発時の大きな課題となったものが
【画像内の文字領域(記帳部分)の抽出】
基本的にはエッジ検出を用いて、検出したエッジを文字部分として取り扱ったが
- 印刷の薄い通帳
- ノイズ(画像内の汚れ)を誤検出
- カラー画像の場合は、カラー背景の濃度による誤検出
- 通帳のフォーマットが異なることが要因となるエラー
といった要因が問題となりました。これらに対する解決に基づいた知見を共有ができます。
【認識速度の担保】
通帳写しのデータ化の速度・支出金額の改善も目標にあったため、モデルの高性能化に伴うコスト削減も必要となった。要件に満たす性能を追えば追うほど速度・コスト共々の懸念点を増していた。GPUの強化を行えば当然高速化は見込めるが、それに伴う支出のコストを回避するためになるべくシステムのチューニングを行なった。
具体的には
- 画像の前処理(記帳部分の認識など)でボトルネックとなる場所をnumbaを用いて高速化
- OCRモデルの計算が早くなるようなモデルへの変更
- OCRモデルの規模を圧縮する(精度はある程度落ちるが、要件を満たすような圧縮を行なった)
といった経験から知見を共有できます。
■ お役にたてそうと思うご相談分野
- OCRで文字部分の抽出方法
- OCRモデルの高速化
■その他
地域: 東京都
役割: 機械学習エンジニア
規模: 20人程
プロフィール 詳細を見る
職歴
OLTA株式会社
- データサイエンティスト 2018/8 - 現在
個人事業
- 2018/2 - 現在
株式会社キスモ
- エンジニア 2017/5 - 2018/8
このエキスパートのトピック
-
機械学習エンジニア人材の教育ができます
¥30,000~■ 実績や成果 【個人事業での経験】 個人での機械学習についての ・某AIベンチャーへの面接対策(論文のディープラーニングモデルについての解説) ・エントリーシートの合否判定モデルに対して有効な技術の解説、精度向上のための手法の解説 ・路上カメラの物体認識モデルの技術の解説 【株式会社キスモでの経験】 インターン生向けに以下を指導 ・Pythonにおける機械学習モデルの開発方法の講師 ・機械学習の最低限の理論(基礎理論、ロジスティック回帰、正則化、ランダムフォレスト)の講師 ・Deep Analyticsのコンペティション課題 ■ お役にたてそうと思うご相談分野 機械学習の社内教育に関する相談 - 機械学習を行うにあたっての、統計の基礎知識 - 社内の課題に対した適切な機械学習技術の知見の共有 - さらに精度の高いモデルを作るための細かい手法の共有 まずはお気軽にお問い合わせいただければ幸いです。
-
チャットボットAIのアプリケーション開発について話せます
¥30,000~■ 実績や成果 コールセンターに対して頻繁に連絡のある質問に対して、自動的に受け答えをするチャットボットAIの開発を行なっていました ・音声処理技術を用いた、カスタマーサポート業務を一部代替するためのチャットボットAIの作成 ・AIの自動会話と自動レポートの要件定義・調査・設計・開発 ・AIの意味理解のための自然言語処理エンジンの要件定義・開発設計・調査・開発 ・応対側とAIの連携部分とレポート機能のプロトタイプデモの開発 使用技術:python/html/css/javascript(Vue.js) ■ お役にたてそうと思うご相談分野 ・チャットボットAIのアプリケーション開発の業務委託もしくは経験の共有 まずはお気軽にお問い合わせいただければ幸いです。