アップステージのAIOCRソリューション「Document AI」、保険業界の文書自動化実現を評価


2023/10/25
  • アップステージDocument AI、サムスン生命7種の文書認識率95%達成...業界最高レベル

  • 一部の文書の自動化及び最小限の検品が必要な業務及び労働効率化をサポート

  • 事前学習モデルを活用、最小限のデータ学習コストでも最高の精度を保証します。


 

(アップステージ=2023/10/25)AIスタートアップであるアップステージが韓国1位の生命保険会社であるサムスン生命に供給した金融特化型AI光学式文字認識(OCR)ソリューションが業界1位の精度を達成し、文書自動化最高難易度と評価される保険業界でも文書自動化を実現したという評価を受けた。

アップステージ(代表キム・ソンフン)は、4月にサムスン生命に供給した同社の代表的なAI OCRソリューション「ドキュメント(Document) AI」の文書認識率が平均95点以上の高い精度を達成したと明らかにした。

アップステージとサムスン生命は、診療費領収書など保険請求書類7種の文書を対象にOCR認識率を検証し、平均95%に達する精度を抽出し、当初の目標値90%を大幅に上回る快挙を成し遂げた。

OCRは、画像内の文字をテキストデータとして抽出するAI技術である。画像の形態によって難易度が異なり、その中でも保険書類の処理は最高難易度と言われている。診療費領収書の場合、病院ごとに文書様式が千差万別で、手書きなど非定型データが多く含まれており、高度な認識技術が要求される。

このため、通常80点台に収束するサードパーティのOCRモデルは、ほとんどの文書に人の検収が必要である。しかし、サムスン生命とのテストで90点中盤後半を記録したアップステージモデルの場合、実際に人の修正が必要な項目は4%程度に過ぎず、かなりの部分が自動化が可能なレベルであることを実証した。

また、高いスコアにはモデルの汎用性が主効果でした。アップステージDocument AIは、事前学習モデルに基づいて新規データのみを追加的に学習すれば、様々な形態の文書を処理することができる。アップステージは今回のサムスン生命との協業で、薬代領収書の項目のみサムスン生命のデータを活用し、残りの6種の文書は基本モデルのみで駆動し、平均95%以上の認識率を記録した。

また、傾いた角度やしわ、陰影などがある画像も正確に認識し、注目を集めた。最近では、スマートフォンで撮影した文書処理の需要が増えており、様々な実生活環境で撮影した高画質画像内のテキストも正確に抽出するアップステージの技術力がより際立ったという評価だ。

今回のサムスン生命との協業で、アップステージは難易度の高い保険領域で自動化の成功事例を作った。今後、銀行など汎金融圏はもちろん、貿易、流通、教育など様々な産業分野でも簡単にAI OCRを導入して業務自動化を実現できることを証明する成果だ。

サムスン生命は、アップステージDocument AIの導入でデータ入力から審査、保険金支払いに至る全プロセスを自動化することで、保険金請求件数が急増する状況でも迅速な支払いが可能な環境を構築し、常に均質なサービスを提供できるようになったと明らかにした。

アップステージのAI OCR技術力は、すでに自他共に認める業界最高と言われている。アップステージは、NeurlPS、AAAI、ACL、EMNLPなど国際AI学会で多数の論文を発表し、最近「国際文書分析及び認識学術大会(ICDAR)」が主催する世界最高権威のAI OCRコンテストで4冠を独占した。

今後、アップステージはサムスン生命との協力を強化し、保険請求文書の拡張などOCR適用領域をさらに広げていく予定だ。すでにサムスン生命、ハンファ生命などの金融圏はもちろん、ポスコホールディングス、Samsung SDS、HD現代グローバルサービスなど様々な産業群でアップステージDocument AIを導入している。

サムスン生命の関係者は「今回のアップステージとの協業を通じて、保険本来の核心価値である保険金支払いサービスを強化した」とし、「今後も様々なデジタル技術を活用して顧客体験を革新するための努力を続けていく」と述べた。

アップステージのキム・ソンフン代表は「世界レベルのアップステージのAI OCR技術を韓国1位の生命保険会社であるサムスン生命との協業で認められることを嬉しく思う」とし、「今後、アップステージは金融だけでなく、様々なドメインに特化したAIソリューションで企業のデジタル転換を支援する」と述べた。

一方、アップステージDocument AIは、様々な画像形式の文書から文字や情報を抽出してデジタル化するトータルAIソリューションだ。手作業処理方式に比べて82%までコストと時間を削減してくれ、事前学習モデルで他社に比べて4分の1レベルのデータだけで性能確保が可能だ。APIの形でクラウドで簡単に使用できる「Personal」と、企業の要件に応じてドメインカスタマイズされたインターフェースを提供する「Enterprise」の2つの方式をサポートする。

 
 
 

写真説明:アップステージ(代表キム・ソンフン)は、4月にサムスン生命に供給した同社の代表的なAI OCRソリューション「ドキュメント(Document) AI」の文書認識率が平均95点以上の高い精度を達成したと明らかにした。

 
 
  • アップステージ | キム・グンギョク ブランドコミュニケーション総括理事 | keunkyo@upstage.ai
    アップステージ | バ・ソンボム ブランドコミュニケーションマネージャー | sungbae@upstage.ai

    プレスリリースのダウンロード

  • アップステージは2020年10月に設立された韓国を代表するAIスタートアップだ。UpstageはHuggingfaceリーダーボードでオープンLLM史上初めてチャットGPTのベンチマークスコアを上回る性能で1位を獲得し、巨大言語モデル(LLM)業界で頭角を現している。このような技術力を基に、データセキュリティを最大化し、ハラスメントを解決した信頼できるプライベートLLMの標準を提示し、最先端の技術を企業が便利に使用できるように支援する。 また、アップステージのChat AI「AskUp」は140万人以上のユーザーを保有し、国内最大のAIサービスとして位置づけられている。もう一つのアップステージの代表ソリューションであるDocument AI Packは、世界最高権威のOCR大会を席巻したAI OCR技術を活用し、効率性と精度を高めて文書自動化を実現する。最小限のデータで事前学習されたモデルを通じて文書処理を最適化することで、手作業方式に比べてコストと時間を劇的に最小化する。最後に、教育プログラム「エデュステージ」を通じてAIビジネス経験を溶け込ませた実習中心の教育と確かなAI基礎教育を通じて、AIビジネスに即座に投入できる差別化された専門人材を育成する教育コンテンツ事業にも積極的に取り組んでいる。

    アップステージはGoogle、Apple、Amazon、NVIDIA、Meta、Naverなどのグローバルビッグテック出身のメンバーを中心に、NeurPSをはじめ、ICLR、CVPR、ECCV、WWW、CHI、WSDM、DMLRなど世界的権威のあるAI学会に多数の優秀論文を発表し、オンラインAI競進大会Kaggle(Kaggle)で国内企業で唯一二桁の金メダルを獲得するなど、独歩的なAI技術リーダーシップを確立している。アップステージのキム・ソンフン代表は、香港科学技術大学教授として在職しながら、ソフトウェア工学と機械学習を融合したバグ予測、ソースコード自動生成などの研究で最高の論文賞であるACM Sigsoft Distinguished Paper Awardを4回受賞し、International Conference on Software Maintenanceで10年間最も影響力のある論文賞を受賞した世界的なAIの教祖と言われ、合計700万ビュー以上を記録した「みんなのためのディープラーニング」講師としても広く知られている。また、アップステージの共同創業者には、Naver Visual AI / OCRをリードし、世界的な成果を出したイ・ヒョルソクCTOと世界最高の翻訳機パパゴのモデルチームをリードしたパク・ウンジョンCSOが参加している。

 
先の
先の

アップステージ、NH農協生命と金融AI革新業務協約を締結

次に
次に

アップステージ、世界最高権威の学会「EMNLP 2023」で論文2編採択