アップステージ、国際AIコンテスト4部門を席巻 アマゾン、NVIDIAなどを抑えて優勝
2023/4/24
アップステージ、AI OCR分野最高権威のICDAR Robust Reading Competitionで4部門1位受賞
アマゾン、NVIDIAなどグローバルビッグテック企業すべて抜き、2位もアップステージ香港受賞で最高ランクを独占
"世界最高の技術で検証されたアップステージのAI OCRで文書自動化に必要なすべての産業革新を支援する"
(アップステージ=2023/4/24) AI OCR世界最高権威大会「ICDARローバーストリーディングコンペティション」でアップステージが4部門を席巻し、グローバルトップAI技術力を披露した。
アップステージ(https://www.upstage.ai/)は21日、国際パターン認識協会である'IAPR'が開始した国際競進大会である'ICDARローバストリーディングコンペティション'HierText-1/2、VQAonBD、IHTRの4種目で全て1位を記録し、名実共にグローバル最高のOCR技術力を再び証明した。
ICDARロバストリーディングコンペティション」は、デジタル画像とビデオ上のテキストを検出/認識する技術であるRobust Reading分野で最も権威のある国際コンテストです。ICDARは'International Conference on Document Analysis and Recognition'の略称で、1991年から毎年開かれる国際学会で、文書分析及び認識分野で活動するグローバル企業及び研究者と専門家が参加する国際学会である。
OCR(Optical Character Recognition)は、大きく画像から▲文字の位置を見つける「検出技術」と▲文字が何であるかを知る「認識技術」に分けられる。アップステージは、文字検出技術と認識技術の両方で、Amazon、NVIDIA、アリババ、Huaweiなどのグローバルビッグテック企業との競争で最も高いスコアを記録した。
20日、アップステージが1位の結果を得たIHTR種目は、インドで使われる代表10種の言語に対する文字認識問題を扱った。アップステージは文字認識技術を活用して大会に参加し、これまで経験のない新規言語であるにもかかわらず、最高性能のモデルを構築し、輝かしい成果を示しました。
特に、単語、行、段落の構造を表す階層的な注釈を提供する最初の実際の画像データセットである「HierText」を使用して、OCRの新しい作業を行う「Hierarchical Text Detection and Recognition」種目では、アップステージチームと香港支社が1位と2位を独占し、圧倒的な技術力の差を見せつけました。
単純なOCR技術だけでは良い評価を得られないVQAonBD種目でも、アップステージは2位と圧倒的なスコア差でグローバルトップの成績を収め、頭角を現しました。VQAonBDは文書画像を与え、画像内のデータの答えを得る課題を遂行する種目で、例えば計算が複雑な税金文書を与えた後、「2019年の税金の合計は何ですか」というような質問に対して正確な答えを抽出するだけでなく、その値を利用、比率、平均、最小最大値などを求める演算作業まで行う問題も提示された。
特に今回入賞したアップステージチームは、国内唯一のキャグル大会で2桁の金メダルに輝くアップステージチャレンジャーズチームとOCRチームが意気投合して構成した。21年と22年連続でキャグル大会で世界1位と2位を記録し、国内最年少グランドマスターに名を連ねたキム・ユンスエンジニアを含め、2人のグランドマスターと1人のマスターを保有しているチャレンジズチームの能力と、現業で実際に様々な企業のOCR課題を遂行しているアップステージの優秀な研究者たちが力を合わせて最高の成果を生み出したという評価だ。
アップステージは、今回の大会で優秀な成績を獲得できた理由として、激しい研究による新しい方法論を使用し、従来とは異なる方式を活用したことを明らかにした。既存の検出技術は、隣接する単語領域が互いに重ならないようにするため、単語領域を大幅に減らして学習に使用した。アップステージチームは、単語領域は少しだけ減らす代わりに、単語領域の間にギャップを置いて学習に活用しながら、単語ボックスを予測する方式でモデルの性能を大幅に改善した。
これにより、アップステージチームは、今回の大会から新設された評価基準の一つである予測されたボックスと正解ボックス間の類似度(tightness)を大幅に向上させることができました。
AI OCR技術はAI技術の中でもデジタル転換の基盤となる技術で、データのデジタル資産化のための高度化に多くの企業がスピードを上げている。アップステージは最高のOCR技術を活用したOCRパックを開発し、今年初めにハンファ生命やSAMSUNG SDS、ポスコグループなど様々な産業の企業のAI革新をリードしている。
アップステージは、今回の大会で技術力を再確認したOCR技術をはじめ、顧客情報と製品・サービスの特徴を考慮した推薦技術など、AI技術を顧客が一度にカスタマイズして活用できるように支援するノーコード・ロックコードソリューションAIパックと、これをコードコピーだけで便利に活用できるAPIシリーズを発売し、顧客企業のAI革新を支援している。アップステージAIパックを利用すれば、データ加工、AIモデリング、指標管理を簡単に活用できるだけでなく、継続的な更新をサポートし、常時最新化されたAI技術を便利に使用することができる。
アップステージのキム・ソンフン代表は「AI OCR分野最高権威の大会「ICDARローバーストリーディングコンペティション」で4部門の1位を独占し、再びアップステージがグローバルトップのAI技術力を認められたことを大変嬉しく思う」とし、「世界最高の技術力が検証されたアップステージのAI OCRで文書自動化が必要な全産業のデジタル転換とAIグローバルイノベーションを支援する」と述べた。
一方、アップステージはAIパックを企業のためのサービスとしてAPIシリーズ、AIパックと共にOCR技術で'目がついたチャットGPT'で国内最高のChat AI AskUpのビジネス版AskUp Bizも運営している。AskUp Bizはビジネス環境に合わせて最適化し、企業の業務効率と満足度を高めることができるサービスで、様々な文書を読んでChat AIで情報を得ることができるAskUp Doc、ホームページ情報をホームページ訪問者に情報を提供できるAskUp Web、業務用ツールであるスラックで活用できるAskUp Slackなど三つで構成されており、公開後、数百社の企業から申請を受けるなど熱い関心を集めている。
-
アップステージ|キム・グンギョクPRディレクター| keunkyo@upstage.ai
アップステージ|バ・ソンボムPRマネージャー| sungbae@upstage.ai -
2020年10月に設立したアップステージは、画像から目的の情報を抽出して利用できるOCR技術をはじめ、顧客情報と製品・サービスの特徴を考慮した推薦技術、意味ベースの検索を可能にする自然言語処理検索技術など、最新のAI技術を様々な業種にカスタマイズして簡単に適用できるノーコード・ロックコードソリューション「Upstage AI Pack」を発売し、顧客企業のAI革新を支援している。Upstage AI Packを利用すれば、データ加工、AIモデリング、指標管理を簡単に活用できるだけでなく、継続的なアップデートをサポートし、常時最新化されたAI技術を便利に使用することができる。また、AIビジネス経験を溶け込ませた実習中心の教育と堅実なAI基礎教育を通じて、AIビジネスに即座に投入できる差別化された専門人材を育成する教育コンテンツ事業にも積極的に取り組んでいる。
アップステージはGoogle、Apple、Amazon、NVIDIA、Meta、Naverなどのグローバルビッグテック出身のメンバーを中心に、NeurPSをはじめ、ICLR、CVPR、ECCV、WWW、CHI、WSDMなど世界的権威のあるAI学会に多数の優秀論文を発表し、オンラインAI競進大会Kaggleで国内企業の中で唯一2桁の金メダルを獲得するなど、独自のAI技術リーダーシップを確立している。アップステージのキム・ソンフン代表は、香港科学技術大学教授として在職しながら、ソフトウェア工学と機械学習を融合したバグ予測、ソースコード自動生成などの研究で最高の論文賞であるACM Sigsoft Distinguished Paper Awardを4回受賞し、International Conference on Software Maintenanceで10年間最も影響力のある論文賞を受賞した世界的なAIの教祖と言われ、合計700万ビュー以上を記録した「みんなのためのディープラーニング」講師としても広く知られている。また、アップステージの共同創業者には、Naver Visual AI / OCRをリードし、世界的な成果を出したイ・ヒョルソクCTOと世界最高の翻訳機パパゴのモデルチームをリードしたパク・ウンジョンCSOが参加している。